“AI 핵심은 학습데이터… 챗봇 논란도 ‘교재’ 문제”

“AI 핵심은 학습데이터… 챗봇 논란도 ‘교재’ 문제”

박승기 기자
박승기 기자
입력 2021-03-17 20:46
수정 2021-03-18 02:34
  • 기사 읽어주기
    다시듣기
  • 글씨 크기 조절
  • 댓글
    0

박재일 특허청 정보시스템과장

AI 활용 특허·상표 검색 시스템 개발 중
“데이터 보완 거쳐 정확도 78%로 상승
구축된 자료, 민간 활용 가능하게 할 것”
이미지 확대
박재일 특허청 정보시스템과장
박재일 특허청 정보시스템과장
“인공지능(AI) 챗봇 논란의 핵심은 잘못된 학습데이터가 원인입니다. 교재가 잘못됐는데 점수가 제대로 나올 수 없습니다.”

AI 등 신기술을 활용한 스마트 심사 시스템 구축을 총괄하는 박재일 특허청 정보시스템과장은 17일 서울신문과의 인터뷰에서 ‘데이터’의 중요성을 강조했다. 특허청은 디지털 신기술에 대한 권리를 부여하는 동시에 기술을 활용해 업무 효율성 및 행정 서비스 제고를 추진 중이다. 첫 사업이 AI를 활용한 검색으로, 선행기술(특허)·이미지(디자인)를 자동 검색·추천하는 작업이다.

박 과장은 “특허와 상표·디자인 등을 심사하려면 비슷한 기술이 있는지를 확인해야 하는데 검색에 상당한 시간과 노력이 필요하다”며 “기존 규칙 기반 검색 시스템은 유사성이 반영되지 않아 심사관이 처음부터 끝까지 다 확인해야 하지만 AI 검색은 유사성이 높은 순서로 검색돼 시간 단축 및 분류 정확도를 높여 심사 품질을 향상시킬 수 있다”고 밝혔다.

실제 사용이 많은 디자인의 경우 검색건수가 20만건이 넘는다. AI 기술의 관건은 학습데이터 구축이다. 특허청이 2019년 도형상표에 첫 적용한 결과 정확도가 55.9%였으나 학습데이터 추가 보완 등을 거친 지난해 78.1%로 상승했다. 패턴에 따라 유사성을 판단하는 디자인도 지난해 시범 적용한 결과 평면디자인 정확도가 70%에 달했다.

특허는 상표·디자인보다 훨씬 복잡하다. 기술 및 기술 타당성에 대한 검증 등에 엄청난 데이터가 필요해 내년부터 시범 실시할 계획이다. 지난해 시험 실시 결과 기존 검색시스템에 비해 7% 정도 정확도가 높은 것으로 평가돼 시스템 개발에 속도를 내고 있다. 박 과장은 “AI 특허 검색은 세계에서 처음 시도하는 것으로 변수가 많다”면서도 “기술 속도가 빨라지고 난이도도 높아지면서 선행기술 검색이 복잡해지는 등 심사관 업무를 지원할 수 있는 대책이 필요하다”고 강조했다.

선행기술 검색을 비롯해 통지문 작성, 출원서 작성(AI 변리사) 등 확장성이 기대된다. 다만 AI 활용을 위한 기반은 아직 미흡하다. 학습데이터 자동 생성 기능 구축이 우선 과제로 꼽힌다. 현재는 별도 입력 과정이 필요해 시간과 비용이 과다하게 소요된다. 박 과장은 “AI 기술은 개발로 끝나는 게 아니라 추가 학습이 지속적으로 이뤄져야 한다”며 “중장기적으로 구축된 양질의 학습데이터를 민간에서 활용할 수 있도록 서비스할 계획”이라고 밝혔다.

대전 박승기 기자 skpark@seoul.co.kr
2021-03-18 27면
Copyright ⓒ 서울신문 All rights reserved. 무단 전재-재배포, AI 학습 및 활용 금지
close button
많이 본 뉴스
1 / 3
전과자의 배달업계 취업제한 시행령 여러분의 생각은 어떤가요?
강력범죄자의 배달원 취업을 제한하는 내용의 시행령 개정안이 의결된 가운데 강도 전과가 있는 한 배달원이 온라인 커뮤니티에 “속죄하며 살고 있는데 취업까지 제한 시키는 이런 시행령은 과한 ‘낙인’이다”라며 억울함을 호소했다. 여러분의 생각은 어떤가요?
전과자의 취업을 제한하는 이런 시행령은 과하다
사용자의 안전을 위한 조치로 보아야 한다.
광고삭제
광고삭제
위로