- 특허활용 AI를 활용한 특허 분석, 연구개발의 혁신을 가속화하다
특허 분석은 기업과 연구자들에게 매우 중요한 작업이지만, 그 과정은 복잡하고 시간 소모적이다. 상당히 정형화되어 있고 기술에 관한 내용이 상세하게 공개되어 있다고 해도, 특허 분석은 여전히 수많은 수작업과 기술적·법률적 전문 용어 등으로 인해 많은 이들에게 난도가 높은 작업이다. 특히 특허 전문가가 아닌 연구자라면, 경쟁사나 최신 특허에 관한 내용을 파악하고 이를 기반으로 연구개발 전략을 수립하기까지 생소한 용어나 문구가 많아 그 활용도는 현저하게 떨어질 수 있다. 본고에서는 최근 다양한 전문 분야에 적용되고 있는 LLM(Large Language Model; 대형 언어 모델) 기반의 특허 분석 기법을 살펴보고, 특허뿐만 아니라 연구개발의 각 단계에서 활용할 수 있는 ‘기술 전문 분야 LLM’의 가능성을 살펴보고자 한다.
인공지능(AI)의 발전과 함께 LLM 기반 기술이 다양한 산업 분야에 적용되면서, 특허 분석 분야에서도 그 가능성이 주목받고 있다. 이 중 생성형 AI 모델인 ChatGPT(Generative Pre-trained Transformer)는 OpenAI가 개발한 자연어 처리 모델로, 텍스트 데이터를 이해하고 생성하는 데 뛰어난 성능을 보인다. ChatGPT는 2022년 11월에 프로토타입 버전이 공개된 이후 그 성능 면에서 큰 화제가 되고 있다. 공개 후 2개월 만에 사용자 수가 1억 명을 넘는 등 서비스 확대의 속도에서도 주목받고 있다. 특허나 논문에서 사용되고 있는 기술 키워드와 구문 간의 의미를 이해하고, 이를 일반적인 용어로 요약하는 기능은 이미 일정 수준 이상의 결과물을 제공하고 있다. 따라서 일반인의 관점에서 특허 문헌의 내용을 쉽게 파악하는 데 도움을 줄 수 있다.
기존 특허 분석의 문제점
특허 분석은 다양한 기술·특허 관점의 사전지식을 요구한다. 우선, 특허 문서는 매우 복잡한 기술 용어와 법률 용어로 작성되어 있어 이해하기 어렵다. 또한 수많은 특허 문서를 검토하고 분석하는 과정에서 많은 시간이 소요되며, 이는 인력과 비용의 문제로 직결된다. 특히 다국적 기업이나 연구기관의 경우, 다양한 언어로 작성된 특허 문서를 번역하는 데 드는 비용과 시간도 상당하다. 이러한 문제점들은 특허 분석의 효율성을 저해하고, 특허 분석이 매우 중요한 업무임에도 불구하고 피하고 싶은 영역으로 간주하게 한다.
인공지능을 활용한 특허 분석 업무의 영역
앞서 설명한 이유로 인해 인공지능 모델을 활용하여 논문이나 특허를 분석하는 데 도움을 받고자 하는 시도가 늘고 있다. 분석의 목적에 따라 정확도와 활용도는 다소 차이가 있겠지만, 활용 가능한 다양한 분석 업무의 영역을 살펴보고자 한다.
1) 자동 번역 및 요약
특허 문서는 다양한 언어로 작성되며, 이를 이해하기 위해 번역이 필수적이다. 기존의 다양한 특허 검색 엔진은 원문을 그대로 제공하거나 번역 엔진을 활용하여 국문으로 제공하는 경우가 많다. ChatGPT 또한 다국어 번역 기능을 통해 특허 문서를 번역하고 핵심 내용을 요약할 수 있으며, 최신 기술 용어에 대한 번역도 상당히 자연스럽다는 장점이 있다. 기업과 연구기관이 시간과 비용을 절감하고, 다양한 언어의 특허 정보를 신속하게 파악하는 데 도움을 줄 수 있으리라 예상된다. 다만, 원래의 학습데이터가 잘못되었거나 AI가 잘못된 응답을 도출할 가능성도 존재한다. 대답이 자연스러운 만큼 오히려 실수를 알아차리기 어려운 면도 있다. 하지만 전체적인 문맥과 목적 등을 파악하는 데는 큰 문제가 없는 수준이며, 이는 이미 많은 연구자가 해외 논문 등을 분석하는 데 pdfGPT와 같은 프로그램을 사용하는 이유이기도 할 것이다.
2) 기술 용어 이해 및 처리
특허 문서는 매우 전문적인 기술 용어로 작성되기 때문에, 이를 정확하게 이해하고 분석하기는 쉽지 않다. ChatGPT는 방대한 데이터를 학습하여 기술 용어를 정확하게 인식하고 처리할 수 있다. 이는 특허 문서의 정확한 분석을 가능하게 하며, 기술적 세부 사항을 놓치지 않고 파악하도록 돕는다. 그림 1은 표 1의 특허 문헌에서 ‘see-through optical system’에 대한 설명을 요청한 결과이다. 질문에 대한 답변을 해당 특허 문헌 내 각각의 구성요소를 기반으로 생성해 주고 있다.
3) 응용 분야 추천
ChatGPT는 특허 문서의 내용을 분석하여 해당 특허가 적용될 수 있는 다양한 응용 분야를 추천할 수 있다. 이는 연구개발(R&D) 과정에서 새로운 아이디어를 도출하거나 기존 특허를 활용한 새로운 비즈니스 기회를 찾는 데 활용할 수 있다. 대학이나 연구소의 경우, 보유 특허의 홍보나 마케팅을 위한 자료(SMK, Sales Material Kit) 등에 활용할 수 있을 것이다.
4) 특허 포트폴리오 관리
특허 포트폴리오 관리는 기업의 지식재산권 전략에서 중요한 역할을 한다. 자사뿐만 아니라 경쟁사의 특허를 분류하고 지속적으로 모니터링해, 자사와 경쟁사의 포트폴리오 분석 및 연구개발 전략 수립에 활용할 수 있다. 하지만 이 또한 다수의 연구자나 특허 전문가가 장시간 지속적으로 투입되어야 한다는 문제점이 있다. 이에 생성형 AI는 기술 분류 및 각 분류에 대한 정의를 기반으로 자사나 경쟁사의 신규 특허를 분류하는 데에도 활용될 수 있다.
AI 기반의 다양한 문서 분류 모델이 존재하지만, 생성형 AI를 활용할 경우 다음과 같은 장점을 누릴 수 있다. 사전에 분류된 학습데이터가 필요하지 않으며, 입력되는 문서를 기반으로 ‘분류 이유’를 추가적으로 제공할 수 있다. 즉, 연구자에게 최종적으로 검토·판단하는 데 용이한 결과물을 제공할 수 있다. 표 3은 이차전지 소재, 팩, 음극재, 양극재 등에 관한 기술 정의를 바탕으로 다수의 관련 특허를 자동으로 분류한 결과다. 입력되는 특허의 내용을 기반으로 1, 2순위로 분류될 확률과 분류한 이유가 자동으로 작성된 예시다.
결론 및 제언
AI를 활용한 특허 분석은 특허 전문가뿐만 아니라 연구자들에게도 큰 도움이 될 수 있는 도구로 자리 잡고 있다. AI 기반의 특허 분석은 연구개발의 각 단계에서 매우 유용하게 활용될 수 있는 잠재력이 있다. 지속적인 AI 기술의 발전과 활용은 연구자들에게 보다 혁신적이고 효율적인 연구개발을 가능하게 하고, 다양한 분야에서 혁신의 가속화를 이끄는 엔진 역할을 할 것으로 기대된다. 다만, 생성형 AI에서 빈번히 발생하는 환각(Hallucination) 현상과 같은 문제는 여전히 검증이 필요하고 신규 특허 창출과 같은 창의적 영역은 당분간 전문가의 영역으로 남아 있을 것으로 예상된다.
- Vol.466
24년 07/08월호