자동 AI 보고서 작성에 ChatGPT 도입
자동 AI 보고서 작성에 ChatGPT 도입

자동 AI 보고서 작성에 ChatGPT 도입

  • 데이터 분석에 챗GPT 활용 가능성

온체인 거래 데이터를 분석하여 중요 이벤트를 자동으로 추출하여 보고서를 작성하는 데 챗GPT(ChatGPT)를 도입한다.

서울대학교 이준환 교수 연구실(Human-Computer Interaction & Design, hci+d Lab.)에서 국내 최초로 언론사를 통해 송고한 로봇 기사의 개발을 주도했던 랩투아이 오종환 대표는 소속 연구실에서 개발한 알고리즘을 통해 신문 기사를 작성하는 ‘로봇 저널리즘 프레임워크’를 활용하여 AI 보고서 및 기사 작성 사업을 해왔다.

기존에는 자동 기사 및 보고서 작성에 필요한 데이터의 수집, 이벤트의 추출, 중요 이벤트 선별, 기사의 분위기 결정, 뉴스 기사 생성 등 일련의 단계마다 많은 개발 노력이 필요했던 것이 사실이다. 특히 마지막 단계인 뉴스 기사 작성의 완성도를 높이기 위해서는 수많은 경우의 수에 따라 템플릿을 만들고 이를 조합하기 위해 상당한 노동력이 요구되었다.

기존의 자연어 생성 기술을 이용한다해도 어색한 문장을 만들어내거나, 부정확한 어휘를 쓰는 경우가 많아 개발자가 직접 손을 대야하는 부분이 많았던 것이다.

거대 언론사인 포브스에 로봇 기사를 공급했던 기업으로 잘 알려진 미국의 내러티브 사이언스에서도 템플릿 기반의 생성기사를 더이상 공급하지않고 매각된 바 있다. 혁신적 기술로 평가받던 자동 기사 생성 기술은 한동안 정체되었지만, 챗GPT를 기점으로 초거대언어모델이 도입되면서, 보고서와 기사 생성 기술도 재도약기를 맞이하고 있다. (내러티브 사이언스는 세일즈포스에 인수된 후, 시각화 소프트웨어 TableauAsk Data 프로젝트에 흡수되었다.)

  • 대용량 데이터 분석과 보고서 작성에 챗GPT 활용 방식 

챗GPT는 초거대언어모델 GPT를 기반으로 한 채팅 형태의 어플리케이션으로서 자연어 생성 과업에 놀라운 성과를 보이고 있다. 어떠한 분위기든 역할과 발언 방식 등을 제시하면 그에 맞는 스크립트를 한국어로도 얼마든지 자연스럽게 표현한다. 오픈AI가 지난 14일 공개한 테크니컬 리포트에 따르면, 처음 공개된 GPT-3.5 기반의 ChatGPT는 4,096토큰 (약 3,000 단어) 수준의 입력이 가능하지만 GPT-4 기반에서는 32,768토큰(A4 용지 문서 약 50매)까지의 입력이 가능하다. 따라서 이 분량 이내의 입력은 즉각 처리할 수 있다는 의미이다.

그러나 데이터 분석에 직접적으로 사용하는 데에는 어려움이 있다. 금융 분야의 데이터 같은 경우는 알려진 프롬프트(입력, prompt)의 크기 제한보다 큰 데이터인 경우가 많으며, 현재 공개된 챗GPT의 API 모델은 3.5 버전을 기반으로 하기 때문에, 많은 양의 데이터를 그대로 입력해서는 원하는 결과물을 얻기 힘들다. 게다가 인공지능 모델이라고 해서 데이터를 입력하면 이를 모두 자동으로 원하는대로 분석할 수 있는 것은 아니다. 거짓 정보를 그럴듯한 것처럼 꾸며내는 환각(hallucination) 현상이 문제시된 바 있다. 입력된 데이터를 정확하게 분석하기 보다는 데이터와 어긋난 분석 결과를 내놓기도 한다는 것이다. 

자산 투자에 정보를 줄 수 있는 정보는 뉴스나 SNS에서 사용자들의 반응을 분석하되, 객관적인 사실에 기반해야 한다. 따라서 데이터 수집과 분석 과정은 여전히 실시간 데이터 처리 노하우가 필요한 영역이며, 중간 분석 결과와 문서 작성 방향을 챗GPT에게 지시함으로써 최종적인 문서가 완성된다.

로봇저널리즘 프레임워크에서 챗GPT의 대체영역. 한국언론학보 (2015) “로봇 저널리즘 : 알고리즘을 통한 스포츠 기사 자동 생성에 관한 연구” 

  • 챗GPT 활용의 핵심 역량은 데이터 분석과 프롬프트 엔지니어링

투자 보고서의 작성은 데이터 수집과 분석을 하는 모듈이 적절한 지시사항이 포함된 프롬프트를 자동으로 생성하여 챗GPT API에 전달하여 생성된다. 사용자는 별도의 채팅 입력이 없어도 원하는 형태의 보고서를 받아볼 수 있게 된다. 

높은 퀄리티의 결과물을 얻기 위해서 챗GPT의 생성 능력을 최대한 활용할 수 있는 프롬프트 엔지니어링 기술이 주목 받고 있다. 근본적으로 언어모델인 챗GPT가 수학 계산이나 통계량, 차트 도출에 등에 취약한 면이 있다. 따라서 챗GPT를 금융 보고서 작성과 같이 특수한 목적으로 활용하기 위해서는 별도의 프로그램을 연결하여 정보를 처리하는 기술이 필수적이다. 

2023년 3월 23일 공개된 챗GPT 플러그인은 이러한 수학적 계산에 특화된 울프람 알파(Wolfram Alpha)와 같은 외부 프로그램을 연결하여 정보를 받은 후 챗GPT와 연결하여 대화를 하는 방식으로 정보처리를 고도화한다.

랩투아이의 보고서 작성 모델도 비슷한 구조를 따른다. 축적된 데이터 수집 및 분석 기술로 보고서에 들어가야할 중요한 데이터를 선별하여 제시한다. 이와 함께 문서작성에 필요한 명령(프롬프트)를 함께 제공해야 챗GPT가 이를 완성도 있는 보고서의 형태로 출력한다. 분석된 데이터뿐만 아니라 프롬프트를 어떻게 제시하는지에 따라 결과물의 형태가 천차만별로 달라지기 때문에 챗GPT의 활용도는 프롬프트 엔지니어링 노하우에 의해 크게 좌우된다.

개인의 투자 성향 분석하는 것도 기존의 설문 방식이 아닌 개인의 거래소 계정을 연동하여 제공할 계획이라고 밝혔다. 실제 데이터 연동을 통해 더욱 간편하고 정확한 분석 정보를 제공할 예정이다.

ChatGPT를 이용한 보고서 서비스는 디지털 자산 정보 분석 앱 ‘코싸인’에 점진적으로 적용 중이며, 애플 앱스토어구글 플레이스토어에서 다운받은 일반 사용자용 앱에도 추가될 예정이다.

데이터 입력과 프롬프트 엔지니어링을 거친 ChatGPT의 보고서 예시

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다