Chat GPT의 출현 이후 복잡한 코드나 마우스 클릭 없이도 자연스럽게 기계에 요청하고 응답을 받을 수 있게 되었습니다. 텍스트나 음성을 통해 간편하게 은행 잔고를 확인하거나, 운전 중에 필요한 물건을 구매하기도 하고, 채팅을 통한 의료 상담도 가능해졌습니다. 특히 맥락 분석(Context Analysis), 감정 분석(Sentiment Analysis), 멀티 턴(Multi-turn Dialog) 등의 기술이 고도화되어 복잡한 대화 흐름 속에서도 정확하게 의도와 맥락을 파악하고, 미묘한 감정이나 음성의 변화도 알아챌 수 있으며 과거의 대화, 선호, 행동 등을 더 반영한 초개인화된 대화 제공이 가능해졌습니다.
대화 기반의 프로덕트는 기술의 진보에 따라 점점 사람 간 소통 방식과 유사한 방식으로 인터페이스가 발전하고 있습니다. 1966년도에 만들어진 초기의 챗봇 Eliza가 CLI(Command-Line Interface) 즉, 명령어로 소통하는 방식으로 만들어졌다면, 2007년 iPhone의 출시와 함께 시각적인 요소를 바탕으로 대화할 수 있는 GUI(Graphic User Interface) 기반의 챗봇이 등장했고, 이후 음성 인식, 제스처 인식, 시선 추적 등의 기술 발전으로 구글 홈이나 시리, 빅스비 등 음성이나 간단한 행동만으로 자연스럽게 상호작용하는 NUI(Natural User Interface) 기반의 챗봇까지 등장했습니다.
인터페이스의 변화에 따른 대화형 서비스
대화를 기반으로 한 인터랙션은 사용자가 인지적 자원을 많이 들이지 않아도 되어 사용이 편리하고 직관적입니다. 어린아이부터 노년층까지 디지털 친숙도에 관계없이 서비스 가치를 쉽게 전달할 수 있어 매력적이기도 합니다. 반면에 Siri나 Bixby와 같은 대화형 에이전트를 사용하면서 내 말의 의도가 정확하게 파악되지 않거나 원하는 답변을 받지 못해 답답했던 경험도 있을 것입니다. 챗봇을 운영하면서 “왜 내 말을 못 알아듣니”, “답답해 죽겠네"와 같은 대화 로그를 발견해 아쉬운 마음이 들 때도 많았습니다.
더 똑똑한 대화형 AI 프로덕트를 만들기 위해 PM 및 서비스 기획자가 현재 하는 일과 생성형 AI 시대에 요구되는 역할에 대해 소개하고자 합니다.
대화형 AI 프로덕트 메이커의 현재 : 의도 파악과 시나리오 설계
대화형 AI 기반 프로덕트는 사용자가 먼저 무언가를 요청했을 때 그 의도(Intent)를 파악하는 것으로부터 시작합니다. 따라서 PM 및 기획자의 역할은 사용자의 의도를 정확하게 알아들을 수 있도록 자연어 처리(NLP) 엔진의 학습 데이터를 최적화하거나, 사용자가 애매하게 말할 경우 정확한 의도를 파악하기 위한 대화 시나리오를 구축하는 것입니다.
NLP 모니터링 : 사용자 의도는 명확하나 챗봇이 알아듣지 못할 때
사용자가 “카드 값 50만 원만 미리 갚을게”라고 말했지만 챗봇은 “이번달 결제 금액 전체를 결제해 드릴게요.”라고 답합니다. 사용자의 요청에서 ‘결제’라는 의도(Intent)는 파악했지만 ‘50만 원’이라는 특정 금액을 인식하지 못해 ‘전체 금액 결제’ 시나리오로 연결된 것입니다. 챗봇의 초기엔 ‘결제’라는 큰 맥락에서의 의도는 파악할 수 있도록 학습 시켰으나 운영을 하다 보면 사용자의 의도는 그 안에서도 더 세분화된다는 걸 알 수 있습니다. 따라서 챗봇 로그에 쌓이는 대화 데이터를 지속적으로 모니터링하며 의도를 세분화하거나, 새로운 의도 추가 및 조정 등 NLP 엔진을 최적화 해나가며 사용자의 의도를 정확하게 파악할 수 있어야 합니다.
리에스크 대화 설계 : 사용자의 의도가 명확하지 않을 때
구글, 네이버 같은 검색엔진에 익숙하고 챗봇과 대화하는 것이 어색한 사용자들은 “교통", “카드”와 같이 키워드 기반으로 말하는 경우가 빈번합니다. 제가 운영하는 챗봇의 경우 전체 발화의 약 30~40% 정도를 차지할 정도입니다. 만약 사용자의 의도를 마음대로 추측하여 특정 시나리오를 제공할 경우, 챗봇이 내 말을 못 알아듣는다고 생각하게 될 것입니다. 사람 간의 대화에서도 모르면 다시 묻듯이 리에스크(Re-ask) 및 관련 업무 제안 등의 대화를 통해 사용자의 의도를 정확하게 파악하고 답변해야 합니다.