[AI 리더스] GPT가 쓰고 제미나이가 검증한다…AI교차 토론으로 정확성 ‘↑’

[지디넷코리아]

인공지능(AI) 시대가 본격화되면서 업무와 일상 전반에 생성형 AI 활용이 늘고 있다. 하지만 환각, 데이터 편향, 최신성 한계 같은 문제는 여전히 실무 적용의 걸림돌로 남아 있다.

검색증강생성(RAG) 등 보완책이 확산하고 있지만 중요한 의사결정일수록 한 번의 답변을 그대로 믿기 어렵다는 고민이 반복된다.

이에 리바랩스는 챗GPT, 제미나이, 클로드 등 복수의 거대언어모델(LLM)을 동시에 투입해 답변을 교차 검증하고 결론을 도출하는 멀티 에이전트 시스템 ‘에이밋(AMEET)’을 선보이며 단일 모델의 한계 극복에 나섰다.

정동성 리바랩스 대표

22일 지디넷코리아를 방문한 정동성 리바랩스 대표는 에이밋을 시연하며 “AI가 쓴 답을 다른 AI가 공격하고 다시 방어하는 과정을 시스템화해 집단지성을 통한 가장 신뢰할 수 있는 해답을 제공하겠다”고 밝혔다.

정 대표가 에이밋에서 가장 강조한 키워드는 ‘교차 검증’이다. 에이밋은 여러 모델에 역할을 부여해 하나의 질문을 두고 서로 다른 관점에서 주장과 근거를 제시하며 토론하게 한다.

이를 통해 다른 모델의 환각 현상을 비롯해 논리적 빈틈이나 근거 부족을 지적하며 내용을 보완한다.

챗GPT, 제미나이, 클로드, 퍼플렉시티 등 현재 상용화된 최상위 LLM들이 저마다 학습 데이터의 범위와 최신성, 응답 성향, 추론 방식에서 차이가 있다는 점에 착안한 전략이다.

정 대표는 “특정 모델은 창의적인 생성에 능한 반면 어떤 모델은 긴 문맥을 이해하는 데 강점이 있고 또 다른 모델은 최신 데이터 반영 속도가 빠르다”며 “이들을 하나의 테이블에 앉혀 서로의 지식 사각지대(Blind Spot)를 메우고 편향된 답변을 상쇄시키는 ‘상호 보완적 앙상블(Ensemble)’ 구조를 만들었다”고 설명했다.

역할을 맡은 개별 AI가 하나의 주제를 두고 토론하는 에이밋(이미지=리바랩스)

특히 토론이 한쪽으로 쏠리는 ‘집단 사고’를 막기 위한 안전장치로 ‘레드팀(Red Team)’ 에이전트를 별도로 배치했다.

이 에이전트는 다수 의견에 의도적으로 반대 관점을 제시하고 논리적 허점을 파고든다. 정 대표는 “한쪽 의견이 강해질수록 반대 관점에서 맹점을 찌르는 역할이 반드시 필요하다”며 “실제 법률 자문 테스트에서도 인간 전문가가 놓친 법리적 쟁점을 레드팀 AI가 찾아내기도 했다”고 말했다.

교차 검증 시스템의 주요 장점은 ‘환각의 최소화’와 ‘숨겨진 쟁점 발굴’이다. 토론 중 한 모델이 거짓 정보를 제시하더라도 다른 모델이 사실을 근거로 즉시 논리적 빈틈을 지적하고 내용을 보완하기 때문이다. 이를 통해 단일 모델을 쓸 때보다 훨씬 정제되고 신뢰할 수 있는 정보를 얻을 수 있다.

에이밋은 AI들이 토론한 내용을 바탕으로 리포트도 자동으로 작성한다(이미지=리바랩스)

정동성 대표는 이러한 사례로 법률 자문 테스트를 소개했다. 당시 주제는 외국인 여성이 한국인 남성을 상대로 제기하려는 친자 확인 소송 건이었다. 대다수의 단일 AI 모델들은 유전자 검사 비용이나 절차, 소요 기간 등 일반적인 정보를 나열하는 데 그쳤다.

하지만 에이밋의 교차 검증 시스템은 비판적 역할을 맡은 모델이 민법상 ‘친생 추정의 원칙’을 먼저 검토해야 한다고 지적했다. 상대방이 법률혼 관계에 있다면 유전자 검사 이전에 소송 자체가 성립되지 않을 수 있다는 법리적 맹점을 AI가 스스로 찾아낸 사례다.

정 대표는 “만약 한 가지 모델만 믿고 진행했다면 소송 비용과 시간을 낭비할 뻔했던 사례”라며 “서로 다른 AI가 공격하고 방어하는 과정이 있었기에 가능한 통찰이었다”고 강조했다.

그는 이 같은 구조가 기업 분석이나 정책 해석에서도 그대로 적용될 수 있다고 설명했다.

시장 규모나 경쟁 구도처럼 숫자와 사실이 중요한 영역은 검증 역할이 강한 모델이 점검하고 시나리오와 실행 전략은 생성에 강한 모델이 가설을 제시해 오류를 최소화함과 동시에 다각화된 분석을 내놓을 수 있기 때문이다.

주제에 대한 각 AI별 의견과 내용도 정리해서 확인할 수 있다(이미지=리바랩스)

리바랩스는 이런 강점을 바탕으로 향후 에이밋을 단순한 분석 도구를 넘어 기업과 개인의 의사결정을 돕는 ‘프라이빗 씽크탱크’로 발전시킬 계획이다.

정동성 대표는 “정보는 넘치지만 검증은 부족한 시대”라며 “기업이 빠르게 결론을 내리되 그 결론이 어떤 근거와 조건 위에 서 있는지까지 함께 제시하는 AI가 필요하다”고 말했다.

이어 “에이밋은 경영진과 실무자의 판단 부담을 줄이고 리스크를 사전에 걸러내는 ‘AI 전략 참모’ 역할을 하도록 발전시키겠다”고 덧붙였다.

Post Views: 2

답글 남기기 응답 취소