“실무에 강해”…업스테이지, ‘다큐먼트 AI’ 문서 인식 시연

[지디넷코리아]

업스테이지가 자체 인공지능(AI) 모델 ‘솔라’를 앞세워 문서 인식 경쟁력을 한층 강화했다.

업스테이지는 30일 서울 강남 코엑스에서 열린 과학기술정보통신부 주관 ‘독자 AI 파운데이션 모델 1차 발표회’서 부스를 꾸리고 ‘다큐먼트 AI’ 데모를 시연했다.

다큐먼트 AI는 문서를 구조화된 정보 단위로 인식할 수 있는 AI 기술이다. PDF 스캔본부터 표, 도표, 계약서 등 여러 문서 형식과 의미를 동시에 해석할 수 있다.

독자 AI 파운데이션 모델 1차 발표회'에 마련된 업스테이지 부스.

이날 부스를 지키고 있던 업스테이지 관계자는 다큐먼트 AI 특장점으로 정교한 레이아웃 분석 기술을 꼽았다. 관계자는 “다큐먼트 AI는 문서 레이아웃과 항목 구조를 먼저 파악한 뒤 텍스트를 추출한다”며 “문서 제목부터 본문, 표, 각주 등 각 요소를 명확히 구분해 인식할 수 있어 전체 맥락을 유지할 수 있다”고 강조했다.

이어 “이 기술은 철저히 사용자가 입력한 문서 범위 내에서만 답변을 생성하도록 설계됐다”며 “근거 없는 정보가 섞일 가능성을 원천차단했다”고 덧붙였다.

이날 업스테이지는 다큐먼트 AI가 문서 처리하는 기능을 시연했다. AI가 수출입 신고서나 인보이스 등 여러 서류를 동시에 비교해 항목별 일치 여부를 자동으로 검증할 수 있었다. 이를 통해 오류 지점까지 정확히 찾아냈다. 여기에 이미지 이해 기능을 결합해 도면이나 그래프 속 문자까지 인식했으며, 그 수치가 갖는 의미까지 제시했다.

업스테이지는 다큐먼트 AI로 기업뿐 아니라 공공 시장까지 적용 범위를 확장하고 있다. 이 기술은 현재 조달청 디지털서비스몰에 등록돼 관세청 등에서 실무에 활용되고 있다. 특히 통계청 보고서와 데이터를 요약해 문서를 생성하는 등 데이터 무결성 보장이 필요한 고난도 작업에 투입되고 있다.

다큐먼트 AI가 문서 수치를 분석하고 의미까지 파악한 장면.

업스테이지는 PDF나 PPT뿐 아니라 HWP, DOC 등 국내 업무 환경에 필수적인 문서 규격 지원도 다큐먼트 AI에 추가했다. 보안이 최우선인 기관을 위해 폐쇄망에서도 구동 가능한 온프레미스 형태로 서비스를 제공하며 기술 도입 장벽을 낮췄다.

업스테이지는 “우리는 문서 구조 해석과 언어 모델 결합이라는 독자적인 기술 노선을 구축했다”며 “실무 효율을 중시하는 엔터프라이즈 AI 시장에서 한국형 AI의 강력한 경쟁 우위를 증명할 것”이라고 강조했다.

답글 남기기

이메일 주소는 공개되지 않습니다. 필수 필드는 *로 표시됩니다