[지디넷코리아]
생성형 인공지능(AI) 확산으로 영상·음성·문서 등 비정형 데이터 활용 수요가 급증하는 가운데, 넥스원소프트가 개인정보 보호와 데이터 활용을 동시에 지원하는 차세대 가명·익명 정보 처리 플랫폼 개발에 나선다. 보건의료를 시작으로 공공·금융·교육 분야까지 적용 범위를 확대해 AI 시대 데이터 활용 인프라 시장을 선점한다는 목표다.
넥스원소프트는 한국인터넷진흥원(KISA)이 추진하는 개인정보보호·활용 분야 연구개발(R&D) 과제를 수주하고 가명·익명 정보 생성을 위한 비정형데이터 호환 기술 플랫폼 개발에 착수했다고 18일 밝혔다. 사업은 2028년까지 진행된다.
최근 생성형 AI와 데이터 융합 서비스가 확산되면서 영상·텍스트·음성·문서 이미지 등 다양한 형태의 비정형 데이터 활용 수요가 늘고 있다. 이에 데이터 유형별 개인정보 특성과 활용 목적을 반영한 가명·익명 정보 처리 기술 중요성도 커지고 있다. 특히 기관 간 데이터 공유와 연계가 확대되면서 일관된 품질과 신뢰성을 확보할 수 있는 통합 플랫폼 필요성이 높아지는 상황이다.

이번 과제는 데이터 유형별 특성을 반영하면서도 기관 간 동일한 품질 기준으로 가명·익명 정보를 생성할 수 있는 플랫폼 구현을 목표로 한다. 넥스원소프트는 한라대학교와 울산대, 서울아산병원, 유피에스데이터와 컨소시엄을 구성해 사업을 수행한다.
참여 기관들은 비정형 데이터 개인정보 자동 탐지·분류 엔진과 가명·익명 처리 핵심 알고리즘 패키지, 처리 검증·평가 엔진, 탐지 결과 조회 및 비식별 구역 설정 도구, 객체 비식별화 처리 도구 등 플랫폼 핵심 기술을 공동 개발할 예정이다.
플랫폼은 영상·텍스트·음성·문서 이미지 등 다양한 멀티모달 데이터 환경에서 개인정보 자동 탐지와 변환, 재식별 위험 평가, 검증 기능을 지원한다. 탐지와 변환, 검증, 운영 기능을 모듈형 구조로 설계하고 API 방식으로 연동해 다양한 데이터 유형과 서비스 환경에 유연하게 적용할 수 있도록 구현할 계획이다.
넥스원소프트는 우선 보건의료 분야를 중심으로 기술 실증에 나선다. 의료기관 실제 데이터와 기관생명윤리위원회(IRB) 기준을 연계해 의료 영상과 진료 음성, 문서 등 고난도 비정형 데이터의 개인정보 처리 기술을 검증할 예정이다. 이후 확보한 기술 신뢰성과 운영 경험을 바탕으로 공공·금융·교육 분야까지 적용 범위를 확대할 방침이다.
회사는 총 14개 실증기관을 대상으로 현장 적용성을 검증한 뒤 구축형과 모듈형 등 다양한 공급 모델을 마련해 약 40개 기관 및 기업을 대상으로 상용화를 추진할 계획이다. 이를 통해 AI와 데이터 산업 전반에서 활용 가능한 표준 플랫폼으로 발전시킨다는 구상이다.
최덕훈 넥스원소프트 대표는 “가명·익명 정보 기술은 이제 규제 대응 수단이 아니라 AI와 데이터 산업의 핵심 인프라로 자리 잡고 있다”며 “해당 플랫폼은 보건의료·공공·금융·교육 분야 실제 데이터를 기반으로 기술의 정확성과 안전성, 활용성을 검증해 특정 산업에 국한되지 않는 차세대 표준 플랫폼으로 자리매김할 수 있을 것”이라고 밝혔다.
