챗GPT에 아이디어를 물으면 안 되는 이유…독일 연구팀이 밝혔다

[지디넷코리아]

챗GPT(ChatGPT)에 “창의적인 이미지 만들어줘”라고 입력하면 몇 초 만에 그럴듯한 결과물이 나온다. 편리하다. 그런데 독일 막스 플랑크 소프트웨어 시스템 연구소(Max Planck Institute for Software systems) 연구팀이 2026년 4월 발표한 논문에 따르면, 바로 그 편리함이 당신의 창의력을 갉아먹고 있다. 연구팀은 인간과 AI가 함께 창작하는 과정에서 기존 챗봇 방식이 ‘설계 고착화(Design Fixation)’라는 인지적 함정을 유발한다는 것을 실험으로 증명했다. 창의적인 작업에 AI를 쓰는 사람이라면 반드시 알아야 할 내용이다.

그림1. HAICo에서 사용자가 아이디어 탐색과 이미지 정제를 오가며 창작하는 과정의 예시 흐름도

첫 결과물에 갇히는 설계 고착화 함정

설계 고착화(Design Fixation)란 처음 본 결과물에 마음이 굳어버려, 더 좋은 아이디어가 존재할 수 있음에도 그 결과물만 계속 수정하려 드는 현상이다. 예를 들어 챗GPT로 포스터 이미지를 만들었을 때, 첫 번째로 나온 이미지가 썩 마음에 들지 않아도 대부분의 사람은 “조금만 더 밝게 해줘”, “글자 크기를 키워줘” 하는 식으로 그 이미지를 조금씩 고치는 데 집중한다. 완전히 다른 방향의 아이디어를 탐색하는 사람은 드물다.

연구팀은 이것이 챗봇 특유의 구조적 문제라고 지적한다. 챗GPT 같은 기존 인터페이스는 사용자가 프롬프트(명령어)를 입력하자마자 완성된 결과물을 내놓는다. 아이디어를 충분히 탐색하기도 전에 ‘완성품’이 눈앞에 나타나는 것이다. 심리학에서는 이를 “먼저 본 것에 먼저 집착하게 된다”는 원리로 설명한다. 첫인상에 묶여버린 사용자는 더 넓은 가능성을 탐색하는 대신 이미 본 결과를 조금씩 수정하는 데 집중한다. 이 과정이 반복되면 결과물의 창의성은 오히려 떨어진다.

또 하나의 문제가 있다. 바로 연구자들이 “상상의 간극(Gulf of Envisioning)”이라고 부르는 현상이다. 사용자가 머릿속에 원하는 것이 있어도 그것을 AI에게 제대로 전달할 언어를 찾지 못하는 이 문제는 이미 여러 연구에서 지적된 AI 창작 도구의 고질적 한계다. 예를 들어 이미지를 “더 생동감 있게” 만들고 싶다는 생각이 있어도, 그것을 AI가 이해할 수 있는 구체적인 지시로 바꾸는 일이 생각보다 훨씬 어렵다. AI가 “생동감”을 밝은 색으로 표현할지, 사람을 추가할지, 배경을 바꿀지는 사용자도 미리 알기 어렵기 때문이다.

챗GPT vs HAICo, 창의성 실험 결과

연구팀은 이 두 가지 문제를 동시에 해결하는 새로운 창작 시스템 ‘HAICo(Human-AI Co-creation system)’를 개발했다. HAICo는 창작 과정을 두 단계로 명확히 분리한다. 먼저 발산 모드(Divergent Mode)에서 다양한 개념 아이디어를 탐색하고, 이후 수렴 모드(Convergent Mode)에서 마음에 드는 아이디어를 정교하게 다듬는 구조다. 결정적인 차이는 어떤 이미지도 생성되기 전에 반드시 아이디어 탐색 단계를 먼저 거친다는 것이다.

연구팀은 24명의 참가자를 대상으로 HAICo와 챗GPT를 같은 과제에서 직접 비교하는 실험을 진행했다. 결과는 HAICo의 압도적인 우위였다. 창의성 지원 지수(Creativity Support Index) 전 항목에서 HAICo가 챗GPT를 유의미하게 앞섰다(모든 항목 p &lt; 0.002). 시스템 사용성 점수(UMUX-Lite)도 HAICo가 81.25점, 챗GPT가 64.24점으로 격차가 컸다(p &lt; 0.001).

가장 눈에 띄는 수치는 결과물의 독창성(Novelty)이다. HAICo로 만든 이미지의 독창성 평균 점수는 3.22점(5점 만점), 챗GPT는 2.41점으로 유의미한 차이를 보였다(p &lt; 0.001). 다양성(Diversity) 점수 역시 HAICo가 0.48, 챗GPT가 0.36으로 HAICo가 더 높았다(p = 0.001). 숫자가 크지 않다고 느껴질 수 있다. 그러나 이 격차는 단 한 번의 창작 과정에서 나온 것이다. 매일 AI를 활용해 콘텐츠, 기획서, 마케팅 소재를 만드는 사람이라면, 이 차이가 수개월에 걸쳐 누적될 때 결과물의 질이 어떻게 달라질지 충분히 짐작할 수 있다.

그림9. HAICo 사용 후 학습 효과와 창작 방식 변화를 보여주는 실험 결과.

발산과 수렴, 창의적 두뇌가 작동하는 방식

HAICo가 이런 효과를 낼 수 있었던 이유는 인간의 창의적 사고 방식 자체에서 찾을 수 있다. 창의성 연구에서는 오래전부터 창의적 사고가 두 단계로 구성된다고 본다. 하나는 가능한 한 많은 아이디어를 자유롭게 펼치는 발산적 사고(Divergent Thinking)이고, 다른 하나는 그 아이디어 중 유망한 것을 골라 구체적으로 완성하는 수렴적 사고(Convergent Thinking)다. 창의적인 사람들은 이 두 단계 사이를 자유롭게 오가며 작업한다.

챗GPT 같은 기존 챗봇은 이 두 단계를 구분하지 않는다. 사용자가 프롬프트를 입력하는 순간, 시스템은 곧바로 수렴 단계, 즉 결과물 생성으로 넘어간다. 발산 단계가 생략된 것이다. HAICo는 이 문제를 발산 모드에서 9개의 아이디어 카드를 먼저 제시하는 방식으로 해결한다. 각 아이디어 카드는 단순한 스타일 변형이 아니라, 신화나 역사적 사건, 인터넷 문화 등 전혀 다른 영역에서 끌어온 개념적 아이디어다. 예를 들어 “스마트폰 사용 줄이기” 포스터를 만들 때, “방해하는 소(Interrupting Cow)” 밈(meme)에서 착안한 아이디어가 제안되기도 한다. 사람이 혼자서는 좀처럼 떠올리지 못할 방향이다.

연구팀이 먼 개념들을 연결하는 ‘연상적 사고 프롬프팅(Associative Thinking Prompting)’ 전략을 적용한 결과, 단순히 “창의적으로 만들어라”고 지시한 경우보다 아이디어 다양성이 유의미하게 높게 나타났다(p &lt; 0.001). 참가자들도 이 경험에 놀라움을 표했다. 한 참가자는 “내가 절대 그 방향으로 생각해 보지 못했을 것이다. 그런데 그것이 보여지자 나는 다른 방향으로 더 깊이 탐색하게 됐다”고 말했다.

AI 창작 습관을 바꿔야 하는 이유

이 연구가 주는 메시지는 단순히 “HAICo를 써라”가 아니다. 훨씬 더 근본적인 질문을 던진다. AI 창작 도구를 쓸 때, 당신은 스스로 아이디어를 충분히 탐색한 뒤 AI에게 구현을 맡기고 있는가, 아니면 AI가 처음 보여준 결과물에 갇혀 그것을 조금씩 다듬는 것으로 그치고 있는가.

연구에서 특히 흥미로운 결과가 있었다. HAICo를 먼저 사용한 참가자들이 이후 챗GPT로 넘어갔을 때, 자연스럽게 “먼저 아이디어 좀 제시해줘”라고 요청하는 행동 변화를 보였다. HAICo의 ‘발산 먼저, 수렴 나중’이라는 창작 방식을 챗GPT 사용에도 자연스럽게 적용한 것이다. 연구팀이 특히 흥미롭게 본 결과가 바로 이것이다. 소수의 참가자에서 나온 예비적 신호지만, 특정 도구의 기능이 아니라 창의적으로 사고하는 방식 자체를 학습했다는 가능성을 보여주기 때문이다.

자기 보고식 학습 점수에서도 HAICo가 챗GPT를 크게 앞섰다. HAICo 사용자의 평균 학습 점수는 5.29점(7점 만점), 챗GPT 사용자는 3.12점이었다(p &lt; 0.001). 챗GPT 사용자 24명 중 13명은 새로 배운 것이 없다고 밝히거나 아예 응답하지 않은 반면, HAICo 사용자는 5명에 그쳤다. 챗GPT를 쓸 때는 도구 사용법을 익히는 데 집중하게 되고, HAICo를 쓸 때는 과제 자체에 대한 지식이 늘어난다는 뜻이다.

지금 당장 챗GPT나 클로드(Claude) 같은 AI 도구를 창작에 활용한다면, 한 가지만 바꿔도 달라질 수 있다. 원하는 결과물을 바로 요청하기 전에 “이 주제로 전혀 다른 방향의 아이디어 다섯 가지를 제안해줘. 신화, 역사, 대중문화 등 관련 없어 보이는 영역에서도 끌어와줘”라고 먼저 물어보는 것이다. 아이디어를 충분히 탐색한 뒤 하나를 골라 구체화하는 단계를 의도적으로 집어넣을 때, 결과물은 더 참신하고 다양해진다.

FAQ( ※ 이 FAQ는 본지가 리포트를 참고해 자체 작성한 내용입니다.)

Q. 설계 고착화(Design Fixation)가 실제로 창의성에 얼마나 영향을 미치나요?설계 고착화는 처음 본 결과물에 사고가 고정되어 더 나은 아이디어를 탐색하지 못하게 만드는 현상입니다. 이번 연구에서 챗GPT 사용자는 HAICo 사용자보다 이미지 독창성 점수가 평균적으로 낮게 나타났으며, 이는 초기 결과물을 얼마나 빨리 보여주느냐가 최종 창작물의 질에 직접 영향을 미친다는 것을 보여줍니다.

Q. HAICo는 어디서 사용할 수 있나요?HAICo는 현재 연구 목적으로 개발된 시스템으로, 일반 공개 서비스로는 아직 출시되지 않았습니다. 다만 이 연구의 핵심 원리인 ‘발산-수렴’ 2단계 접근법은 챗GPT나 클로드 같은 AI 도구를 사용할 때도 직접 적용할 수 있습니다. 먼저 다양한 개념 아이디어를 탐색한 뒤 하나를 골라 정교하게 다듬는 순서로 사용하면 됩니다.

Q. 창의적인 AI 활용을 위해 지금 당장 실천할 수 있는 방법이 있나요?챗GPT나 클로드 같은 AI를 사용할 때, 원하는 결과물을 바로 요청하기 전에 먼저 “이 주제에 대해 완전히 다른 방향의 아이디어 여러 개를 제안해줘. 신화, 역사, 대중문화 등 전혀 다른 영역에서도 영감을 끌어와줘”라고 물어보세요. 이 단계를 거친 뒤 가장 마음에 드는 아이디어를 골라 구체화하는 방식이 결과물의 창의성을 높이는 데 효과적입니다.

기사에 인용된 리포트 원문은 arXiv에서 확인할 수 있다.

리포트명: Exploration vs. Fixation: Scaffolding Divergent and Convergent Thinking for Human-AI Co-Creation with Generative Models

■ 이 기사는 AI 전문 매체 ‘AI 매터스’와 제휴를 통해 제공됩니다. 기사는 클로드 3.5 소네트와 챗GPT를 활용해 작성되었습니다. (☞ 기사 원문 바로가기)

Post Views: 138

답글 남기기 응답 취소