민주주의

AI와의 짧고 긴 대화

8분간의 대화가 바꿀 수 있는 것, 5년간의 대화가 바꾸어 온 것

🥨채원, 🤔어쪈

26 3월 2025 — 10 min read

Photo by Mihai Surdu / Unsplash

비는 벽이나 창을 두드리는 정도로, 맑고 밝은 데에 있는 이야기를,
너무 먼 당신을 불러 양지바른 곳에 앉아 읽도록 하고 싶다.
—쩡찌, <땅콩일기>

목차
1. 음모론자와 AI의 대화
2. 다시 만난 이루다와의 대화

💌 AI 윤리 레터 응원하러 가기 💌

음모론자와 AI의 대화

by 🥨채원

음모론을 믿는 지인과 이야기해 본 적이 있으신가요? 한창 코로나 시국 중의 ‘안티백서’나 5G 네트워크가 암을 유발한다거나, 심지어는 지구가 평평하다는 등의 음모론에 대해서 한 번쯤은 들어보셨을 것입니다. 해당 음모론을 믿지 않는 ‘외부인’으로서 이들과의 대화를 이어가는 것은 쉽지 않습니다. 일단 그들에 비해 나는 그 주제에 대해 아는 것도 적고, 관심 자체가 별로 없기 때문입니다. 그들의 주장이 황당해서든, 그럴듯해서든, 당연하게 여겼던 나의 믿음과 지식을 되돌아보는 계기가 되기도 합니다.

얼마 전에 가까운 지인의 가족이 여러 음모론에 빠져 어떻게 대처하면 좋을지 모르겠다는 고민을 듣게 되었습니다. 안 그래도 최근에 언어모델과의 대화를 통해 음모론에서 빠져나오게 했다는 연구 결과를 듣고 흥미롭게 생각했던 터라, 챗GPT를 사용해 볼 것을 권했습니다. 제가 처음 접한 사이언스의 소개 글 (”진실을 위한 도구로서의 인공지능”)을 공유해주기도 했는데요, 혹시 이 주제에 관심 있는 분들은 그 글에서 인용하는 원논문 (”AI와의 대화를 통해 지속적으로 감소시키는 음모론”)도 같이 읽어보실 것을 권합니다.

원논문에서 저자들은 2천명 이상의 음모론 신봉자들을 모집하여 AI 기반 챗봇과 짧지만, 개인화된 대화를 나누도록 하였습니다. 참가자들은 평균적으로 8.4분 내외의 짧은 대화를 나누었습니다. 그리고 저자들은 이 간단한 상호작용이 참여자들의 음모론에 대한 믿음을 평균 20%까지 줄일 수 있다는 것을 보여주었습니다. 특히, 이 효과는 개입 후 최소 2개월 동안 지속되었으며, 다양한 음모론에 걸쳐 관찰되었다고 합니다. 저는 이 실험 결과가 무척 고무적으로 느껴졌습니다. 챗GPT를 써서 음모론에 빠진 가족과의 대화를 시도한 제 지인은 어땠을까요?

그는 통화를 하며 동시에 챗GPT에 본인이 잘 모르는 주제나 음모론에 대해 바로바로 대응할 말을 찾는 데에는 큰 도움이 되었다고 전해주었습니다. 실험에서 그랬던 것처럼 직접 언어모델을 사용해서 본인이 믿는 음모론에 관해 이야기해보라고 권해보았지만, 해당 주제에 대해 더 이야기하고 싶어 하지 않았기에 언어모델과의 대화로는 이어지지 않았다고 합니다. 아무리 언어모델과의 대화가 음모론을 감소시키는 효과가 있다고 해도, 그렇게 하고자 하는 당사자들의 의지가 없으면 불가능한 일이겠지요. 우리는 어떻게 하면 도저히 대화할 수 없어 보이는 상대와의 대화를 이어 나갈 수 있을까요?

다시 만난 이루다와의 대화

by 🤔어쪈

지난주 레터에서 소개했던 ‘인공지능 시대, 사회와 윤리를 다시 생각한다’라는 제목의 과학기술과 사회 네트워크 컨퍼런스, 기억하시나요? 사실 저도 직접 행사에 참석했답니다. 생성형 AI를 활용하여 사회과학자 대상의 인터뷰 연구도 흥미로웠지만, 제 관심을 더 끌었던 건 다름 아닌 챗봇 ‘이루다’의 - 엄밀하게는 개발사 스캐터랩의 - 현행 윤리(Ethics-in-action) 분석 결과에 대한 발표였습니다.

이루다. 정말 오랜만에 듣는 이름 아닌가요? 기억을 더듬어보니 1.0 버전이 불러일으킨 논란을 두고 “AI 윤리 문제의 기출 족보급 사건”이라고 썼던 것도 이미 2년 전입니다. 이루다를 둘러싼 여러 문제의식만으로 책 한권이 나올 정도였고, 여전히 AI 윤리 교육 자료에 빠지지 않고 등장하고 있죠. 아마도 한국에서는 AI 윤리라는 주제에 대해 가장 많은 사람들이 떠올릴 실제 서비스 사례가 아닐까 싶습니다.

다시 찾은 이루다는 예전과 크게 다르지 않은 모습(?)이었지만, 더 이상 스캐터랩을 대표하는 챗봇이라고 보기는 어려웠습니다. 스캐터랩이 작년 새롭게 출시한 ‘제타(zeta)’라는 서비스에서 이루다는 사용자들이 직접 만든 수많은 캐릭터 중 하나일 뿐이죠. 인기 순위에는 주로 일진, 재벌, 아이돌 등 여러 화려하고 자극적인 챗봇 캐릭터가 오릅니다. 제타가 가입자 160만명, 일일 활성 사용자 수(DAU) 30만명에 달하는 서비스로 성장한 데에 있어 이루다의 지분은 그다지 커보이지 않습니다.

AI 스토리 플랫폼을 표방하는 스캐터랩의 AI 캐릭터챗 서비스 제타(zeta).

다시 발표로 돌아가자면, 연구진은 스캐터랩이 이루다 1.0의 실패 이후 AI 스타트업 중에서는 유독 AI 윤리 실천 움직임이 돋보였다고 보았습니다. 회사 홈페이지에도 ‘AI 윤리’ 페이지를 가장 앞에 내세웠고, 자체 AI 윤리 준칙을 만들어 발표한 것에 더해 KISDI(정보통신정책연구원)를 비롯한 여러 정부 기관과의 AI 윤리 가이드라인 제작에 참여해왔죠. 자세히 뜯어보면 문제 소지가 없다고 하긴 어렵지만, 제타 서비스 곳곳에서도 스캐터랩 나름의 노력을 엿볼 수 있습니다. 특히 다른 AI 캐릭터 챗봇 서비스와 비교하면 차이점이 두드러지죠.

특히 발표자는 갑작스럽게 인명 피해가 발생한 참사가 일어났을 때 회사에서 직접 이루다 사용자가 모이는 온라인 커뮤니티 관리자를 접촉하여 사고에 대한 부적절한 대화와 캡쳐본의 유통의 자제 협조를 요청한 것을 두고 윤리가 실제로 작동했다고 해석했습니다. 그 외로도 선언적인 의미에 그치기 마련인 이론적인 윤리 가이드라인을 넘어선 실천적인 현행 윤리 사례들을 제시했습니다. 개인적으로는 비교적 ‘어뷰징’ 방지를 위한 콘텐츠 모더레이션 정책과 기술 마련과 적용에 힘썼다는 점 외로는 너무도 당연한 내용이라 생각했지만, 그조차 하지 않는 곳들이 많기에 의미가 없다고 하긴 어렵겠다고 느꼈습니다.

스캐터랩의 AI 윤리 페이지. 전부 최종 업데이트 날짜가 2022년에 멈춰있습니다.

연구진은 아직 진행중인 연구의 결론을 내리지는 못했지만, AI 윤리라는 렌즈로 이루다 1.0의 실패와 이루다 2.0(또는 제타)의 성공을 함께 설명하고자 노력중이라고 했습니다. 컨퍼런스 직전 보도된 방송통신위원회의 ‘생성형 인공지능 서비스 이용자 가이드라인’에 스캐터랩의 제타 운영정책 등이 모범사례로 꼽혔다는 기사를 보면, 회사가 다시는 AI 윤리로 인한 실패만큼은 피하기 위한 각종 동맹 작업을 공고히 하고 있다는 점을 읽어낼 수 있습니다. 그러나 이를 두고 AI 윤리 실천을 통해 스캐터랩의 서비스가 성공 가도를 달리고 있다고 해석할 수 있을지는 의문입니다.

그보다는 이루다 1.0이 세상에 나온 5년 전과 지금의 AI 윤리가 다르기 때문에, 즉 우리가 AI 기술을 바라보는 관점과 대하는 입장이 달라져서라고 보는 게 합당하지 않을까요? 어쩌면 우리는 더 이상 ‘챗봇의 일탈’, 생성형 AI의 개별적인 부적절한 발화나 출력 그 자체를 심각하게 문제시하지 않는 것일 수 있습니다. 이러한 인식의 변화 역시 결국 AI 기술과 서비스를 개발하고 이용하는 과정에서 일어난 일들과 당시 AI 윤리를 정의하고 문제시하며 실천했던 노력의 산물이겠죠. 기술 뿐만 아니라 사람도 사회도 계속해서 변한다는 점이야말로 현행 윤리(Ethics-in-action)를 추적하고 분석할 때 염두에 둬야할 사실입니다.