생성형 AI

로봇은 읽을 수 있지만, 인간은 읽을 수 없는

저작권이 AI시대 창작자의 권리를 보호할 수 있을까요?

🍊산디

30 7월 2025 — 11 min read

노릇한 식빵

문제는, 정말로 씨를 뿌린 자는 누구이며 애초에 그 씨앗이 어디에서 왔느냐 하는 것이다.
—데이비드 벨로스 & 알렉상드르 몬터규, <이 문장은 누구의 것인가: 현대 사회를 움직이는 저작권의 역사>

목차
1. 로봇은 읽을 수 있지만, 인간은 읽을 수 없는

💌 AI 윤리 레터 응원하러 가기 💌

로봇은 읽을 수 있지만, 인간을 읽을 수 없는

by 🍊산디

지난 7월 23일, <AI 저작권 이슈 논의를 위한‬ 시민사회 간담회‬>에 다녀왔습니다. 오늘은 간담회에서 나눈 발제를 간략히 공유해보려 합니다.

지식과 정보가 사유화되는 것을 막기 위해 싸워 왔던 정보 인권 운동은 AI를 맞아 어려운 질문에 마주하고 있습니다. 지식과 정보가 자유롭게 공유되어야 한다는 이상이 생성형 AI 학습 데이터 수집의 법적 근거이자 당위를 제공했기 때문입니다. 생성형 AI는 분명 인류의 문화 생활을 풍성하게 하는 발전이지만, 창작자들은 생성형 AI로 인한 시장 잠식을 우려하고 있습니다.

저작권법은 AI 시대에 이르러 창작자들이 겪는 문제에 대해 이렇다 할 답을 내놓지 못하고 있습니다. 이는 저작권법이 1) 학문의 장려를 위해 2) 인간의 복제 행위를 염두에 두고 설계되었기 때문입니다.

학문의 장려를 위한 법

세계 최초의 저작권법이라 불리는 1710년 앤여왕법은 “학문의 장려를 도모하기 위한 법(An Act for the Encouragement of‬ Learning)”이라고 스스로를 정당화했습니다. 저작권법이 과연 이러한 목적을 달성하는 데 효과적인 수단인지 대해서는 논쟁의 여지가 있습니다만, 여전히 세계 각국의 저작권법은 대체로 학문, 문화, 창작과 그 관련 산업의 발전을 목적으로 합니다. 이에 따라 저작권법은 법을 적용함에 있어 저작물에 대한 독점적 특권을 보호하는 것이‬ 창작 활동을 저해하는지를 검토합니다.

그래서 만약 타인의 저작물을 이용하는 것이 원저작물에 새로운 가치를 추가하는 것으로‬ 이해된다면, 예를 들어 원저작물이 원재료로 활용되어 새로운 정보, 새로운 미감(aesthetics), 새로운‬ 통찰력 및 이해를 이끌어낸다면, 이는 유의미한 창작 즉, 변형적 이용으로 판단되어 저작권 침해로부터 보호 받게 됩니다.

지난 🦜레터에서 소개해드렸던, 앤트로픽의 저작권 관련 판결도 마찬가지입니다. 법원은 앤트로픽이 ‬‭’합법적으로 구매한’‬ 서적을 디지털화하여 AI 모델을 학습시킨 건에 대해 변형적 이용으로 보았습니다. 위 판결은‬ 클로드의 저작물 학습이 “매우 변형적인(exceedingly transformative)”, “본질적으로‬ 변형적인(quintessentially transformative)”, “대다수의 사람들이 생에 마주할 가장‬ 변형적인(among the most transformative many of us will see in our lifetime)”‬ 것이라고 찬탄했죠.

오늘날 생성형 AI는 ‘혁신’ 그 자체로 받아 들여지고 있습니다. 앤트로픽 판결에서 나타나는 법원의 시각은 AI에 대한 매우‬ 일반적인 태도이지요. 저작권법이 학문, 문화, 창작과 그 관련 산업의 발전을‬ 도모한다는 것을 다시 떠올려 봅시다. 생성형 AI가 (그 방향을 예측하기는 어려우나) 인류의 문화와 관련 산업에 일대 혁신을‬ 야기할 것으로 예상되는 바, 저작권법이 인공지능의 학습을 위한 저작물 활용을 변형적 이용이‬ 아니라고 판단하기는 어려울 수 있습니다.

‭인간의 복제 행위를 규율하기 위한 법‬

1710년에 처음 제정되었다는 사실에서 알 수 있듯, 당연하게도 저작권법은 인간 독자를 상정하고 만들어졌습니다. 즉, 저작권법은 오랫동안 인간의 복제 행위를 규제해 왔습니다. 반면 로봇의 읽기는 의도적이지도 않을 뿐더러 문화 향유를 목적으로 하는 것도 아니었죠. 인터넷이 확산되고 로봇의 읽기(크롤링)가 일반화되는 과정에서 과연 로봇의 읽기가 저작권 침해인지 다투는 사례들이 속속 등장합니다.

대부분의 경우, 로봇의 읽기는 많은 경우 새로운 서비스와 연관되어 있었습니다. 검색 서비스가 대표적인 사례였지요. 앞서 살펴보았듯이 저작권법은 학문, 과학, 문화와 관련 산업의 발전을 목적으로 합니다. 만약 로봇의 읽기를 저작권 침해로 본다면 인터넷이 지금과 같이 꽃 피우지는 못했을 겁니다.

이에 ‭저작권법과 관련하여 미국에서는 로봇의 읽기에 관한 고무적인 판결들이 등장합니다. 저작권 이슈에서 자주 논의되는 변형적‬ 이용(transformative use) 법리도 그 사례 중 하나입니다. 이외에도 미국의 저작권법 관련 판례들은 정보를 획득, 정확성 검증, 편집하는 데 노력을 기울인 주체에게는 데이터베이스에 대한 권리를 인정하는 것이나, 이용자가 저작권을 침해했더라도 인터넷 사업자는 책임을 지지 않도록 하고 있습니다. 일본의 저작권법이 “‭인간이 저작물의 사상·감정을 향유하려는 것이 아니라면” 저작물의 복제와 이용을 허용하도록 개정된 것 역시 인간의 읽기 행위만 규제하려는 저작권법의 노력을 보여줍니다.

이러한 법리들은 결과적으로 인간의 읽기는 규율하되, 로봇의 읽기는‬ 허용하는 역설적인 상황을 초래했습니다. 로봇의 읽기에 대한 관대한 태도는 로봇을 활용한 대량의 복제(bulk copying)를 허용했죠.‬ 그 덕에‬ AI 기업들은 생성형 AI 개발에 필요한 자원을 획득할 수 있었습니다.

로봇의 읽기가 창작자에게‬ 유리한 면도 있습니다. 온라인 콘텐츠 생태계가 유지되었던 전통적인 방식은 (구글을 필두로 하여)‬ 창작자가 자신의 콘텐츠를 검색 가능하도록 허용하면, 구글이 검색 서비스를 통해 트래픽을‬ 유도하는 것이었는데요. 구글과 같은 검색 엔진의‬‭ 크롤링‬ 대 레퍼럴 비율‬‭은 약 18:1 수준으로, 크롤링이 14번 발생하면 한 명 정도는‬ ‭원본 사이트에‬ 접속했습니다. 하지만 AI 시대, 이러한 균형은 심각하게 흔들리고 있습니다. AI 크롤러의 크롤링 대 레퍼럴 비율이 1,700:1~17,000:1(오픈AI) 심지어 73,000:1(앤트로픽)에 달하는 것으로 알려지면서, 사실상 데이터 수탈이 이루어지고 있다는 문제의식이 심화되게‬ 되었죠.‬

AI 로봇의 접근을 차등하려는 시도들

이러한 연유에서 인간의 읽기는 허용하되, 로봇의 읽기에 대해서는 차등 대우를 하려는 시도들이‬ 등장하고 있습니다.‬

출처: 콘텐츠 독립선언을 외치는 클라우드플래어. 웹 크롤링 봇에 자동 과금 할 수 있는 페이 퍼 크롤을 선보였다.

AI 학습 중독 공격(poisoning attack): 시카고 대학의 ‬‭벤 자오‬‭ 교수는 ‬‭글레이즈‬,‬ 나이트셰이드‬‭ 등 로봇의 무분별한 읽기를 제한하는 툴을 개발합니다. 이 툴들은 인간은 저작물을 그대로 읽을 수 있지만 AI 학습 과정에서는‬ ‘독성이 있는’ 샘플로 변환하여 AI 모델을 손상시키죠. 연구자들은 창작자에게 AI 학습 라이센스를 지불하도록 하는 것이 합리적인 선택지가 되기 위해서는 이러한 툴이 필요하다고 주장합니다.
페이 퍼 크롤(Pay Per Crawl, PPC): ‭네트워크 서비스 기업 ‬‭클라우드플래어‬‭는 웹 크롤링을 위해 접근하는 봇에 자동으로‬ 과금할 수 있도록 하는 페이 퍼 크롤 규칙을 선보였습니다. 클라우드플레어는 신규‬ 웹사이트에게 AI 크롤러 ‘차단’을 기본값으로 제공하고, 이를 옵트아웃 할 수 있게‬ 한다고 발표했는데요. 기존 HTTP 402 Payment Required 상태 코드를 부활시킴으로써‬ AI 크롤러가 자동으로 비용을 지불해야만 웹사이트의 콘텐츠를 크롤링 할 수‬ 있도록 했습니다. 이로써 웹사이트 소유자는 AI 크롤러를 완전히 허용하거나,‬ 요금을 청구하거나, 완전히 차단하는 세 가지 선택지를 가질 수 있게 됩니다.‬ 클라우드플래어는 인공지능 크롤링 금지 지침을 따르지 않는 봇을 걸러내고 허송세월하게 하는 함정 "‬‭AI 미로(AI Labyrinth)‬‭"을 소개하기도 했습니다.‬

🦜