레딧의 데이터 이중 플레이: '인민의 전선'이 '인민의 데이터'를 팔다

작성자
Peperoncini
11 분 독서

레딧의 데이터 이중 잣대 논란

자유로운 발언을 위한 글로벌 시민 회관을 지어놓고, 이웃이 방문하자 입장료를 받는다고 상상해 보라. 이것이 AI 시대에 레딧이 보여준 가장 최근의 반전이다.

(뉴욕) 사람들이 비밀을 털어놓고, 밈을 주고받으며, 끝없는 논쟁을 벌이는 왁자지껄한 온라인 시장 레딧이 갑자기 질투심 많은 문지기처럼 문을 지키기 시작했다. 한때 개방적인 대화의 장이었던 이 플랫폼은 최근 구글, 오픈AI와 같은 AI 거대 기업들에게 수많은 사용자 대화 기록을 넘기는 두둑한 계약을 체결했다. 그리고 지금은? 입장권 없이 같은 자료를 가져갔다며 경쟁사를 고소했다.

맨해튼 법정에서 레딧은 빠른 답변을 제공하는 AI 서비스 퍼플렉시티를 상대로 과감한 소송을 제기했다. 레딧은 퍼플렉시티가 "대규모 디지털 습격"을 감행했다고 비난한다. 그들은 이 신생 기업이 교활한 스크래핑 업체들과 함께 레딧의 장벽을 우회해 수년간의 게시물과 의견을 싹쓸이했다고 주장한다. 이는 똑똑한 봇을 훈련시키는 데 필요한 원료다.

그러나 더 깊이 파고들면, 우리의 불완전한 웹 시대를 대변하는 기묘한 아이러니가 드러난다. 레딧은 스스로를 인터넷의 활기찬 사랑방으로 자처하며, 자원봉사자들이 만들어낸 가공되지 않은 소중한 자료들로 번성했다. 하지만 이제 주먹을 불끈 쥐고, 그 자료들이 모두에게 공짜가 아니라 영리한 판매자들을 위한 고급 재고라고 주장하고 있다. 알다시피, 한쪽에게 유료 파트너십은 다른 쪽에게는 노골적인 사기가 된다. 설사 둘 다 우리와 놀랍도록 비슷하게 똑똑함을 모방하는 AI를 만들어낸다 해도 말이다. 차이점은? 영리한 의도가 아니라 현금 지급 여부다.

저작권이나 디지털 밀레니엄 저작권법(DMCA)과 같은 해묵은 법 조항은 잠시 잊어라. 이번 싸움은 AI 영역 전쟁에서 더 큰 지각 변동을 예고한다. 정통한 변호사들과 기업 고위 관계자들은 이것이 AI 붐을 일으킨 지하 "데이터 세탁" 조직의 배를 가르기 위한 권력 게임이라고 속삭인다. 레딧은 퍼플렉시티에만 그치지 않고 공범들도 끌어들인다. 리투아니아의 옥시랩스, 텍사스의 서프API, 심지어 과거 러시아 봇 무리와 연결된 모호한 업체인 AWM프록시까지 말이다. 이는 최종 구매자만이 아니라 전체 블랙마켓 파이프라인에 불을 지르는 것과 같다.

레딧의 메시지는 분명하다. 이제 돈을 내지 않고서는 웹의 끝없이 쏟아지는 정보를 공짜로 취할 수 없다. 입장하려면 상당한 대가를 치러야 한다는 것이다. 그리고 그들은 자신들의 허세를 뒷받침할 증거도 가지고 있다.

미끼와 함정 수법

레딧은 고상한 말만 앞세우지 않았다. 그들이 제출한 소장에는 교묘한 숨바꼭질이 그려져 있다. 지난 5월, 그들은 퍼플렉시티에 "중단하라"는 엄중한 경고를 보냈다. 불법 취득이 줄었을까? 아니다. 오히려 퍼플렉시티의 답변에 레딧 자료 언급이 급증했는데, 이는 경고를 무시하는 듯한 도발이었다.

이에 레딧의 기술 전문가들은 첩보 스릴러에서나 나올 법한 고전적인 술책을 꾸며냈다. 그들은 "허니팟"을 심었다. 구글 검색 엔진 한편에 숨겨져 있어 외부의 시선을 차단한 가짜 게시물이었다. 몇 시간 후, 퍼플렉시티는 그 가짜 게시물의 내용을 답변으로 뱉어냈다. 이것이 결정적인 증거였다. 교묘한 중간 대리 서버(프록시)를 통한 우회 접속의 증거이지, 정중한 엿보기가 아니라는 점이다.

퍼플렉시티는 수십 년 전 레딧을 탄생시킨 바로 그 불씨, 즉 자유로운 웹을 옹호하는 고상한 태도로 반격한다. 그들은 아직 소장을 보지 못했다고 말하지만, "개방성과 공익"을 보호하며 정확한 사실을 제공하겠다고 맹세한다. 이것은 신념의 충돌이다. 지식은 자유롭게 흐르는 강인가, 아니면 통제된 저수지인가? 문제는? 레딧의 "울타리 치기" 열풍은 지난 2월 구글과의 연간 6천만 달러(약 826억 원) 규모의 계약 소문이 도는 등 막대한 수익이 들어오기 시작한 후에야 불붙었다는 점이다.

한 날카로운 데이터 거래인은 이렇게 꼬집었다. "그들은 칩에 단층선을 새겼다. 구글이나 오픈AI처럼 돈을 내면 황금 같은 존재가 되고, 돈을 아끼면 악당이 된다. 똑같은 자료, 똑같은 수법이지만, 은행 송금 알림이 없다는 것만이 다르다."

데이터 금고 해킹

법적으로 레딧은 AI 기반의 모방 주장이라는 골치 아픈 쟁점(판사들을 혼란에 빠뜨리는 공정 사용 논란)을 건너뛴다. 대신, 디지털 밀레니엄 저작권법(DMCA)의 엄격한 우회 방지 규정에 집중한다. 그것은 단순히 자료를 훔치는 것이 아니라, 문을 강제로 열고 자료를 빼내는 것에 관한 것이다.

법원들은 CAPTCHA 미로나 방화벽 같은 디지털 해자를 뚫는 행위에 대해 오랫동안 제재를 가해왔다. "너무 많이 빌려갔는가?" 하는 논쟁보다 훨씬 명확하다. 퍼플렉시티가 로봇 텍스트(robots.txt) 접근 금지 표지를 무시하고 프록시 서버를 통해 은폐하는 등 우회한 행위를 집중 공략함으로써, 레딧은 이 싸움을 모호한 개념에서 구체적인 해킹 행위로 끌고 간다.

만약 레딧이 조기에 승소한다면, 그 여파는 전 세계 AI 연구소를 뒤덮을 수 있다. 동의 없이 웹에서 수집된 원시 데이터를 탐식하는 모든 봇에게 비용은 치솟고 위험은 커질 것이다. 갑자기 낡은 자료실과 이미지 신디케이트부터 전문 저널과 코드 저장소에 이르기까지 모든 정보의 "문지기"들이 막강한 영향력을 행사하게 된다. 그들은 AI가 갈망하는, 인간이 만들어낸 지식(자신들의 콘텐츠)에 대해 치열하게 흥정할 것이다. 강력한 권리 주장과 견고한 장벽을 가진 대형 플랫폼들은 수익을 올리고, 개방된 웹을 공정한 사냥터로 여겼던 소규모 개발자들은 혼란에 빠질 것이다.

이번 대결은 웹의 미개척지를 새롭게 정의한다. 한쪽에는 무정부주의의 산물인 레딧이 있다. 다른 한쪽에는 대중에게 지식을 파는 퍼플렉시티가 있다. 균형추에 걸려 있는 것은? 수많은 재치 있는 말, 이미지, 영감으로 이루어진 우리의 디지털 홍수다. 집단 지성의 공유된 유산인가, 아니면 내일의 AI 엔진을 위한 값비싼 원유로서 가장 부유한 채굴자들의 손에 들어갈 것인가?

고담시티의 법정처럼 느껴지는 그곳에서 소장이 쌓여가는 동안, 지난 20년간 영웅을 찬양하고, 웃음을 터뜨리며, 슬픔을 나누고, 커뮤니티를 형성해 온 평범한 레딧 사용자들, 즉 진정한 기록자들은 관중석에 앉아 있다. 그들의 합창은? 결국 그것은 최고급 부동산임이 밝혀졌다. 이제 모두가 궁금해한다. 과연 누구의 지갑에 뜻밖의 횡재가 들어올 것인가?

당신도 좋아할지도 모릅니다

이 기사는 사용자가 뉴스 제출 규칙 및 지침에 따라 제출한 것입니다. 표지 사진은 설명을 위한 컴퓨터 생성 아트일 뿐이며 실제 내용을 나타내지 않습니다. 이 기사가 저작권을 침해한다고 생각되면, 우리에게 이메일을 보내 신고해 주십시오. 당신의 경계심과 협력은 우리가 예의 바르고 법적으로 준수하는 커뮤니티를 유지하는 데 중요합니다.

뉴스레터 구독하기

최신 기업 비즈니스 및 기술 정보를 독점적으로 엿보며 새로운 오퍼링을 확인하세요

저희 웹사이트는 특정 기능을 활성화하고, 더 관련성 있는 정보를 제공하며, 귀하의 웹사이트 경험을 최적화하기 위해 쿠키를 사용합니다. 자세한 정보는 저희의 개인정보 보호 정책 서비스 약관 에서 확인하실 수 있습니다. 필수 정보는 법적 고지