데이터 파운데이션, 수십억 달러 규모의 AI 학습 데이터 병목 해소 위해 출범

스토리가 데이터 파운데이션으로 리브랜딩하고 Kled 통합·Trace 출시로 AI 학습 데이터 출처·라이선스·보상 인프라를 온체인에서 제공한다.
6시간 전
데이터 파운데이션, 수십억 달러 규모의 AI 학습 데이터 병목 해소 위해 출범

미국 캘리포니아주 팔로알토, 2026년 6월 25일, Chainwire

Story, 데이터 파운데이션으로 리브랜딩 후 DATA Network와 대표 통합사례인 Kled AI 연동 출시, 플랫폼에 15억 건의 사용자 기여 기록 등록

또한 재단은 동의, 라이선스, 데이터 출처를 대규모로 감사하기 위한 첫 퍼블릭 감사 레이어 ‘Trace’를 선보인다

오늘 Story는 전략적 전환을 통해 데이터 파운데이션 (“DATA”)이 된다고 발표하고, AI 학습 데이터의 출처와 라이선스를 위한 온체인 레지스트리인 Trace를 출시했다. 이번 출시에는 세계 최대 옵트인(동의 기반) 인간 데이터 마켓플레이스인 Kled와의 대표 통합이 포함되며, 네트워크에 15억 건의 사용자 기여 기록을 등록한다. 안드레아 무토니(Andrea Muttoni)가 데이터 파운데이션의 CEO가 되었으며, Kled의 창업자 아비 파텔(Avi Patel)은 최고데이터책임자(CDO) 자문으로 합류한다. 

AI 학습 데이터는 병목에 직면했다

DATA로의 전환은 시장이 가장 강하게 요구하는 방향을 반영한다. AI 학습 데이터는 가장 가치 있으면서도 가장 덜 해결된 IP 범주로 떠올랐다. 프런티어 AI 연구소들은 인터넷을 사실상 스크래핑 가능한 한도까지 소진해 버리며 수십억 달러 규모의 데이터 병목에 부딪혔다. 남은 공급은 비싸고 주문 제작식이거나 법적으로 문서화되지 않아, 연구소들은 대규모로 데이터를 조달하고, 출처를 입증하며, 품질을 보장할 수 있는 방법이 없는 상황이다.

프런티어 연구소들이 불투명한 네트워크를 통해 조달한 데이터에 기반해 시장을 정의할 제품을 내놓으면서, 법적 위험도 커지고 있다. 동의나 관할권에 대한 명확한 기록 없이 수집된 데이터가 많기 때문이다. 스크래핑된 비문서화 데이터는 더 이상 엔터프라이즈급 AI에 적합한 선택지가 아니다.

“AI에서의 도전은 연산과 아키텍처에서 소싱과 출처로 옮겨갔습니다. 스크래핑 가능한 웹이 조각나고 있는 지금, 연구소들이 던지는 질문은 ‘누가 영수증을 챙기고 있느냐’입니다.”라고 데이터 파운데이션 CEO 안드레아 무토니는 말했다. “Kled와 함께, 우리는 지구상에서 가장 큰 AI 학습 데이터 풀에 완전한 데이터 투명성과 감사 가능성을 결합합니다.”

신뢰할 수 있는 AI 데이터를 위한 인프라 구축

DATA는 인터넷을 위한 데이터 및 지식재산(IP) 레이어를 구축한다는 기존 미션 위에 서 있으며, 이 시대에 가장 중요한 데이터와 IP의 형태가 AI 학습 데이터라는 점을 인식하고 있다. DATA Network는 Kled와의 대표 통합을 중심으로, AI 학습을 위한 핵심 인프라를 제공한다. 오늘부터 Kled의 라이선스 레일과 기여자 영수증은 DATA Network 위에서 구동되며, 스테이블 코인 지급도 지원한다. 이는 프로그램적 법적 보호 장치를 수반한 15억 건의 사용자 기여 기록을 등록하는 일이다.

“프런티어 연구소들은 공개 웹에서 구할 수 있는 고품질 인간 생성 공개 텍스트 공급을 이미 소진했습니다. 데이터 출처를 증명할 수 있는 공급자가 앞으로 10년의 딜을 가져갈 것이고, 그것이 우리의 베팅입니다.”라고 Kled의 CEO이자 창립자, 그리고 데이터 파운데이션 파트타임 자문 CDO인 아비 파텔은 말했다. “데이터를 눈먼 상태로 소싱하는 대신, Kled의 데이터 마켓플레이스와 DATA의 감사 가능한 연속적 관리 체인은 연구소들이 자신 있게, 투명하게 데이터를 라이선싱하는 데 실제로 필요한 지점에서 만납니다.” 

AI 학습 데이터를 위한 퍼블릭 감사 레이어로 Trace 출범

데이터 파운데이션의 퍼블릭 감사 및 검색 플랫폼인 Trace도 Kled 통합과 함께 오늘 출시된다. Trace는 모든 기여에 대해 불변이며 기밀성을 지닌 영수증을 생성해, 연구소들이 데이터셋의 정당성을 몇 초 만에 검증할 수 있도록 한다. 전 세계 사용자가 업로드하는 개별 기록마다 DATA 위에 영수증이 생성되어, 기여자의 데이터와 지식재산에 대한 상류 보상이 가능해진다. 이는 법적·운영적 지뢰밭이 되어버린 AI 학습 데이터 시장에서, 검증 가능하고 규정을 준수하는 시장에 대한 긴급한 수요를 해결한다.

더 넓어진 기여자 네트워크

DATA의 논지는 Story가 인큐베이팅한 AI 데이터 처리 프로젝트 Poseidon에 의해 입증되었다. Poseidon은 원시 인간 데이터를 정제·정규화·점수화하여 진위성과 품질을 보장함으로써, 구매자에게 도달하는 모든 기록이 모델 준비 상태가 되도록 한다. Poseidon은 프런티어 연구소에서의 초기 트랙션을 통해 AI 학습 데이터 기회를 증명했다. a16z의 지원을 받으며 이제 전적으로 DATA 위에서 운영되는 기여자 앱 Numo는 이미 런칭되어 있으며, 수천 명의 기여자에게 실시간 지급과 함께 AI 경제로의 진입 통로를 제공한다. 

“우리는 인터넷을 위한 IP 레이어를 만들기 위해 Story를 시작했고, 이 시대에서 가장 중요한 IP는 스크랩할 수 없는 데이터입니다. 외과의의 손 움직임, 로봇이 물체를 쥐는 방식, 사람들이 현실 세계에서 말하고, 운전하고, 일하는 방식 같은 것들이죠.”라고 PIP Labs CEO이자 데이터 파운데이션 전략 고문인 SY Lee는 말했다. “DATA는 그 확신이 다음으로 나아가는 곳입니다. 현실 세계 데이터의 출처를 증명하고, 라이선스를 부여하며, 그것을 만든 사람들에게 보상하는 엔드투엔드 네트워크죠.”

토큰 마이그레이션과 생태계 연속성

$IP 토큰은 기존 보유자의 별도 조치 없이 1:1 비율로 $DATA로 마이그레이션된다. 마이그레이션 안내, 거래소 전환 일정, FAQ는 here에서 확인할 수 있다.

데이터 파운데이션 소개

Data는 프런티어 AI에서 가장 큰 병목이다. 모델이 가장 필요로 하는 데이터는 사람과 기업에 갇혀 있거나, 아직 존재하지 않으며, 인센티브가 정렬되기 전까지는 생성되지도 않을 것이다. DATA Network는 모든 연구소가 던지는 세 가지 질문, 즉 “대규모로 데이터를 조달할 수 있는가, 어디서 왔는지 증명할 수 있는가, 품질을 보장할 수 있는가”에 답하기 위해 구축된 세계의 AI 감사 레일이다. Numo와 Kled를 포함한 기여자 앱은 옵트인 인간 데이터를 공급하고, Trace는 모든 기록에 대해 공개적이고 변조 불가능한 영수증을 부여하며, Poseidon은 이를 모델 준비가 완료된 데이터셋으로 전환해 프런티어 AI가 신뢰할 수 있는 토대 위에서 계속 전진할 수 있도록 한다. $IP는 이제 $DATA다. 더 많은 정보는 datafdn.org에서 확인할 수 있다. 

문의

HV
[email protected]

면책 조항: 이는 발행자가 제공한 서드파티 콘텐츠로, 정보 제공 목적만을 위해 게시되었습니다. Yellow는 본문에 포함된 내용을 독립적으로 검증하지 않으며, 오류나 누락에 대해 어떠한 책임도 지지 않습니다. 이는 투자, 법률, 회계 또는 세무 관련 조언이나 어떤 자산의 매매 권유를 구성하지 않습니다.
최신 보도 자료
전체 보도자료 보기