지갑

테더, STEM 지능 훈련의 대중화를 위한 410억 토큰 AI 데이터셋 출시

1시간 전
테더, STEM 지능 훈련의 대중화를 위한 410억 토큰 AI 데이터셋 출시

세계 최대 스테이블코인 발행자가 컴퓨팅 능력을 직접 사용자에게 제공하여 인공지능을 재편하기 위한 과감한 움직임을 보였다.

테더는 금요일에 $150 billion USDT 스테이블코인의 배후 기업으로, 과학, 기술, 공학 및 수학에 초점을 맞춘 인공지능 모델 훈련을 위해 설계된 410억 토큰 합성 데이터셋인 QVAC Genesis I을 발표했다.

이 데이터셋은 AI 개발을 위한 가장 큰 공개 합성 훈련 자원을 나타내며, 디지털 결제 외의 분야에서도 테더의 다양화 전략을 의미하는 중요한 발전이다.

발표와 함께 QVAC Workbench도 공개되어, 사용자들이 클라우드 인프라나 기업 서버에 의존하지 않고 스마트폰부터 노트북에 이르기까지 개인 장치에서 직접 AI 모델을 훈련하고 실행하고 상호 작용할 수 있는 소비자 애플리케이션이다.

이러한 이중 출시를 통해 CEO 파올로 아르도이노는 현재 주요 기술 기업들이 AI 계산 및 데이터를 지배하고 있는 상황에서 "지능을 사람들에게 되돌려주기" 위한 비전을 반영하고 있다.

클라우드 의존으로부터의 해방

아르도이노는 성명에서 "지능은 중앙 집중화되어서는 안 됩니다."라며, "기관이 아닌 개인이 소유해야 한다."고 밝혔다.

이 철학은 오픈AI, 구글, 앤트로픽과 같은 기업들이 대규모 중앙 데이터 센터와 클라우드 컴퓨팅 인프라를 통해 모델 개발을 지배하고 있는 현재의 AI 패러다임에 대한 직접적인 도전을 의미한다. QVAC (QuantumVerse Automatic Computer)는 사용자 장치에서 AI를 로컬로 실행할 수 있도록 하여 개인 정보와 자율성을 유지하면서 이 권력 역학을 변화시키는 것을 목표로 한다.

Genesis I 데이터셋은 과학적 영역에서의 추론과 정확성을 특정 대상으로 삼고 있다. 테더 데이터의 발표에 따르면, 410억 개의 텍스트 토큰은 수학, 물리학, 생물학 및 의학 교육 및 과학적 기준을 검증 받았다. 이는 정확하고 전문화된 훈련 데이터가 얻기 어려운 분야이다.

합성 데이터의 부상

합성 데이터셋은 AI의 데이터 희소성 문제에 대한 중요한 해결책으로 부상했다. 실제 데이터 수집은 비용이 많이 들고 시간 소모적이며 개인 정보 문제를 수반할 수 있는 반면, 합성 데이터는 통계적 성질과 본래 정보의 패턴을 모방하는 인위적으로 생성된 데이터로 민감한 개인 정보를 노출하지 않는다.

산업 연구에 따르면, 현재의 예상치로는 AI 프로젝트 데이터의 60%가 합성 데이터가 될 것이며, 이는 GDPR과 같은 개인 정보 보호 규제와 도메인 특화 훈련 자료의 필요성에 의해 촉진되고 있다. 높은 품질의 합성 데이터는 AI 모델이 실제 데이터로 훈련된 모델의 성능의 90-95%를 달성할 수 있게 하며, 획득 비용을 60-80% 절감할 수 있다.

테더의 Genesis I 데이터셋은 이 급속히 확장되고 있는 생태계에 합류하나, 중요한 차이점이 있다: STEM 애플리케이션에 명시적으로 설계되었고, 교육 및 과학 콘텐츠에 특화된 최초의 공공에 접근 가능한 합성 데이터셋이다.

기기 내 지능: QVAC Workbench

QVAC Workbench 애플리케이션은 분산된 AI 개발을 위한 실용적인 인프라를 제공함으로써 데이터셋을 보완한다. 이 앱은 최고의 오픈 소스 모델을 지원하며 메타의 Llama, 구글의 Medgemma, 알리바바의 Qwen 및 오픈AI의 Whisper를 포함, 데이터를 기기 내에서 처리하며 개인 정보를 유지한다.

아르도이노는 "QVAC Workbench 와 Genesis I로 우리는 무한한 지능의 문을 열고 있습니다. 이는 당신의 장치에서 현지에서 역동적으로 변화하며 살아가는 AI입니다."라며, "폰이든, 로봇이든, 웨어러블이든, 지능은 기관이 아닌 개인이 소유해야 합니다."라고 밝혔다.

플랫폼의 모듈식 아키텍처는 개발자들이 작고 조합 가능한 구성 요소를 사용하여 애플리케이션을 구축할 수 있게 하며, P2P 네트워킹은 중앙 서버가 없이 직접적인 기기 간 통신을 촉진한다. 이 설계를 통해 QVAC 생태계는 이론적으로 수조 개의 AI 에이전트와 애플리케이션으로 확장할 수 있으며, 단일 오류 지점이 존재하지 않게 된다.

테더의 Wallet Development Kit (WDK)을 통한 통합 결제로 AI 에이전트는 비트코인과 USDT로 전자상거래를 자동으로 수행할 수 있으며, 독립적으로 상업을 행할 수 있는 자급자족 AI 시스템의 가능성을 열어준다.

스테이블코인 이상의: 테더의 공격적 다양화

AI 이니셔티브는 테더의 공격적인 다양화 전략의 최신 장을 나타낸다. 2024년에 $13 billion의 수익을 보고한 이 회사는 에너지, 농업, 미디어 및 기술 인프라 등 스테이블코인 핵심 사업을 넘어 체계적으로 확장하고 있다.

최근 투자 목록에는 이탈리아 미디어 회사 Be Water에 1천만 유로 지분 참여, 비디오 플랫폼 Rumble에 7억 75백만 달러 투자, 농업 기업 Adecoagro의 70% 지분 등을 포함한다. 또한 이 회사는 미국 재무부 국채를 1천 200억 달러 이상 보유하고 있으며, 이는 세계에서 19번째로 큰 보유액으로 독일의 보유액을 초과한다.

테더는 작년에 오픈 소스 Wallet Development Kit을 도입했으며, 이를 통해 인간, 기계 및 AI 에이전트가 안전하고 자주 관리 가능한 지갑을 빌드하고 USDT 및 비트코인을 사용하여 거래할 수 있게 한다. 이러한 전략적 위치는 테더를 암호 화폐 인프라와 분산형 AI 개발이라는, 기술 분야에서 가장 빠르게 성장하는 두 개의 도메인 교차점에 위치시킨다.

경쟁 구도

테더의 움직임은 2027년까지 합성 데이터 생성이 20억 달러를 초과할 것으로 예상되는 상황에서 나온 것이며, Mostly AI, Synthesis AI 및 DataGen과 같은 주요 기업들이 상업적 개발을 주도하고 있다. Waymo와 테슬라와 같은 회사들은 이미 희귀하고 위험한 시나리오로 자율주행차 시스템을 훈련하기 위해 합성 데이터를 광범위하게 사용하고 있다.

환자 데이터 개인정보 보호가 AI 개발에 상당한 장벽을 초래하는 의료 분야에서도, 합성 데이터는 솔루션을 제공하여, 통계 패턴을 유지하면서 실제 신원을 노출하지 않고 모사환자 기록을 제공한다. 금융 기관들도 개인 정보 보호 규정을 준수하면서 사기 탐지 시스템을 훈련하기 위해 합성 데이터를 채택했다.

테더가 제공하는 경쟁 우위는 암호화폐 인프라와의 통합 및 오픈 소스 개발에 대한 헌신에 있다. 회사는 수개월 내에 포괄적인 소프트웨어 개발 키트를 출시하여 개발자들이 자신들의 QVAC 에이전트를 다양한 디바이스에서 빌드하고 배포하고 확장하기 쉽게 만들 계획이다.

최종 생각

아르도이노는 "AI를 사용하는 데 API 키가 필요하다면, 그것은 진정한 당신의 것이 아닙니다."라며, QVAC 이니셔티브의 철학적 근간을 강조했다. 이 발언은 중앙 집중식 AI 인프라에 대한

About this text, concerns are growing that a few corporations control both computational resources and data pipelines that power modern artificial intelligence.

By enabling AI models to run entirely offline on personal devices, QVAC addresses key privacy vulnerabilities inherent in cloud-based systems. The approach ensures users maintain complete control over their data, computation, and autonomy - values closely aligned with cryptocurrency's core principles of decentralization and self-sovereignty.

Tether's QVAC Genesis I and Workbench are not mere products; they represent a philosophical statement about the future of artificial intelligence. Whether the initiative can successfully challenge Big Tech's dominance remains to be seen, but the 41-billion-token dataset. Content: 기기 내 인프라가 개발자에게 기업의 편의보다 사용자 제어를 우선시하는 AI 시스템을 구축할 수 있는 전례 없는 도구를 제공합니다.

"무한 지능"의 시대는 아르도이노가 정의한 대로 이제 막 시작되었을지도 모릅니다 - 그리고 이번에는 실제로 모두의 것이 될지도 모릅니다.

면책 조항: 본 기사에서 제공되는 정보는 교육 목적으로만 제공되며 금융 또는 법률 조언으로 간주되어서는 안 됩니다. 암호화폐 자산을 다룰 때는 항상 자체 조사를 수행하거나 전문가와 상담하십시오.
관련 뉴스
관련 연구 기사