Skip to content

WT快讯

WeTrying | 币圈快讯早知道

Menu
  • 首页
  • 工具包
Menu

Flower AI 和 Vana 正在构建无需数据中心的先进 AI 模型

Posted on 2025-05-02 17:39

一种新的众包训练方式通过互联网开发大型语言模型(LLMs),可能会在今年晚些时候以一个巨大的1000亿参数模型震撼AI行业。

研究人员利用分布在全球的GPU,并结合私有和公共数据,训练了一种新型的大型语言模型(LLM),这一举动表明,构建人工智能的主流方式可能会被颠覆。Flower AI和Vana这两家初创公司,采用非常规的方法共同创建了这一新模型,名为Collective-1。

Flower公司开发了可以将训练分散到数百台通过互联网连接的计算机上的技术。该公司的技术已经被一些公司用于训练AI模型,而无需集中计算资源或数据。Vana则提供了包括来自X、Reddit和Telegram的私密消息在内的数据源。

在现代标准下,Collective-1的规模相对较小,拥有70亿个参数——这些参数的组合赋予了模型其能力——相比之下,今天最先进的模型如ChatGPT、Claude和Gemini的参数数目达到数百亿。剑桥大学计算机科学家、Flower AI的联合创始人Nic Lane表示,分布式的方法承诺将远远超出Collective-1的规模。Lane补充说,Flower AI正在使用常规数据训练一个拥有300亿参数的模型,并计划在今年晚些时候训练另一个拥有1000亿参数的模型——接近行业领导者的规模。“这可能会真正改变人们对AI的看法,所以我们对此非常努力,”Lane说。他表示,该初创公司还在训练中加入图像和音频,以创建多模态模型。

分布式模型构建也可能动摇塑造AI行业的权力动态。目前,AI公司通过将大量训练数据与集中在数据中心的强大计算能力结合来构建模型,这些数据中心配备了先进的GPU,并通过超高速光纤电缆连接在一起。它们还严重依赖通过抓取公开可访问的(尽管有时是受版权保护的)材料,包括网站和书籍,创建的数据集。

这种方法意味着,只有最富有的公司和拥有大量强大芯片的国家才能够开发出最强大和最有价值的模型。即使是开源模型,如Meta的Llama和DeepSeek的R1,也是由拥有大型数据中心的公司构建的。分布式方法可能使较小的公司和大学能够通过汇聚不同的资源来构建先进的AI。或者,它可能允许缺乏传统基础设施的国家将多个数据中心联网,以构建更强大的模型。

Lane相信,AI行业将越来越多地寻求新的方法,使训练突破单个数据中心的限制。他说:“分布式的方法让你能以比数据中心模型更优雅的方式扩展计算能力。”

安全与新兴技术中心的AI治理专家Helen Toner表示,Flower AI的方法“有趣且可能非常相关”于AI竞争和治理。“它可能会继续在前沿技术方面挣扎,但可能是一个有趣的快速跟随者的方法,”Toner说。

分而治之

分布式AI训练涉及重新思考用于构建强大AI系统的计算方式的划分。创建一个LLM涉及将大量文本输入模型,模型调整其参数以产生对提示的有用响应。在数据中心内部,训练过程被划分,以便可以在不同的GPU上运行部分,然后定期合并为一个主模型。

新的方法允许通常在大型数据中心内部完成的工作在可能相隔数英里并通过相对较慢或不稳定的互联网连接连接的硬件上进行。

一些大公司也在探索分布式学习。去年,谷歌的研究人员展示了一种新的计算划分和整合方案,称为DIstributed PAth COmposition(DiPaCo),使分布式学习更加高效。

为了构建Collective-1和其他LLMs,Lane和来自英国和中国的学术合作者开发了一种名为Photon的新工具,使分布式训练更高效。Lane表示,Photon在数据表示和共享及整合训练方面比谷歌的方法更高效。该过程比常规训练慢,但更灵活,允许添加新硬件以加速训练。

Photon是与北京邮电大学和浙江大学的研究人员合作开发的。该团队上个月以开源许可证发布了该工具,允许任何人使用这一方法。

Flower AI在构建Collective-1的努力中与Vana合作,Vana正在开发新的方法,让用户与AI构建者共享个人数据。Vana的软件允许用户贡献来自X和Reddit等平台的私密数据用于训练大型语言模型,并可能指定允许的最终用途,甚至从他们的贡献中获利。

Vana 的联合创始人Anna Kazlauskas表示,这一想法是使未开发的数据可用于AI训练,同时也给予用户对其信息如何用于AI的更多控制。“这些数据通常无法被纳入AI模型,因为它们并不是公开可用的,”Kazlauskas说,“这是用户首次直接贡献的数据被用于训练基础模型,用户拥有他们的数据所创建的AI模型的所有权。”

伦敦大学学院的计算机科学家Mirco Musolesi表示,分布式AI训练的一个关键好处可能是解锁新类型的数据。“将其扩展到前沿模型将使AI行业能够利用大量去中心化和隐私敏感的数据,例如在医疗和金融领域进行训练,而不必面临数据集中化带来的风险,”他说。

你对分布式机器学习有什么看法?

相关

文章类型

  • 文章 (7,850)
  • 页面 (1)

分类目录

  • 快讯 (7,474)
  • TechFlow (6,331)
  • 未分类 (311)
  • 重要消息 (45)
  • 项目重要进展 (9)

年

  • 2025 (7,851)

近期文章

  • Coinbase 国际站将上线 HOME 和 SPK 永续合约
  • 特朗普:已完全掌握伊朗领空
  • Layer 2 网络 Ink 宣布拟推出原生代币 INK,总供应量为 10 亿枚
  • 万斯:特朗普可能会采取进一步行动阻止伊朗核计划
  • 今日加密货币市值前100代币涨跌:XMR涨2.63%,KAS跌11.95%

归档

  • 2025 年 6 月
  • 2025 年 5 月
  • 2025 年 4 月

分类

  • 1kx (1)
  • 21Shares (1)
  • a16z (1)
  • Aave (3)
  • ai16z (1)
  • Alameda Research (1)
  • Alpaca (1)
  • Arbitrum (1)
  • Ark Invest (1)
  • Arkham (1)
  • Avail (1)
  • Azuki (1)
  • Base (1)
  • Berachain (1)
  • Bitget (8)
  • BlackRock (3)
  • Brian Armstrong (1)
  • BTC (4)
  • Bybit (2)
  • Canary (1)
  • Cathie Wood (1)
  • Coinbase (3)
  • Coinbase Prime (2)
  • Coinbase Ventures (3)
  • CoinDesk (2)
  • CoinGecko (1)
  • Cointelegraph (1)
  • COMP (1)
  • Compound (1)
  • DAO (1)
  • DATA (2)
  • DeAI (1)
  • DePIN (1)
  • DEX (3)
  • EARN (1)
  • Eliza (1)
  • ETF (4)
  • ETH (4)
  • Ethos Network (1)
  • Fartcoin (2)
  • FDUSD (1)
  • FLock.io (1)
  • FLUID (1)
  • FUEL (1)
  • Gas (2)
  • GPU (1)
  • Grayscale (1)
  • IEO (1)
  • Inception (1)
  • IOG (1)
  • Jupiter (1)
  • Kairos (1)
  • Kaito (1)
  • Launchpool (1)
  • Layer2 (1)
  • Liquidity (1)
  • Magicblock (1)
  • Mango Markets (1)
  • Mechanism Capital (1)
  • Meebits (1)
  • Meme (3)
  • Netflix (1)
  • NVIDIA (1)
  • Ondo (1)
  • OpenAI (2)
  • Paradigm (1)
  • Polygon (3)
  • Pudgy Penguins (1)
  • pump.fun (1)
  • Raydium (2)
  • Robert Leshner (1)
  • Robinhood (1)
  • Sam Altman (1)
  • SEC (4)
  • Securitize (1)
  • SideKick (1)
  • SNX (1)
  • SOL (1)
  • Solana (3)
  • Stani Kulechov (1)
  • StarkWare (1)
  • STO (1)
  • Stripe (1)
  • SunDog (1)
  • SunPump (1)
  • Synthetix (1)
  • TechFlow (6,331)
  • The Block (2)
  • Tron (2)
  • TRX (1)
  • Upbit (1)
  • USDC (3)
  • WBTC (2)
  • Web3 (4)
  • WLD (1)
  • WOO X (1)
  • Xai (1)
  • Zora (1)
  • 交易所动态 (8)
  • 人工智能 (1)
  • 以太坊 (4)
  • 以太坊基金会 (1)
  • 信托 (1)
  • 借贷 (2)
  • 公链 (1)
  • 基础设施 (1)
  • 大额投融资 (1)
  • 存储 (2)
  • 孙宇晨 (2)
  • 安全 (2)
  • 富达 (1)
  • 工具 (2)
  • 币安 (7)
  • 快讯 (7,474)
  • 托管 (1)
  • 指数 (1)
  • 支付 (1)
  • 数据 (6)
  • 数据追踪 (4)
  • 智能合约 (1)
  • 未分类 (311)
  • 模块化 (1)
  • 欧洲 (1)
  • 欧盟 (1)
  • 比特币 (7)
  • 永续合约 (1)
  • 治理 (1)
  • 波场 (1)
  • 游戏 (3)
  • 火币 (1)
  • 灰度 (1)
  • 特朗普 (5)
  • 社交 (2)
  • 稳定币 (3)
  • 空投 (6)
  • 纳斯达克 (1)
  • 美国 (6)
  • 美国证券交易委员会 (3)
  • 英伟达 (2)
  • 英国 (1)
  • 萨尔瓦多 (1)
  • 融资 (3)
  • 行情异动 (7)
  • 贝莱德 (1)
  • 质押 (4)
  • 赵长鹏 (1)
  • 跨链 (3)
  • 跨链桥 (1)
  • 迪拜 (1)
  • 重要消息 (45)
  • 金库 (1)
  • 钱包 (4)
  • 阿根廷 (1)
  • 阿里云 (1)
  • 隐私 (2)
  • 项目重要进展 (9)
  • Bluesky
  • Mail
©2025 WT快讯 | Design: Newspaperly WordPress Theme