马斯克的xAI坐拥55万张英伟达GPU加速卡 利用率仅11%

坐拥约55万块英伟达GPU,实际算力利用率仅有11%,这一巨大反差让马斯克旗下 xAI 近期推向舆论风口浪尖,也引发业界对其算力利用效率的广泛质疑。据外媒《The Information》获取的xAI内部备忘录显示,xAI公司总裁迈克尔·尼科尔斯(Michael Nicolls)向团队坦言,目前公司模型浮点运算利用率(MFU)约为11%。

这一数字背后的含义十分直观:理论上可输出100份训练算力的硬件,实际仅能产出11份,尼科尔斯在备忘录中直白评价其“低得尴尬”,并明确为团队设定了目标——未来几个月内将这一利用率拉升至50%。

据悉,xAI目前拥有约55万颗NVIDIA GPU,涵盖H100和H200系列。尽管这些GPU比最新的Blackwell产品落后了一个世代,但如此庞大的硬件部署规模,仍给市场留下了深刻印象。

需要指出的是,11%这个数字,并非指89%的GPU在完全闲置,而是衡量有效训练吞吐占硬件理论峰值算力比例的严苛指标。

与行业基准相比,xAI的表现差距尤为明显。当前,生产级大模型训练的MFU通常维持在35%至45%之间,其中Meta和谷歌凭借长期积累的深厚软件堆栈,其GPU利用率分别可达约43%和46%;

即便在以“低效”著称的GPT-3训练时期,MFU也能稳定在21%-26%之间。反观xAI的11%,不仅远低于当前行业主流水平,甚至不及AI算力发展史上的“古早”尴尬时期。

值得一提的是,坐拥顶级算力却难以发挥价值, xAI 症结不在硬件,而在软件短板。

据悉,xAI一直照搬英伟达标准部署方案,但软件堆栈、并行策略和模型工程优化,远远跟不上硬件激进扩张速度。

具体来看,HBM显存读取速度远慢于计算芯片,导致芯片大量时间空转等待数据;网络拓扑中的任何一处瓶颈,在数万张卡的同步要求下,都会被急剧放大。

此外,Lambda等机构分析指出,显存压力、过度的激活重计算和张量并行带来的跨GPU通信开销等,都是拖累MFU的系统性因素。

值得注意的是,xAI 基建扩张堪称行业奇迹,其Colossus 超算仅 122天建成,GPU规模短时间内极速扩容,过快的硬件铺摊,也放大了软件优化滞后的致命短板。

via cnBeta.COM - 中文业界资讯站 (author: 稿源:快科技)
来自频道: @AI_News_CN
来自频道: @AI_News_CN
来自频道: @AI_News_CN
来自频道: @AI_News_CN
来自频道: @AI_News_CN
来自频道: @AI_News_CN
来自频道: @AI_News_CN
欧洲财长敦促 Anthropic 开放 Mythos AI 访问权限以评估安全风险

5 月 4 日,欧元区财政部长在布鲁塞尔会议上要求 Anthropic 向欧洲企业开放 Mythos AI 模型的访问权限。西班牙经济部长 Carlos Cuerpo 指出,该模型具备发现各行业机构系统漏洞与后门的能力,欧洲需通过获取访问权来建立防御体系,避免在安全领域落后于美国。

欧洲央行副行长强调,需利用该技术预先屏蔽支付系统的数字风险。目前 Mythos 尚未正式发布,欧洲公司仍无法评估其潜在影响。此外,白宫此前曾表示反对 Anthropic 扩大该模型访问范围的计划。

Bloomberg

🌸 在花频道 · 茶馆讨论 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
来自频道: @AI_News_CN
图像AI模型现在推动AI移动应用增长

根据应用情报提供商Appfigures的一份新报告,图像模型发布正在推动人工智能移动应用的增长,产生的下载量是传统模型更新的6.5倍。例如,ChatGPT 和 Gemini在发布各自的图像模型后,各自增加了数千万的新下载量。对于谷歌的Gemini应用,在去年八月推出 Gemini 2.5 Flash 图像模型后的二十八天内,其图像模型的发布带动了额外2200多万次的下载。数据显示,这次发布使该应用在这一期间的下载量提升了四倍多。与此同时,ChatGPT在去年三月推出GPT-4o图像模型后的二十八天内增加了超过1200万的增量安装。这大约是其GPT-4o、GPT-4.5和GPT-5模型发布所带来下载量的4.5倍。

—— Techcrunch

via 风向旗参考快讯 - Telegram Channel
来自频道: @AI_News_CN
Trump 政府考虑对新 AI 模型实施发布前审查

特朗普政府正考虑改变此前的去监管立场,讨论对新 AI 模型在公开发布前实施政府审查。白宫计划通过行政命令成立由科技高管与政府官员组成的 AI 工作组,共同研究监管程序。上周,白宫官员已就此计划与 Anthropic、Google 和 OpenAI 的高管进行了会谈。

此次政策转向受到 Anthropic 近期发布的 Mythos 模型影响,该模型在识别软件漏洞方面的能力引发了安全担忧。目前白宫幕僚长 Susie Wiles 和财政部长 Scott Bessent 已接管 AI 政策制定。拟议的审查机制旨在让政府获得对模型的优先评估权,以在防范网络安全风险的同时,平衡与中国的技术竞争。

The New York Times

🌸 在花频道 · 茶馆讨论 · 投稿通道

via 科技圈🎗在花频道📮 - Telegram Channel
来自频道: @AI_News_CN