🦘 美团发布 LongCat-Flash-Chat 大语言模型

美团 LongCat 团队正式发布 LongCat-Flash-Chat 大语言模型,该模型拥有 5600 亿总参数,采用创新的专家混合(MoE)架构。模型具备动态计算机制,可根据上下文需求激活 186 亿至 313 亿参数(平均约 270 亿),在 20 万亿 token 上训练,推理速度超过每秒 100 token。

该模型在多项基准测试中表现优异,特别在智能体任务方面表现突出,支持工具调用和多轮对话,现已在 Hugging Face 开源并提供在线体验。

Meituan LongCat | Hugging Face | 在线体验

🍀在花频道 🍵茶馆 📮投稿
来自频道: @zaihuapd
Loading comments...