DeepSeek V3.1 模型被发现存在严重输出错误,会在生成内容中随机插入「极」字,导致模型无法正常用于编程或结构化输出工作。该问题最初在火山、chutes 等第三方 API 平台上被发现,但经测试官方网站同样存在此问题。
分析显示,「极」字对应的 token 编号为 2577,与省略号的 token 编号 2576 相邻,可能与数据集清理不当或模型"偷懒"行为有关。目前官方平台出现该 bug 的概率相对较低,但第三方平台概率显著增加,可能与量化、部署配置或设备差异相关。一旦出现该问题,后续输出中「极」字出现频率会进一步增加。
LINUX DO | Reddit
🍀在花频道 🍵茶馆 📮投稿
来自频道: @zaihuapd
⚠️ 评论区加载失败
可能原因:
- 浏览器广告拦截器阻止了 Telegram widget
- 网络连接问题
解决方法: