中文互联网基础语料 3.0 正式发布,数据量达 120GB 助力 AI 发展9 月 18 日,在昆明举行的 2025 年国家网络安全宣传周人工智能安全治理分论坛上,中文互联网基础语料 3.0 正式向社会发布。该语料库由中国网络空间安全协会会同国家互联网应急中心等单位协同建设,数据量达到 120GB,进一步扩大了优质中文网站信源范围,并加强了违法不良信息的过滤。用户可通过中国网络空间安全协会网站注册认证后下载相关语料。该语料库将为大模型训练和人工智能技术创新提供有力的数据支持。
新浪科技|
中国网络空间安全协会🍀在花频道 🍵茶馆 📮投稿
⚠️ 评论区加载失败
可能原因:
- 浏览器广告拦截器阻止了 Telegram widget
- 网络连接问题
解决方法: