🤖 阿里巴巴发布 Qwen3-Omni 全模态开源 AI 模型,支持文本、音频、图像和视频处理

阿里巴巴推出了 Qwen3-Omni 系列开源 AI 模型,具备处理文本、音频、图像和视频输入的能力,并可生成文本和语音输出。Qwen3-Omni 是首个原生端到端全模态基础模型,无需在不同模态之间做取舍,支持多语言和多模态任务,已在多项音频及视听基准测试中取得领先成绩。该模型对开发者开放,便于本地运行和研究使用。

Venturebeat|HuggingFace|Qwen

🍀在花频道 🍵茶馆 📮投稿
来自频道: @zaihuapd
Loading comments...