2025-09-23 11:29:22　新源 : 科技
回

阿里巴巴源Qwen3-Omni 36打GPT-4o

阿里巴巴再掀AI革命，推出界首原生源全模大模型Qwen3-Omni，正式美科技巨，挑封有系，款模型支援文本、片、音影片等多料入，在文本音生成、速度、言覆多模任表上，全面超越同格源封式品，全球者和企前所未有的性用性。者天心／合

阿里巴巴再掀AI革命，推出界首原生源全模大模型Qwen3-Omni，正式美科技巨，挑封有系，款模型支援文本、片、音影片等多料入，在文本音生成、速度、言覆多模任表上，全面超越同格源封式品，全球者和企前所未有的性用性。

Qwen3-Omni是阿里通打造的第三代全模AI，以ThinkerTalker架，能原生文本、像、音影片，直接行跨模理解推理。

[caption id="attachment_193132" align="aligncenter" width="700"]
阿里巴巴源Qwen3-Omni 36打GPT-4o
阿里巴巴再掀AI革命，推出界首原生源全模大模型Qwen3-Omni，正式美科技巨。（／World Economic Forum）[/caption]

延伸：

10位得主手AI巨要求2026年前定AI

多模大多用後加式（bolt-on）模，Qwen3-Omni於段就混合模多模料，大幅提升跨模同理解能力。架在界首，即便在新的多模任中亦展大性能。

Qwen3-Omni用Apache 2.0源授，支援免下、修改再分，完全放商用，不需心後授。者而言，可直接Hugging Face、GitHub取模型，或以阿里API、版Flash行快速部署。

模型支援119文字、19音理解言10音生成言，覆全球主流言及如等方言。模型端到端延低至211毫秒（音）或507毫秒（），大幅先同手，合需要即回的音、影音互景。

Qwen3-Omni主推三大版本：Instruct（指令）、Thinking（思考）及Captioner（音注）。者可依需求用覆泛的全模互、注推理的思考、或精化音描述，多元用景。

Qwen3-Omni在36音/影音任中，22到尖界水(SOTA)，32刷新源。Google Gemini 2.5 Pro、OpenAI GPT-4o等封模型相比，在音、推理和影音多模等核心域全面先，示中AI在核心技上已具全球力。

模型已放企部署和行整，可用於跨、影音理解、客服助理、IoT音控制、智能助理、即翻、OCR、音分段等多景，企用可依具行需求行一步微和本地整合，且享有涵利的法律保障。

料源：chinaz.com、wallstreetcn.com

篇文章阿里巴巴源Qwen3-Omni 36打GPT-4o 最早出於科技-掌握科技新、科技最新。

新字：阿里巴巴、AI、天心、科技、美、言

者：天心
更多科技新 »