阿里巴巴源Qwen3-Omni 36打GPT-4o
阿里巴巴再掀AI革命,推出界首原生源全模大模型Qwen3-Omni,正式美科技巨,挑封有系,款模型支援文本、片、音影片等多料入,在文本音生成、速度、言覆多模任表上,全面超越同格源封式品,全球者和企前所未有的性用性。
阿里巴巴再掀AI革命,推出界首原生源全模大模型Qwen3-Omni,正式美科技巨,挑封有系,款模型支援文本、片、音影片等多料入,在文本音生成、速度、言覆多模任表上,全面超越同格源封式品,全球者和企前所未有的性用性。
Qwen3-Omni是阿里通打造的第三代全模AI,以ThinkerTalker架,能原生文本、像、音影片,直接行跨模理解推理。
[caption id="attachment_193132" align="aligncenter" width="700"]
阿里巴巴再掀AI革命,推出界首原生源全模大模型Qwen3-Omni,正式美科技巨。(/World Economic Forum)[/caption]
延伸:
多模大多用後加式(bolt-on)模,Qwen3-Omni於段就混合模多模料,大幅提升跨模同理解能力。架在界首,即便在新的多模任中亦展大性能。
Qwen3-Omni用Apache 2.0源授,支援免下、修改再分,完全放商用,不需心後授。者而言,可直接Hugging Face、GitHub取模型,或以阿里API、版Flash行快速部署。
模型支援119文字、19音理解言10音生成言,覆全球主流言及如等方言。模型端到端延低至211毫秒(音)或507毫秒(),大幅先同手,合需要即回的音、影音互景。
Qwen3-Omni主推三大版本:Instruct(指令)、Thinking(思考)及Captioner(音注)。者可依需求用覆泛的全模互、注推理的思考、或精化音描述,多元用景。
Qwen3-Omni在36音/影音任中,22到尖界水(SOTA),32刷新源。Google Gemini 2.5 Pro、OpenAI GPT-4o等封模型相比,在音、推理和影音多模等核心域全面先,示中AI在核心技上已具全球力。
模型已放企部署和行整,可用於跨、影音理解、客服助理、IoT音控制、智能助理、即翻、OCR、音分段等多景,企用可依具行需求行一步微和本地整合,且享有涵利的法律保障。
料源:chinaz.com、wallstreetcn.com
篇文章 阿里巴巴源Qwen3-Omni 36打GPT-4o 最早出於 科技-掌握科技新、科技最新。
- 者:天心
- 更多科技新 »