阿里開(kāi)源千問(wèn)3向量模型,性能超越谷歌、OpenAI
6月6日,阿里開(kāi)源通義千問(wèn)3全新的向量模型系列 Qwen3-Embedding(簡(jiǎn)稱(chēng)千問(wèn)3向量模型)。該模型以千問(wèn)3為底座,專(zhuān)門(mén)為文本表征、檢索和排序等核心任務(wù)進(jìn)行優(yōu)化訓(xùn)練,性能較上一版本可提升40% ,在 MTEB 等權(quán)威專(zhuān)項(xiàng)榜單中超越了谷歌、OpenAI?、微軟等公司的頂尖模型,攬獲同類(lèi)模型的 SOTA 最佳性能表現(xiàn)。
Qwen3-Embedding 系列模型
據(jù)了解,向量模型像是 AI 的“翻譯器”,它可以將文本、圖片等人類(lèi)可認(rèn)知的非結(jié)構(gòu)化信息,映射(embedding)到機(jī)器更易理解的向量空間,再基于這些向量實(shí)現(xiàn)高效的信息分類(lèi)、檢索或排序。也正因此,向量模型對(duì)于提升 AI 的語(yǔ)義理解、信息檢索、多模態(tài)融合等核心能力至關(guān)重要?;谇?wèn)3模型,通義團(tuán)隊(duì)通過(guò)對(duì)比訓(xùn)練、SFT 、模型融合等方法,打造出全新的千問(wèn)3向量模型,包含文本嵌入模型 Qwen3-Embedding 以及文本排序模型 Qwen3-Reranker 。
千問(wèn)3向量模型系列訓(xùn)練過(guò)程圖
相較于上一個(gè)版本,千問(wèn)3向量模型在文本檢索、聚類(lèi)、分類(lèi)等核心任務(wù)上提升最高40% 以上的性能。在評(píng)估向量模型通用能力的 MTEB 多語(yǔ)言排行榜上,Qwen3-Embedding-8B 超越谷歌的 Gemini Embedding 、Open AI 的 text-embedding-3-large 及微軟的 multilingual-e5-large-instruct 等頂尖模型,拿下同類(lèi)模型的最佳性能 SOTA 。同時(shí),得益于千問(wèn)3的多語(yǔ)言能力,千問(wèn)3向量模型系列率先支持超100種語(yǔ)言,并涵蓋多種編程語(yǔ)言,可實(shí)現(xiàn)強(qiáng)大的多語(yǔ)言、跨語(yǔ)言及代碼檢索能力。
千問(wèn)3向量模型在 MTEB 等基準(zhǔn)測(cè)試中獲SOTA最佳性能表現(xiàn)
據(jù)悉,為方便開(kāi)發(fā)者,此次有9款千問(wèn)3向量模型開(kāi)源,涵蓋0.6B 、4B 、8B 等不同尺寸及 GGUF 版本。開(kāi)發(fā)者可從中找到最符合需求的模型,自由組合模塊,還可自定義向量或指令,實(shí)現(xiàn)特定任務(wù)、語(yǔ)言和場(chǎng)景的深度優(yōu)化。比如,開(kāi)發(fā)者可在智能搜索、推薦系統(tǒng)中采用 Qwen3-Embedding 作文本向量化,或者在 RAG 實(shí)踐中用 Qwen3-Reranker 提升最終結(jié)果的相關(guān)性和準(zhǔn)確性,甚至與視覺(jué)理解模型結(jié)合,探索前沿的跨模態(tài)語(yǔ)義理解。
目前,千問(wèn)3 Embedding 和 Reranker 模型均已在魔搭社區(qū)、 Hugging Face 和 GitHub 等平臺(tái)上開(kāi)源,開(kāi)發(fā)者也可直接通過(guò)阿里云百煉使用 API 服務(wù)。
據(jù)了解,千問(wèn)3大模型自4月29日開(kāi)源以來(lái),已攬獲 Artificial Analysis 、LiveBench 、LiveCodeBench 、SuperClue 多個(gè)國(guó)內(nèi)外權(quán)威榜單的全球開(kāi)源冠軍。
【來(lái)源:網(wǎng)易 科技 】