最近,阿里巴巴在AI领域的动作频频!6月6日,阿里正式开源了千问3向量模型系列——Qwen3-Embedding。这款基于千问3底座的全新模型,专为文本表征、检索和排序任务优化,堪称AI界的“利器”。
相比前代,Qwen3-Embedding在核心任务上的性能提升了40%以上!这意味着它不仅技术上更强大,在MTEB等权威榜单中也一举超越谷歌Gemini Embedding、OpenAI的text-embedding-3-large以及微软的multilingual-e5-large-instruct等顶尖模型,成功登顶同类最佳(SOTA)。
图源备注:图片由AI生成
简单来说,向量模型就像AI的“翻译官”,能将文本、图片等非结构化数据转化为机器可理解的向量形式,从而实现高效分类、检索和排序。通义团队通过对比训练、SFT和模型融合等多种技术手段,打造了这一新型向量模型,包括Qwen3-Embedding(文本嵌入)和Qwen3-Reranker(文本排序)两大模块。
值得一提的是,千问3向量模型支持超过100种语言,甚至涵盖多种编程语言,展现出强大的多语言、跨语言及代码检索能力。这对全球开发者来说无疑是一个福音。
此次开源的千问3向量模型共有9款,覆盖不同尺寸(如0.6B、4B、8B等),还提供GGUF版本。开发者可以根据需求自由选择、组合模块,甚至自定义向量或指令,满足特定任务和场景的需求。
目前,Qwen3-Embedding和Reranker模型已在魔搭社区、Hugging Face和GitHub等多个平台上线,开发者还能通过阿里云百炼直接调用API服务。自4月29日开源以来,千问3大模型已多次在国际榜单中夺冠,成为开源领域的明星项目。
[hhw123pingdao]
温馨提示:
- 请注意,下载的资源可能包含广告宣传。本站不对此提供任何担保,请用户自行甄别。
- 任何资源严禁网盘中解压缩,一经发现删除会员资格封禁IP,感谢配合。
- 压缩格式:支持 Zip、7z、Rar 等常见格式。请注意,下载后部分资源可能需要更改扩展名才能成功解压。
- 本站用户禁止分享任何违反国家法律规定的相关影像资料。
- 内容来源于网络,如若本站内容侵犯了原著者的合法权益,可联系我们进行处理,联系微信:a-000000
📝留言定制 (0)