阿里云初一发布通义千问旗舰版模型Qwen2.5-Max
当前位置:首页>资讯 >行业资讯 > 人工智能>阿里云初一发布通义千问旗舰版模型Qwen2.5-Max

阿里云初一发布通义千问旗舰版模型Qwen2.5-Max

2025-01-29 来源:路透社浏览数:57 国际会展网

核心提示:阿里云星期三(1月29日)凌晨在微信公众号宣布,Qwen2.5-Max全新升级发布,并说新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源混合专家(MoE)模型以及最大的开源稠密模型。

18SZ环宇视展图片处理

中国阿里云在大年初一发布通义千问旗舰版模型Qwen2.5-Max,并称在指令模型版本性能测试中,几乎全面超越深度求索DeepSeek-V3等其他模型。

阿里云星期三(1月29日)凌晨在微信公众号宣布,Qwen2.5-Max全新升级发布,并说新模型展现出极强劲的综合性能,在多项公开主流模型评测基准上录得高分,全面超越了目前全球领先的开源混合专家(MoE)模型以及最大的开源稠密模型。

18SZ环宇视展图片处理

阿里云也说,通义团队分别对Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能进行了评估测试。

在指令模型方面,Qwen2.5-Max在多个基准测试中比肩美国的Claude-3.5-Sonnet模型,并几乎全面超越了另外三个美国模型GPT-4o、DeepSeek-V3及Llama-3.1-405B。

18SZ环宇视展图片处理

在基座模型方面,阿里云则说,通义团队将Qwen2.5-Max与目前领先的开源MoE模型 DeepSeek V3、最大的开源稠密模型Llama-3.1-405B,以及同样位列开源稠密模型前列的Qwen2.5-72B进行了对比。在所有11项基准测试中,Qwen2.5-Max全部超越了对比模型。

路透社报道,选择大年初一发布Qwen 2.5-Max是较为特殊的时间点,也显示了深度求索过去三周迅速崛起,给中国境内外竞争对手带来压力。

18SZ环宇视展图片处理

深度求索1月20日发布推理模型DeepSeek-R1后,字节跳动旗下豆包更新版大模型1.5-pro上星期三(22日)正式发布。

据IT之家报道,1.5-pro模型增强了综合能力,在知识、代码、推理、中文等多个测评基准上,综合得分优于GPT-4o、Claude 3.5 Sonnet 等模型。

Booking.com
打赏
分享到:
0相关评论
阅读上文 >> 大噪XB-1达到1.1马赫 成为美国首架民用超音速飞机
阅读下文 >> 美国政府官员讨论进一步收紧英伟达对华芯片销售限制

大家喜欢看的

  • 品牌
  • 资讯
  • 展会
  • 视频
  • 图片
  • 供应
  • 百科
  • 商城

欢迎转发与合作:


本文地址:http://www.18sz.com/news/show.php?itemid=19466

转载本站原创文章请注明来源:国际会展网

行业专题

更多行业专题

微信“扫一扫”
即可分享此文章



友情链接

  • 关注官方订阅号

  • 关注官方服务号

Copyright© 2003-2025 18SZ.com 18SZ B2B SYSTEM All Rights Reserved

服务热线:+86 755 88850315 ICP备案号: