阿里巴巴发布AI模型声称超越DeepSeek

Voice of America

Wednesday, January 29, 2025 11:07:20 AM UTC

中国科技公司阿里巴巴星期三(1月29日)发布了其通义千问“Qwen 2.5”人工智能(AI)模型的新版本，并声称该模型已超越备受赞誉的DeepSeek-V3。

阿里云发布其全新的通义千问 Qwen 2.5-Max超大规模混合专家(MoE)模型的时间较不寻常，正值农历新年第一天，大多数中国人正在放假与家人团聚。这意味着中国AI初创公司深度求索(DeepSeek)过去三周的迅猛崛起，不仅给海外竞争对手、也给国内竞争者带来了压力。

“Qwen 2.5-Max…几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B，”阿里云在微信公众号上发布的一篇公告中说，其指的分别是OpenAI、深度求索和Meta最先进的开源AI模型。

据介绍，Qwen 2.5-Max使用超过20万亿token(AI模型处理的数据单位)的预训练数据及精心设计的后训练方案进行训练。

阿里云说，通义团队分别对Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能进行了评估测试。在指令模型测试方面，Qwen2.5-Max在多个基准测试中比肩美国的Claude-3.5-Sonnet模型，并几乎全面超越了另外三个美国模型GPT-4o、DeepSeek-V3及Llama-3.1-405B。

阿里云表示，在基座模型测试方面，通义团队将Qwen2.5-Max与目前DeepSeek V3、Llama-3.1-405B、Qwen2.5-72B进行了对比，而Qwen2.5-Max在所有11项基准测试中全部超越了对比模型。

Read full story on Voice of America

Share this story on:-

Primary Country (Mandatory)

Other Country (Optional)

Set News Language for United States

Set News Language for World

Set News Source for United States

Set News Source for World

阿里巴巴发布AI模型声称超越DeepSeek

Voice of America

比例时逮捕几名华为说客，行贿欧洲议会案进入调查

黄浦江封: 一个模糊性掩护战略的形成：中国“两会”观察

缺席人大闭幕式引臆测赵乐际现身中国官媒似辟谣

中国、伊朗和俄罗斯在中东举行联合海军演习, 德黑兰与美国之间的紧张同时加剧

台湾退役军官再爆泄密案中共渗透触角延伸至低阶军官

密苏里州就新冠疫情状告中国胜诉它能得到240多亿美元的赔偿吗？

中国1222万应届毕业生涌入职场，就业压力加剧政策难解根本困境

中国造船业崛起的背后，华邮: 外国公司贡献良多

蒙古空污问题难解许多儿童因有毒的空气染病

有报道称联合国缅甸事务特使与中国公司有关联，活动组织呼吁调查

两会结束疑虑尚存，赵乐际因健康原因缺席引起广泛质疑

“台风”来袭：中国黑客已经从经济间谍转化为对美国的军事和政治威胁

抗议现场呼吁警方克制的香港社工陈虹秀“暴动”案重审被判罪成

七国集团外长声明涉台措辞不再提“一个中国”中方批评干涉内政

路透：美国在台协会政治组长获任命驻北京大使馆临时代办

台湾向美采购F-16V Block70首架新机组装完成副防长级官员将赴美参加出厂仪式

中国官员试图限制社交媒体和手机上网时间

第二艘疑似运载导弹原料的伊朗船只离开中国

中国纪念《反分裂国家法》20周年之际赖清德警告北京“五大威胁”

越南等东盟国家相继提升战略伙伴关系，合力应对中国挑战？

遭中国官方间接抨击“背叛”国家香港长江和记股价重挫

美跨党派国会议员提案将“驻美国台北经济文化代表处”更名为“台湾代表处”

黎智英之子与特朗普政府会面，争取让父亲获得自由

民营企业促进法未在“两会”通过分析：中共内部或仍存分歧

赖清德定义中国为“境外敌对势力” 台湾恢复军审制度严惩共谍