
阿里巴巴发布AI模型 声称超越DeepSeek
Voice of America
中国科技公司阿里巴巴星期三(1月29日)发布了其通义千问“Qwen 2.5”人工智能(AI)模型的新版本,并声称该模型已超越备受赞誉的DeepSeek-V3。
阿里云发布其全新的通义千问 Qwen 2.5-Max超大规模混合专家(MoE)模型的时间较不寻常,正值农历新年第一天,大多数中国人正在放假与家人团聚。这意味着中国AI初创公司深度求索(DeepSeek)过去三周的迅猛崛起,不仅给海外竞争对手、也给国内竞争者带来了压力。
“Qwen 2.5-Max…几乎全面超越了GPT-4o、DeepSeek-V3及Llama-3.1-405B,”阿里云在微信公众号上发布的一篇公告中说,其指的分别是OpenAI、深度求索和Meta最先进的开源AI模型。
据介绍,Qwen 2.5-Max使用超过20万亿token(AI模型处理的数据单位)的预训练数据及精心设计的后训练方案进行训练。
阿里云说,通义团队分别对Qwen2.5-Max的指令(Instruct)模型版本和基座(base)模型版本性能进行了评估测试。在指令模型测试方面,Qwen2.5-Max在多个基准测试中比肩美国的Claude-3.5-Sonnet模型,并几乎全面超越了另外三个美国模型GPT-4o、DeepSeek-V3及Llama-3.1-405B。
阿里云表示,在基座模型测试方面,通义团队将Qwen2.5-Max与目前DeepSeek V3、Llama-3.1-405B、Qwen2.5-72B进行了对比,而Qwen2.5-Max在所有11项基准测试中全部超越了对比模型。
More Related News