
来自中国的“神秘力量”,火爆全球
Beijing Daily
由国产大模型公司杭州深度求索开发的Deepseek应用27日登顶苹果中国地区和美国地区应用商店免费APP下载排行榜,在美区下载榜上超越了ChatGPT,在中国、美国的科技圈受到广泛关注。 环球时报27日称,Deepseek被认为是大模型行业的最大“黑马”,在外网被不少人称为“神秘的东方力量”。
DeepSeek成立于2023年7月17日,是一家创新型科技公司,专注于开发先进的大语言模型(LLM)和相关技术。
2024年12月,DeepSeek-V3发布。AI数据服务公司Scale AI创始人Alexander Wang就发帖称,DeepSeek-V3是中国科技界带给美国的苦涩教训。“当美国休息时,中国(科技界)在工作,以更低的成本、更快的速度和更强的实力赶上。”
今年1月20日,DeepSeek正式开源R1推理模型,“物美价廉”的特性在海外开发者社区中引发了轰动。
目前,在国外大模型排名榜Chatbot Arena上,DeepSeek-R1的基准测试排名已经升至全类别大模型第三,与OpenAI的ChatGPT-4o最新版并列,并在风格控制类模型(StyleCtrl)分类中与OpenAI的o1模型并列第一。
长安街知事(微信ID:Capitalnews)注意到,DeepSeek备受关注的原因主要是性价比、开源及推理能力的提升等方面。
在性价比上,DeepSeek R1成本很低,预训练费用只有557.6万美元,不到OpenAI GPT-4o模型训练成本的十分之一。DeepSeek还公布了API(应用程序编程接口)的定价,收费大约是OpenAI o1运行成本的三十分之一。
More Related News