文章来源:08ai导航网发布时间:2025-08-30 10:37:01
有时,当某项技术变得更便宜时,反而会促使整体投入增加。我认为,从长期来看,人类对智能和算力的需求几乎没有上限,因此我仍然看好AI计算需求的持续增长。
我认为DeepSeek-R1在地缘**上的影响尚有待厘清,同时它也为AI应用开发者带来了巨大机遇。
亲爱的读者朋友们,
这一周,围绕DeepSeek的热议让一些关键事实浮出水面:首先是,中国在生成式AI领域正在迅速追赶美国,这将对AI产业链产生深远影响;第二,开源权重模型正在让基础模型逐步商品化,为应用开发者带来了新的机遇;第三,扩大算力并不是推动AI进步的唯一途径。尽管计算能力备受关注,算法创新正快速降低训练成本。
大约一周前,总部位于中国的DeepSeek发布了DeepSeek-R1这一模型,其基准测试表现可媲美OpenAI的o1。此外,该模型以MIT许可证开源,这位AI的应用开发者提供了极大的灵活性。在上周的达沃斯论坛上,许多非技术背景的商业领袖都向我询问关于它的情况。而在本周一,股市出现了“DeepSeek抛售潮”,英伟达及多家美国科技公司的股价大幅下跌(截至目前,股价已有所回升)。
以下是围绕DeepSeek一些关键事实:
当ChatGPT在2022年11月推出时,美国在生成式AI领域领先中国不少。观念的改变通常滞后,因此直到最近,我仍然听到来自美国和中国的朋友表示,他们认为中国落后。然而,过去两年里,这一差距正在迅速缩小。随着Qwen(我的团队已使用数月)、Kimi、InternVL 和DeepSeek等中国模型的推出,中国的AI实力已经显著提升。在某些其他领域,比如视频生成,中国甚至已经展现出领先迹象。
我很高兴DeepSeek-R1以开源权重模型的形式发布,他们还附带了一份详细的技术报告。相比之下,一些美国公司则推动对开源AI进行监管,并通过渲染“人类灭绝”等假想风险来限制其发展。如今已十分明确,开源权重模型是AI产业链的重要组成部分,许多企业都会使用它们。如果美国继续限制开源,中国很可能在这一领域占据主导地位,届时许多企业将不得不使用更符合中国价值观的AI模型,而非美国的。
正如我之前所写,LLM的Token价格正在快速下降,开源权重的普及加速了这一趋势,并为开发者提供了更多选择。OpenAI的o1模型每百万输出Token的成本为60美元,而DeepSeek-R1仅需2.19美元。这近30倍的价格差异让许多人注意到AI计算成本正在大幅下降。
训练基础模型并通过API访问收费的商业模式并不好走。许多企业仍在寻找回本途径,而训练大模型的成本极其高昂。文章《AI的6000亿美元问题》很好地阐述了这一挑战(当然,我认为基础模型公司正在做出卓越贡献,我希望它们成功)。相比之下,在基础模型之上开发AI应用是更具吸引力的商业机会。如今,许多公司已投入数十亿美元训练模型,而你只需花费几美元,就能利用这些模型构建客户服务聊天机器人、邮件摘要工具、AI医生、法律文件助手等各种应用。
近年来,围绕“扩大模型规模能够推动AI进步”的观点备受追捧。事实上,我曾是这一理念的早期支持者。一些公司利用这一叙事成功融资数十亿美元,声称只要有足够资本,就能通过 (i) 扩大规模和 (ii) 预测性改进来持续提升AI性能。因此,行业对扩大算力的关注远超对其他创新路径的探讨。然而,美国对中国的AI芯片出口限制促使DeepSeek团队进行大量优化,使其能够在H800 GPU(算力远不如H100)上高效运行,从而在不计研发成本的情况下,仅用不到600万美元的计算成本完成模型训练。
DeepSeek的成功经验是否意味着降低对算力的需求仍有待观察。有时,当某项技术变得更便宜时,反而会促使整体投入增加。我认为,从长期来看,人类对智能和算力的需求几乎没有上限,因此我仍然看好AI计算需求的持续增长。
我在社交媒体上看到人们对DeepSeek进展的解读各不相同,仿佛是一场Rorschach test,每个人都在其上投射自己的理解。我认为DeepSeek-R1在地缘**上的影响尚有待厘清,同时它也为AI应用开发者带来了巨大机遇。我的团队已经开始头脑风暴,探索因开源高阶推理模型的可及性而催生的新应用方向。现在依然是一个绝佳的AI创新时代!
原文:Three Takeaways fromDeepSeek’s Big Week: Innvations by China’sAIpowerhouseDeepSeekhighlight major shifts in the international scene
https://www.deeplearning.ai/the-batch/three-takeaways-from-deepseeks-big-week/
编译:Elena Chen
相关攻略 更多
最新资讯 更多
深度|吴恩达谈DeepSeek:中国AI迎头赶上,扩大算力并不是AI进步的唯一途径
更新时间:2025-08-30
日本AI公司发布自适应大模型,可动态调整其权重以完成各种任务
更新时间:2025-08-30
吴恩达押注Agent新成果官宣!零样本标记实现图片目标检测
更新时间:2025-08-30
钉钉真勇!率先接入DeepSeek,阿里系第一个吃螃蟹
更新时间:2025-08-30
具身智能,掀起融资风暴
更新时间:2025-08-30
全球顶级AI科学家许主洪加盟阿里!IEEEFellow,五万被引论文数,曾任Salesforce集团副总裁
更新时间:2025-08-29
去年近60家AI初创公司成立一年内获投,创始人不乏大厂背景
更新时间:2025-08-29
“3秒钟算出我前世是南宋第一女同?”免费的DeepSeek快被玩成算命宗师了
更新时间:2025-08-29
李飞飞团队50美元复刻DeepSeek?其实是基于通义监督微调,我们研究了论文
更新时间:2025-08-29
三大竞赛引爆CVPR'25协作智能Workshop全方位探讨多智能体具身系统新机遇,总计1万美元奖金等你来拿
更新时间:2025-08-29