深度｜吴恩达谈DeepSeek：中国AI迎头赶上，扩大算力并不是AI进步的唯一途径

文章来源：08ai导航网发布时间：2025-08-30 10:37:01

有时，当某项技术变得更便宜时，反而会促使整体投入增加。我认为，从长期来看，人类对智能和算力的需求几乎没有上限，因此我仍然看好AI计算需求的持续增长。

我认为DeepSeek-R1在地缘**上的影响尚有待厘清，同时它也为AI应用开发者带来了巨大机遇。

亲爱的读者朋友们，

这一周，围绕DeepSeek的热议让一些关键事实浮出水面：首先是，中国在生成式AI领域正在迅速追赶美国，这将对AI产业链产生深远影响；第二，开源权重模型正在让基础模型逐步商品化，为应用开发者带来了新的机遇；第三，扩大算力并不是推动AI进步的唯一途径。尽管计算能力备受关注，算法创新正快速降低训练成本。

大约一周前，总部位于中国的DeepSeek发布了DeepSeek-R1这一模型，其基准测试表现可媲美OpenAI的o1。此外，该模型以MIT许可证开源，这位AI的应用开发者提供了极大的灵活性。在上周的达沃斯论坛上，许多非技术背景的商业领袖都向我询问关于它的情况。而在本周一，股市出现了“DeepSeek抛售潮”，英伟达及多家美国科技公司的股价大幅下跌（截至目前，股价已有所回升）。

以下是围绕DeepSeek一些关键事实：

中国正在迅速追赶美国的生成式AI技术

当ChatGPT在2022年11月推出时，美国在生成式AI领域领先中国不少。观念的改变通常滞后，因此直到最近，我仍然听到来自美国和中国的朋友表示，他们认为中国落后。然而，过去两年里，这一差距正在迅速缩小。随着Qwen（我的团队已使用数月）、Kimi、InternVL 和DeepSeek等中国模型的推出，中国的AI实力已经显著提升。在某些其他领域，比如视频生成，中国甚至已经展现出领先迹象。

我很高兴DeepSeek-R1以开源权重模型的形式发布，他们还附带了一份详细的技术报告。相比之下，一些美国公司则推动对开源AI进行监管，并通过渲染“人类灭绝”等假想风险来限制其发展。如今已十分明确，开源权重模型是AI产业链的重要组成部分，许多企业都会使用它们。如果美国继续限制开源，中国很可能在这一领域占据主导地位，届时许多企业将不得不使用更符合中国价值观的AI模型，而非美国的。

开源权重模型正在让基础模型商品化

正如我之前所写，LLM的Token价格正在快速下降，开源权重的普及加速了这一趋势，并为开发者提供了更多选择。OpenAI的o1模型每百万输出Token的成本为60美元，而DeepSeek-R1仅需2.19美元。这近30倍的价格差异让许多人注意到AI计算成本正在大幅下降。

训练基础模型并通过API访问收费的商业模式并不好走。许多企业仍在寻找回本途径，而训练大模型的成本极其高昂。文章《AI的6000亿美元问题》很好地阐述了这一挑战（当然，我认为基础模型公司正在做出卓越贡献，我希望它们成功）。相比之下，在基础模型之上开发AI应用是更具吸引力的商业机会。如今，许多公司已投入数十亿美元训练模型，而你只需花费几美元，就能利用这些模型构建客户服务聊天机器人、邮件摘要工具、AI医生、法律文件助手等各种应用。

扩大算力并不是AI进步的唯一途径

近年来，围绕“扩大模型规模能够推动AI进步”的观点备受追捧。事实上，我曾是这一理念的早期支持者。一些公司利用这一叙事成功融资数十亿美元，声称只要有足够资本，就能通过 (i) 扩大规模和 (ii) 预测性改进来持续提升AI性能。因此，行业对扩大算力的关注远超对其他创新路径的探讨。然而，美国对中国的AI芯片出口限制促使DeepSeek团队进行大量优化，使其能够在H800 GPU（算力远不如H100）上高效运行，从而在不计研发成本的情况下，仅用不到600万美元的计算成本完成模型训练。

DeepSeek的成功经验是否意味着降低对算力的需求仍有待观察。有时，当某项技术变得更便宜时，反而会促使整体投入增加。我认为，从长期来看，人类对智能和算力的需求几乎没有上限，因此我仍然看好AI计算需求的持续增长。

我在社交媒体上看到人们对DeepSeek进展的解读各不相同，仿佛是一场Rorschach test，每个人都在其上投射自己的理解。我认为DeepSeek-R1在地缘**上的影响尚有待厘清，同时它也为AI应用开发者带来了巨大机遇。我的团队已经开始头脑风暴，探索因开源高阶推理模型的可及性而催生的新应用方向。现在依然是一个绝佳的AI创新时代！

原文：Three Takeaways fromDeepSeek’s Big Week: Innvations by China’sAIpowerhouseDeepSeekhighlight major shifts in the international scene

https://www.deeplearning.ai/the-batch/three-takeaways-from-deepseeks-big-week/

编译：Elena Chen