中国 AI 实验室 DeepSeek 近期推出了其开源推理模型 DeepSeek-R1,引发了业界广泛关注。该模型被称为「推理模型」,据称在某些 AI 基准测试上,其表现可与 OpenAI 的 o1 媲美。R1 已透过 AI 开发平台 Hugging Face 以 MIT 许可证发布,用户可在无限制条件下将其商业化应用。
DeepSeek 声称,R1 在数个基准测试中超越了 o1,包括美国数学邀请赛(AIME)、MATH-500 和 SWE-bench Verified。其中,AIME使用其他模型来评估推理能力,MATH-500 专注于文字题,而 SWE-bench Verified 则测试程式设计任务。
Table of Contents
ToggleR1 模型有优势,但受限于政治
据称,作为推理模型,R1 具备独特的自我校验能力,这使其在物理、科学和数学等领域的可靠性优于传统模型。尽管推理模型通常需要更长的运算时间 (几秒至数分钟),但其高准确率对于处理复杂问题具有极大优势。
技术报告指出,R1 包含 6710 亿个参数,远超许多现有模型。参数量通常与模型的解决问题能力成正比,这使 R1 成为一个规模庞大的模型。然而,DeepSeek 也提供了「精简版」的 R1 模型,参数量从 15 亿到 700 亿不等,甚至最小版本可以在笔记本电脑上运行。完整版本的 R1 则需要更高性能的硬体支持,但透过 DeepSeek 的 API 使用,其成本仅为 OpenAI o1 的 5%-10%。
不过,R1 的中国背景也带来了一些限制。由于中国网路监管规定,R1 必须符合「核心社会主义价值观」,因此对某些敏感话题 (如:六四事件或台湾独立) 拒绝作答。这是中国许多 AI 系统的共同特征,其他像 Moonshot 的 Kimi 模型也受到类似约束。
中国 AI 的「弯道超车」、开源供应
DeepSeek 的 R1 模型凸显中国 AI 产业在创新和资源优化上的快速进步。在面临美国限制尖端晶片出口的挑战下,中国 AI 开发者采用了诸如专家混合模型 (MoE) 等技术来优化计算资源分配。DeepSeek 此前还推出了一个名为 Fire-Flyer 2 的 AI 训练集群,结合了约 10,000 个 Nvidia A100 晶片,成本和能耗均低于类似的国际系统。
DeepSeek 的「精简版」R1 模型是另一项重要突破。这些模型不仅能在本地硬体上运行,还以开源形式提供,令 AI 技术在全球范围内更易获取和扩散。正如乔治梅森大学的 AI 研究员 Dean Ball 所指出:「这些高效的推理模型的普及,意味著它们将继续以分散化方式存在,远离任何自上而下的控制机制。」
出口管制:美国正提防 DeepSeek
尽管技术上取得进步,中国 AI 行业仍面临巨大挑战。2023 年底,美国政府进一步收紧了对中国 AI 相关技术和晶片的出口管制。除了先前的高阶晶片禁令,新规则还可能限制中国公司获取用于启动高级 AI 系统的关键半导体技术。
对此,OpenAI 在一份政策文件中警告,美国政府应加强对本国 AI 技术的支持,以免中国模型在能力上赶超美国。在接受《The Information》采访时,OpenAI 政策副总 Chris Lehane 更是点名 DeepSeek 的母公司 High Flyer Capital Management,称其为一个「特别需要关注的组织」。
中国 AI 企业规模仍远低于美国
尽管 DeepSeek 的技术表现令人印象深刻,但中国 AI 公司的估值仍远低于美国同行。例如,OpenAI 的估值已达 1570 亿美元,而DeepSeek、Moonshot 等中国公司的估值仅为其一小部分。激烈的市场竞争已引发价格战,AI 模型供应商间的利润空间受到挤压。
总部位于北京的 Zhipu AI 就是一个例子。该公司估值约为 30 亿美元,远不及 OpenAI,并因此推迟了原计划于 2025 年下半年上市的计划。尽管 Zhipu 近期展示了一款类似 OpenAI Sora 的影像生成模型,但其商业化前景尚未明朗。
中国 AI 的未来:在限制中突围
中国 AI 行业正试图在美国限制和资源不足的背景下突围。DeepSeek 的 R1 模型以及其他新创公司的快速进步展示了中国在 AI 领域的巨大潜力。正如前北京 AI 业界人士所言:「我们就像戴著镣铐跳舞,只能专注于擅长的领域,这是唯一的生存机会,也是可能的胜利之道。」
未来,中国 AI 是否能在全球竞争中获得更大的话语权,将取决于创新能力与商业化潜力的结合。随著技术的推进,DeepSeek 等公司已证明中国 在AI 领域具备「弯道超车」的能力,但全球政策与市场环境将持续影响这场科技竞赛的结果。
风险提示
加密货币投资具有高度风险,其价格可能波动剧烈,您可能损失全部本金。请谨慎评估风险。