美国公司“真香了”，但数据中心...

fjmyhfvclm2025-02-02 9

【文/观察者网张菁娟】尽管美国国会众议院首席行政事务官正在对深度求索（DeepSeek）进行审查，但不少美国公司已经“真香了”。

据香港《南华早报》2月1日报道，包括英伟达、微软、亚马逊在内的多家美国公司纷纷抢先采用中国人工智能（AI）初创企业的DeepSeek-R1模型。而DeepSeek引发的市场动荡，让一些人开始重新思考围绕人工智能的信贷狂潮。

️多家美国公司“拥抱”DeepSeek

英伟达1月30日在官网宣布，DeepSeek-R1模型可作为NVIDIA NIM微服务预览版使用，称该模型为推理、数学和编码等任务提供了“最先进的推理能力”“高推理效率”以及“领先的准确性”。

据英伟达官网介绍，NVIDIA NIM是NVIDIA AI Enterprise的一部分，为跨云、数据中心和工作站的自托管GPU加速推理微服务提供容器，用于预训练和自定义AI模型。

本周早些时候，DeepSeek-R1模型被纳入微软平台Azure AI Foundry和GitHub的模型目录，开发者将可以在Copilot +PC上本地运行DeepSeek-R1精简模型，以及在Windows上庞大的GPU生态系统中运行。

微软宣布将DeepSeek-R1部署在自家的云服务Azure上。社交平台

AWS（亚马逊云科技）也宣布，用户可以在Amazon Bedrock和Amazon SageMaker AI两大AI服务平台上部署“功能强大、成本效益高”的DeepSeek-R1模型。

报道称，规模较小的美国科技公司也采用了DeepSeek模型，美国AI初创公司Perplexity也宣布接入了DeepSeek模型，将其与OpenAI的GPT-o1和Anthropic的Claude-3.5 并列作为高性能选项。

Perplexity首席执行官在接受采访时表示，DeepSeek模型堪称“疯狂”。“这些中国团队推出了一个疯狂的模型，API价格比GPT-4便宜10倍，甚至比Claude便宜15倍，速度极快，并且在某些基准测试中与GPT-4相当，甚至更好。他们总共只花了500万美元的计算机预算，就做出了如此惊人的模型，并且免费公开了技术论文。”

️DeepSeek被攻击、禁用、下架、调查

美国科技公司在使用DeepSeek-R1模型的同时，仍不忘对DeepSeek加以攻击。

据《金融时报》报道，OpenAI称，它掌握了DeepSeek使用OpenAI的专有模型来训练自己的开源模型的证据，并暗示这可能违反了OpenAI服务条款。

OpenAI说，DeepSeek使用了数据蒸馏技术开发R1和V3模型。这种技术将复杂模型的知识提炼到简单模型。通过已有的高质量模型来合成少量高质量数据，并作为新模型的训练数据。这意味着新模型可以从旧模型中获益，而无需承担构建旧模型所投入的大量时间、算力等成本。

OpenAI的服务条款规定，用户可以使用OpenAI的API输出接口将其AI技术与自己的应用程序相结合，但禁止用户“复制”其任何服务或“使用其输出来开发与OpenAI竞争的模型”。用蒸馏输出构建竞争模型涉嫌违反OpenAI服务条款。

不过，OpenAI未披露其掌握的证据细节。彭博社则报道称，数据蒸馏技术在业内很常见。

转载请注明原文地址:http://www.hongxiuz.cn/tech/1456082.html