美国公司“真香了”,但数据中心...

fjmyhfvclm2025-02-02  9

【文/观察者网 张菁娟】尽管美国国会众议院首席行政事务官正在对深度求索(DeepSeek)进行审查,但不少美国公司已经“真香了”。

据香港《南华早报》2月1日报道,包括英伟达、微软、亚马逊在内的多家美国公司纷纷抢先采用中国人工智能(AI)初创企业的DeepSeek-R1模型。而DeepSeek引发的市场动荡,让一些人开始重新思考围绕人工智能的信贷狂潮。

️多家美国公司“拥抱”DeepSeek

英伟达1月30日在官网宣布,DeepSeek-R1模型可作为NVIDIA NIM微服务预览版使用,称该模型为推理、数学和编码等任务提供了“最先进的推理能力”“高推理效率”以及“领先的准确性”。

据英伟达官网介绍,NVIDIA NIM是NVIDIA AI Enterprise的一部分,为跨云、数据中心和工作站的自托管GPU加速推理微服务提供容器,用于预训练和自定义AI模型。

本周早些时候,DeepSeek-R1模型被纳入微软平台Azure AI Foundry和GitHub的模型目录,开发者将可以在Copilot +PC上本地运行DeepSeek-R1精简模型,以及在Windows上庞大的GPU生态系统中运行。

微软宣布将DeepSeek-R1部署在自家的云服务Azure上。社交平台

AWS(亚马逊云科技)也宣布,用户可以在Amazon Bedrock和Amazon SageMaker AI两大AI服务平台上部署“功能强大、成本效益高”的DeepSeek-R1模型。

报道称,规模较小的美国科技公司也采用了DeepSeek模型,美国AI初创公司Perplexity也宣布接入了DeepSeek模型,将其与OpenAI的GPT-o1和Anthropic的Claude-3.5 并列作为高性能选项。

Perplexity首席执行官在接受采访时表示,DeepSeek模型堪称“疯狂”。“这些中国团队推出了一个疯狂的模型,API价格比GPT-4便宜10倍,甚至比Claude便宜15倍,速度极快,并且在某些基准测试中与GPT-4相当,甚至更好。他们总共只花了500万美元的计算机预算,就做出了如此惊人的模型,并且免费公开了技术论文。”

️DeepSeek被攻击、禁用、下架、调查

美国科技公司在使用DeepSeek-R1模型的同时,仍不忘对DeepSeek加以攻击。

据《金融时报》报道,OpenAI称,它掌握了DeepSeek使用OpenAI的专有模型来训练自己的开源模型的证据,并暗示这可能违反了OpenAI服务条款。

OpenAI说,DeepSeek使用了数据蒸馏技术开发R1和V3模型。这种技术将复杂模型的知识提炼到简单模型。通过已有的高质量模型来合成少量高质量数据,并作为新模型的训练数据。这意味着新模型可以从旧模型中获益,而无需承担构建旧模型所投入的大量时间、算力等成本。

OpenAI的服务条款规定,用户可以使用OpenAI的API输出接口将其AI技术与自己的应用程序相结合,但禁止用户“复制”其任何服务或“使用其输出来开发与OpenAI竞争的模型”。用蒸馏输出构建竞争模型涉嫌违反OpenAI服务条款。

不过,OpenAI未披露其掌握的证据细节。彭博社则报道称,数据蒸馏技术在业内很常见。

转载请注明原文地址:http://www.hongxiuz.cn/tech/1456082.html