国泰君安:DEEPSEEK开源低成本模型引发行业巨震

fjmyhfvclm2025-02-03  14

智通财经APP获悉,国泰君安发布研报称,DeepSeek R1具备优异性价比,其蒸馏所得小模型推理性能优越,将加速端侧AI落地。目前硅基流动推出基于昇腾云的DeepSeek R1&V3 推理服务,有望引领国产AI算力、AI芯片技术生态、AI大模型闭环,国产算力产业链及端侧硬件有望受益。

国泰君安主要观点如下:

DeepSeek R1 API定价最低仅为1元/百万tokens,性能对标O1模型,霸榜苹果应用商店140+国家/地区免费应用第一名

根据Deepseek官网,Deepseek R1 API服务定价为0.14 美元/百万输入tokens(缓存命中),2.19美元/百万输出tokens。其在逻辑、数学及中文任务中表现出色,性能优于GPT-4o、O1-mini等模型。优异性价比驱动用户数量快速增长,上线18天日活即破1500万,增速达Chatgpt 13倍,并且霸榜苹果应用商店140+国家/地区免费应用第一名。未来用户数量有望加速提高,带动DeepSeek 服务器算力需求增长。

多token并行与FP8 训练提升V3训练效率,强化学习提高R1推理性能,R1蒸馏驱动端侧小模型落地

DeepSeek V3:(1)首创无辅助损失负载均衡策略,避免专家负载失衡。(2)通过采用多token并行预测与FP8混合精度训练,提高训练信号密度,提升模型推理能力,同时降低训练所需算力。(3)在训练框架中采用DualPipe算法,减少流水线空泡,通过计算-通信重叠隐藏大部分通信延迟。DeepSeek R1:通过引入冷启动数据微调DeepSeek-V3-Base模型以及多阶段训练优化,其推理任务水平达到OpenAI-o1-1217。并且基于其高质量训练样本蒸馏所得的DeepSeek-R1-Distill-Qwen-7B,推理性能超越QwQ-32B-Preview。DeepSeek R1蒸馏所得的高推理性能小模型将加速端侧AI落地,驱动AI手机、AI PC、AI眼镜等硬件出货量上行。

海外巨头纷纷接入,昇腾云携手引领国产AI闭环

基于出色的推理性能及低廉的使用成本,目前微软、英伟达、亚马逊等海外巨头已接入DeepSeek R1 API。硅基流动已推出基于昇腾云服务的DeepSeek模型,其采用华为自研推理加速引擎,性能持平全球高端GPU部署模型效果。昇腾云与DeepSeek合作有望推动国产AI芯片、AI芯片技术生态与AI大模型闭环,加速国产AI算力生态自主可控。

投资建议

推荐中芯国际(00981,688981.SH)、华丰科技(688629.SH),中兴通讯(00763,000063.SZ)、联想集团(00992)、申菱环境(301018.SZ)、泰嘉股份(002843.SZ)等预计受益。

风险提示:端侧模型落地进展不及预期;AI技术迭代不及预期。

转载请注明原文地址:http://www.hongxiuz.cn/tech/1465423.html