下载看详情
社评:美方可以讹诈一家公司以讹诈一家公司以讹
计算机行业周报:DEEPSEEK连续5日发布新产品 国产AI持续放大招
03-02 和讯 华西证券刘泽晶/赵宇阳
语音播报预计6分钟
本周观点
Deepseek5 日连续更新,国产AI 崛起
国产模型Deep seek 再度5日更新,软件定义硬件能力继续加强,我们认为随着国产模型能力提升加速,国产算力、云、AI商业化落地会持续兑现。
DeepSeek3 月1 日发表题为《DeepSeek-V3/R1 推理系统概览》的文章,全面揭晓V3/R1 推理系统背后的关键秘密。最为引人注目的是,文章首次披露了DeepSeek的理论成本和利润率等关键信息。据介绍,假定GPU 租赁成本为2 美元/小时,总成本为87072 美元/天; 如果所有tokens 全部按照DeepSeek R1 的定价计算,理论上一天的总收入为562027美元/天,成本利润率为545%。
Day 1: FlashMLA —— GPU 的“加速器”亮点:FlashMLA 是为 NVIDIA Hopper GPU 打造的解码内核,专攻变长序列,内存带宽 3000 GB/s,计算性能 580 TFLOPS,支持 BF16 和分页 KV 缓存。
Day 2: DeepEP —— 大模型的“通讯员”亮点:DeepEP 是混合专家模型(MoE)的通信库,支持 NVLink 和 RDMA,优化大规模训练和推理的通信效率。
Day 3: DeepGEMM —— 计算的“ 大力士” 亮点:
DeepGEMM 是 FP8 矩阵运算库,性能 1350+ TFLOPS,代码才 300 行,简单高效。
Day 4: DualPipe & EPLB —— 训练的“双人舞”亮点:
DualPipe 是双向流水线并行算法,优化计算和通信重叠;EPLB 是专家负载均衡工具,提升 MoE 效率,还附带性能分析数据。
Day 5: 3FS —— 数据管理的“超级管家”亮点:3FS(Fire-Flyer File System) 是分布式文件系统,峰值吞吐量 6.6TiB/s,推理缓存 40 GiB/s,支持数据准备、加载、检查点和缓存。
投资建议
受益标的:
云: 金山云、优刻得、品高股份、青云科技、首都在线、微盟集团、迈富时; AI agent:金山办公、润达医疗、新致软件、开普云、彩讯股份、科大讯飞;
机器人:祥鑫科技、秦安股份、信质集团、三联锻造、均胜电子、华依科技;
机器人大小脑:科远智慧、能科科技、麦迪科技。
一体机:开普云、天玑科技、恒为科技、云从科技、卓翼科技、苏州科达等。
风险提示
市场系统性风险、科技创新政策落地不及预期、中美博弈突发事件
【免责声明】本文仅代表第三方观点,不代表和讯网立场。投资者据此操作,风险请自担。
(责任编辑:贺翀)
查看全文
去“和讯财经”看本文专题