DeepSeek团队正在加速推出R2人工智能模型

行业动态
2025年8月14日
0
编辑

DeepSeek正在加速推出其R2人工智能模型，该公司最初计划在5月推出，但目前正在努力尽快推出。这款产品将搭载华为昇腾AI芯片，使用混合专家模型架构以及为推理负载优化的选通网络。

DeepSeek-R2

DeepSeek-R2是由中国DeepSeek团队研发的AI模型，其技术突破源自团队2025年提出的奖励模型解决方案，包含Pointwise GRM架构与Self-Principled Critique Tuning训练方法。该模型具备多轮对话、代码生成及跨模态理解能力，在长文本处理与实时学习技术层面实现升级，并通过与当贝AI平台的技术对接拓展应用场景。

2025年6月，该模型因美国对英伟达H20芯片的供应限制导致开发延迟。其训练成本仅为行业平均水平的1/70，采用生成式奖励模型实现可解释性评分，通过并行采样与Meta RM引导投票策略提升推理准确性。作为行业开源技术标杆，该模型研究成果为AI模型对齐人类偏好提供了技术基础。

据悉，DeepSeek-R2将运行在昇腾910B芯片集群上，对华为云AI芯片的利用率达到了82%。此外，其FP16精度下的算力达到512 PetaFLOPS，相当于A100集群效率的91%。

近日市场传出深度求索下一代大模型DeepSeek-R2的发布消息，预计时间窗口为8月15日至30日。对此，DeepSeek内部人士表示，该消息不实，并确认DeepSeek-R2在8月内并无发布计划。虽然具体发布日期尚未确定，但是DeepSeek-R2开工作一直在继续，预计在不久的将来就会与大家见面。

阿里云通义千问Qwen Code提供每日2000次免费运行权限

2025-8-11 17:40:33

DeepSeek重磅开源V3.1-Base模型

2025-8-20 13:51:31

相关推荐

TOP1

恒创科技香港轻量云服务器适合建站吗
16小时前
TOP2

UCloud GPU云服务器怎么选推理训练和图形渲染算力购买参考
16小时前
TOP3

尊云企业云服务器配置怎么选
2026年7月16日
衡天云日本云服务器适合外贸网站吗
2026年7月16日
重磅启动！2026人工智能前沿学术会议邀您共襄盛会
2026年7月15日
莱卡云GPU云服务器按小时租用贵不贵
2026年7月15日