DeepSeek团队正在加速推出R2人工智能模型

DeepSeek正在加速推出其R2人工智能模型,该公司最初计划在5月推出,但目前正在努力尽快推出。这款产品将搭载华为昇腾AI芯片,使用混合专家模型架构以及为推理负载优化的选通网络。

DeepSeek-R2

DeepSeek-R2是由中国DeepSeek团队研发的AI模型,其技术突破源自团队2025年提出的奖励模型解决方案,包含Pointwise GRM架构与Self-Principled Critique Tuning训练方法。该模型具备多轮对话、代码生成及跨模态理解能力,在长文本处理与实时学习技术层面实现升级,并通过与当贝AI平台的技术对接拓展应用场景。

2025年6月,该模型因美国对英伟达H20芯片的供应限制导致开发延迟。其训练成本仅为行业平均水平的1/70,采用生成式奖励模型实现可解释性评分,通过并行采样与Meta RM引导投票策略提升推理准确性。作为行业开源技术标杆,该模型研究成果为AI模型对齐人类偏好提供了技术基础。

据悉,DeepSeek-R2将运行在昇腾910B芯片集群上,对华为云AI芯片的利用率达到了82%。此外,其FP16精度下的算力达到512 PetaFLOPS,相当于A100集群效率的91%。

近日市场传出深度求索下一代大模型DeepSeek-R2的发布消息,预计时间窗口为8月15日至30日。对此,DeepSeek内部人士表示,该消息不实,并确认DeepSeek-R2在8月内并无发布计划。虽然具体发布日期尚未确定,但是DeepSeek-R2开工作一直在继续,预计在不久的将来就会与大家见面。

行业动态

阿里云通义千问Qwen Code提供每日2000次免费运行权限

2025-8-11 17:40:33

行业动态

OpenAI正式发布ChatGPT网络搜索功能

2024-11-1 10:00:34

相关推荐