DeepSeek-R1最新模型重磅开源

最近,全球著名开源大模型平台DeepSeek开源了DeepSeek-R1最新模型。据悉,其代码生成与复杂推理能力已媲美OpenAI顶级o3模型,甚至在编程任务中可一次性生成工业级代码及配套测试用例,首次运行通过率接近100%,此前仅有o3能稳定做到这一点。

DeepSeek-R1

DeepSeek-R1-0528模型权重现已上传到HuggingFace,不过模型卡暂未更新。

这段时间以来,OpenAI、谷歌等巨头密集迭代模型,而DeepSeek未有所动。此次DeepSeek再度以开源为矛,刺向全球AI竞争最敏感地带。据开发者实测,R1模型不仅逻辑严密性显著提升,能自主纠正思维链错误,其响应风格更与o3高度趋同——从箭头符号使用到分层递进式解释,甚至结尾的“why it works”总结段落,均展现出与顶级商业模型同级的交互成熟度。在代码生成领域,实测表明R1与Anthropic Opus 4差距已缩小至“毫厘之间”,部分创造性解法甚至更优。

据悉,DeepSeek-R1-0528使用2024年12月所发布的DeepSeek V3 Base模型作为基座,但在后训练过程中投入了更多算力,显著提升模型的思维深度与推理能力。更新后的R1模型在数学、编程与通用逻辑等多个基准测评中取得当前国内所有模型中首屈一指的优异成绩,并且在整体表现上已接近其他国际顶尖模型,如o3与Gemini-2.5-Pro。

相较于旧版R1,新版模型在复杂推理任务中的表现有显著提升。例如在AIME2025测试中,新版模型准确率由旧版的70%提升至87.5%。这一进步得益于模型在推理过程中的思维深度增强:在AIME2025测试集上,旧版模型平均每题使用12K tokens,而新版模型平均每题使用23Ktokens,表明其在解题过程中进行了更为详尽和深入的思考。

DeepSeek表示,DeepSeek-R1-0528的思维链对于学术界推理模型的研究和工业界针对小模型的开发都将具有重要意义。

目前,国内外已经有多家云服务器商支持DeepSeek部署服务,包括亚马逊云科技、阿里云、腾讯云、华为云、百度智能云等。用户可以根据自身的需求在合适的云服务器商处自行部署DeepSeek大模型。

下面是本文为大家整理的一些通过国内云主机部署DeepSeek大模型的案例:

1、亚马逊云科技

用户可以通过免费亚马逊国内云主机(Amazon EC2)来部署DeepSeek,提供的配置为1核1G、30GB SSD、高频Intel Xeon处理器、性能可突增的CPU,可免费试用12个月。

点击获取:亚马逊免费云主机

相关推荐:

如何注册亚马逊AWS账号?

亚马逊免费云服务器部署DeepSeek-R1教程

2、阿里云

用户可以通过阿里云主机部署DeepSeek大模型,建议选择GPU型云主机。

阿里云官网:点击进入

相关推荐:《阿里云主机通过Open WebUI部署Deepseek-R1教程

3、腾讯云

腾讯云提供类型丰富的GPU云主机计算实例,非常适合部署DeepSeek大模型。

腾讯云官网:点击进入

相关推荐:《腾讯云GPU云主机部署满血版DeepSeek模型教程

服务商动态

阿里云重磅推出全新升级的轻量应用服务器

2025-1-14 10:05:45

学堂

LangChain是什么?LangChain可以干什么?

2024-7-24 16:22:50

相关推荐