微软开源Deep Speed Chat 人手一个ChatGPT时代到来

4月12日,微软宣布开源Deep Speed Chat,帮助用户训练类ChatGPT等大语言模型。

微软开源Deep Speed Chat 人手一个ChatGPT时代到来

Deep Speed Chat基于微软的Deep Speed深度学习优化库,使得训练类ChatGPT模型变得简单、快速且高效。不仅如此,Deep Speed Chat还使用了RLHF(基于人工反馈机制的强化学习)技术,大幅度提升了训练速度和降低了成本。想象一下,仅需1.25小时就能完成一个130亿参数的类ChatGPT模型的训练。这意味着我们即将进入一个拥有强大人工智能技术的时代,而且这种技术将不再是富有的科技巨头的专利,而是普通人都可以拥有的实用工具。

简单来说,用户通过Deep Speed Chat提供的“傻瓜式”操作,能以最短的时间、最高效的成本训练类ChatGPT大语言模型,这标志着一个人手一个ChatGPT的时代要来了。

微软为何决定开源Deep Speed Chat?

ChatGPT以其强大的能力席卷全球,成为了用户增长速度最快的消费级应用,对世界经济发展和科技研发产生了重要影响。然而,大量企业和个人用户由于庞大的资源和资金投入而无法参与之,急切地想参与到这场AI技术变革中。此次微软开源Deep Speed Chat,正是为了满足这些渴求参与的人们的需求,让更多的普通用户也能够体验到类ChatGPT模型带来的便利和高效。

尽管开源领域已经推出了诸如LLaMa、Alpaca、Vicuna和Databricks-Dolly等优秀的类ChatGPT项目,但仍然缺乏一个支持端到端基于RLHF的规模化系统。而微软开源Deep Speed Chat正是为了填补这一空白,使得训练强大的类ChatGPT模型变得简单且高效。随着越来越多的用户参与进来,整个行业生态将更快地壮大发展,进一步加速了AI技术的普及和应用。

微软通过开源Deep Speed Chat,使得更多人能够参与到AI技术的开发和应用中,极大地推动了AI技术在全球范围内的影响力和应用价值。随着技术的不断成熟和完善,我们相信,未来的AI技术将会在全球范围内为各行各业带来巨大的经济效益和社会价值。

Deep Speed Chat技术简单介绍

Deep Speed Chat拥有强化推理、RLHF模块、RLHF系统三大核心功能。它实现了简化的类ChatGPT模型训练和强化推理。通过一个简单的脚本,用户就能完成多个训练步骤,生成属于自己的类ChatGPT模型。同时,Deep Speed Chat还提供了一个易于使用的推理API,用于在模型训练后测试对话性能。

DeepSpeed-RLHF模块复刻了InstructGPT论文中的训练模式,并确保包括监督微调(SFT)、奖励模型微调和基于人类反馈的强化学习(RLHF)等三个步骤与其对应。此外,还提供了数据抽象和混合功能,以支持用户使用多个不同来源的数据源进行训练。

DeepSpeed-RLHF系统将DeepSpeed的训练和推理能力整合到统一的混合引擎(DeepSpeed Hybrid Engine或DeepSpeed-HE)中用于RLHF训练。DeepSpeed-HE能够在RLHF中无缝地在推理和训练模式之间切换,使其能够利用来自DeepSpeed-Inference的各种优化。例如,张量并行计算和高性能CUDA算子进行语言生成,同时对训练部分还能从ZeRO-和LoRA-based内存优化策略中受益。DeepSpeed-HE可以自动在RLHF的不同阶段进行智能的内存管理和数据缓存。

迈向全民ChatGPT时代的未来展望

微软开源Deep Speed Chat的举措,可谓开创了一个全新的AI技术普及时代。在这个时代里,越来越多的企业和个人用户能够轻松地训练并拥有自己的ChatGPT模型,从而推动全球经济发展,为各行各业创造更多价值。

服务商动态

百度智能云人工智能基础数据服务,第一!

2023-4-14 9:44:59

服务商动态

亚马逊云科技推出大语言模型和生成式AI新服务

2023-4-14 10:33:54

相关推荐