-
清华团队发布新的强化学习方法PRIME
最近,清华大学NLP实验室联合上海AI Lab,清华大学电子系及OpenBMB社区提出一种新的结合过程奖励的强化学习方法PRIME。通过这种学习方法,研究人员可以在不依赖任何蒸馏数据和模仿学习的情况下,仅用8张A100,花费一万块钱左右,不到10天时间,就能高效训练出一个数学能力超过GPT-4o、Llama-3.1-70B的7B模型Eurus-2-7B-PRIME。 据悉,研究人员利用Qwen2.…...- 0
- 81
-
面壁智能给大模型接入16000+真实API 效果直逼ChatGPT
近些年,开源大语言模型(LLM)进步飞快,例如LLaMA和Vicuna等模型在各种语言理解、生成任务上展现了极佳的水平。但是,当它们面对更高级别的任务,例如根据用户指令使用外部工具(API)时,仍然有些力不从心。 为了解决这个问题,面壁智能联合来自TsinghuaNLP、耶鲁、人大、腾讯、知乎的研究人员推出ToolLLM工具学习框架,加入OpenBMB大模型工具体系“全家桶”。ToolLLM 框架…...- 0
- 93
-
面壁智能联合知乎开源模型CPM-Bee 发布对话类模型产品“露卡”
5月27日,面壁智能联合知乎在2023中国国际大数据产业博览会上发布了最新的大语言模型成果,发布会上,面壁智能自研模型 CPM-Bee 10B全面开源,并推出对话类模型产品“露卡”(Luca)。这次也是面壁智能和知乎双方继“知海图AI”大模型后的第二次联合公开发布。 面壁智能将自研 CPM-Bee 10B模型开源在OpenBMB开源社区。CPM系列大模型是面壁智能团队的自研模型,享誉已久,其中包括…...- 0
- 176