近日,SambaNova与Together联合推出了类ChatGPT开源模型——BLOOMChat。
BLOOMChat是基于BigScience在2022年7月开源的大语言模型BLOOM开发而成,并在OpenChatKit、Dolly 2.0和OASST1的数据训练集上进行微调。 所以,BLOOMChat也算是一个组合模型,通过将市面上最强大的开源模型与海量数据训练集相融合,属于开源界的“变形金刚”。
从BLOOMChat发布的测试数据来看,在英文、中文、法语等6 种语言的人工评估中,BLOOMChat的响应首选次数为 45.25%。
在同是6种语言的环境下,BLOOMChat与OpenAssistant、LLaMA-Adapter、BLOOMZ开源模型相比,BLOOMChat的响应在65.92%,成为最佳开源产品,有效填补了开源领域多语言聊天能力的空白。
尤其是在中文领域,国外多数开源类ChatGPT几乎都不支持中文,即便是支持中文其训练数据也非常少,在回答问题方面生硬、老套极易出错。根据BLOOMChat的展示的中文示例来看,其文本回答的逻辑、词语搭配、丝滑程度几乎可以与ChatGPT相媲美。
BLOOMChat的翻译能力也非常出色。根据其在 WMT14-fr-en、WMT14-hi-en的翻译任务上的表现来看,BLOOMChat仅比GPT-4略差,比OpenAssistant、LLaMA-Adapter、BLOOMZ等开源模型的性能高出一大截。
BLOOMChat表示,其性能与所有大语言模型一样会出现“胡说八道”、重复语句、非法内容输出、代码生成可能会出现BUG等问题。但BLOOMChat会持续优化这些问题,为用户提供最先进、高性能的开源模型。
总之,BLOOMChat与目前市面上大多数类ChatGPT开源模型相比,在预训练数据、指令调优、功能扩展、AI对齐等方面拥有巨大优势。对于企业和个人开发者来说,无论用于商业化项目还是技术研究都是一个不错的选择。
开源地址:https://huggingface.co/sambanovasystems/BLOOMChat-176B-v1
在线体验地址:https://huggingface.co/spaces/sambanovasystems/BLOOMChat
AI俱乐部,致力于打造最专业的AI交流社群。
星球将分享:
1、ChatGPT的使用方法,最新资讯,商业价。
2、邀请顶尖行业大佬,每周给大家发现一个商业落地案例。
3、组织星球小伙伴一起参与实战项目,亲身感受AI浪潮。
4、系列课程和训练营,手把手带着大家去实操ChatGPT。
5、一些副业思考、创业案例、落地案例分享。
6、最早期、专业的AI交流社群。探讨未来关于ChatGPT的机遇,帮助大家解决遇到的问题。
如果有小伙伴感兴趣的话,可以一起加入星球哦!