火爆全球ChatGPT让大模型技术进入更多人视野,国内大厂也都纷纷使出了自己的看家本领。百度发布文心大模型,华为发布盘古大模型,商汤发布日日新大模型,阿里发布通义千问大模型,腾讯即将发布混元AI大模型,科大讯飞“星火认知大模型”将在5月6日正式发布……一时间,各大企业AI大模型落地的消息接踵而至,今天就跟随小编一起来了解一下吧!
一、百度:文心大模型
百度文心大模型源于产业、服务于产业,是产业级知识增强大模型。百度通过大模型与国产深度学习框架融合发展,打造了自主创新的AI底座,大幅降低了AI开发和应用的门槛,满足真实场景中的应用需求,真正发挥大模型驱动AI规模化应用的产业价值。
文心大模型的一大特色是“知识增强”,即引入知识图谱,将数据与知识融合,提升了学习效率及可解释性。文心ERNIE自2019年诞生至今,在语言理解、文本生成、跨模态语义理解等领域取得多项技术突破,在公开权威语义评测中斩获了十余项世界冠军。2020年,文心ERNIE荣获世界人工智能大会WAIC最高奖项SAIL奖。
二、华为:盘古大模型
盘古大模型,是华为旗下的盘古系列AI大模型,包括NLP大模型、CV大模型、科学计算大模型。
在自然语言处理领域,盘古大模型能够帮助企业构建自己的模型,通过接入模型即可使用预训练的预测结果,无需自己再去预测,从根本上提升了开发效率,而且模型的性能也得到了显著的提升。
在计算机视觉领域,盘古大模型能够帮助企业完成图像分类、目标检测、分割等任务,并且在图像分类任务上,精度已经达到了业界领先的水平。
在文本领域,盘古大模型能够帮助企业完成文本分类、关键词提取等任务,并且在文本分类任务上,精度已经达到了业界领先的水平。
访问地址:https://www.huaweicloud.com/product/pangu.html
三、商汤:日日新大模型
商汤日日新大模型是商汤科技宣布推出的大模型体系,包括自然语言生成、文生图、感知模型标注以及模型研发功能。
“大模型+大算力”是商汤科技在通用人工智能领域,确定的发展战略。在这个战略下,公司推出了自然语言处理、内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。
商汤日日新大模型,包括自然语言生成、文生图、感知模型标注以及模型研发功能。
访问地址:https://techday.sensetime.com/
四、阿里:通义千问大模型
通义千问,是阿里云推出的一个超大规模的语言模型,功能包括多轮对话、文案创作、逻辑推理、多模态理解、多语言支持。能够跟人类进行多轮的交互,也融入了多模态的知识理解,且有文案创作能力,能够续写小说,编写邮件等。
通义千问的功能,包括效率类、生活类和娱乐类。其中效率类能够写提纲、进行SWOT分析、生成商品描述;生活类提供根据菜名写菜谱、模仿小学生写作等功能;娱乐类则能够写情书、写诗等。在自由交谈过程中,通义千问对答流畅,具备一定的中文理解和文学创作能力。
2023年4月7日,“通义千问”开始邀请测试,4月11日,“通义千问”在2023阿里云峰会上揭晓。
访问地址:https://tongyi.aliyun.com/
五、腾讯:混元AI大模型
腾讯混元大模型是腾讯开发的一款基于多模态的大规模预训练语言模型,旨在为多模态内容生成、文本生成、图像生成等任务提供更好的性能和效果。
该模型包含了计算机视觉、自然语言处理、多模态内容理解、文案生成、文生视频等多个方向的超大规模AI智能模型,其中多模态内容理解方向的模型规模达到了惊人的1万亿参数。
六、科大讯飞:星火认知大模型
“讯飞星火认知大模型”是科大讯飞于2023年5月6日在讯飞星火认知大模型成果发布会上发布的产品。
2023年4月,据科大讯飞消息,讯飞星火认知大模型成果发布会定于5月6日14:00在安徽创新馆召开。4月24日,科大讯飞星火认知大模型官网正式上线,并已开放需求调研。
“讯飞星火认知大模型”围绕“知识问答、代码编程、数理推算、创意联想、语言翻译”等实用场景,通过海量文本、代码和知识学习,可实现基于自然对话方式的用户需求理解与任务执行。
七、昆仑万维:“天工”3.5
4月10日,昆仑万维宣布,其和奇点智源合作自研、中国第一个真正实现智能涌现的国产大语言模型——“天工”3.5发布在即,并将于4月17日启动邀请测试。
此外,“天工”大模型已经非常接近OpenAI ChatGPT的智能水平。ChatGPT是基于GPT3.5大模型,因此昆仑万维把此版本命名为“天工”3.5。
凭借对AGI的热情和信仰,昆仑万维研发团队自2020年起从一亿级模型做起,到十亿级模型,再到百亿级模型,耕耘三年,如今迎来“天工”3.5的诞生。
访问地址:https://chat.singularity-ai.com/
八、达观数据:曹植
达观基于多年文本智能技术积累和垂直领域场景业务经验,正在积极探索大语言模型LLM的实践,研发国产版GPT“曹植”系统,作为垂直、专用、自主可控的国产版ChatGPT模型,不仅能实现专业领域的AIGC智能化应用,且可内置在客户各类业务系统中提供专用服务。
达观自主研发的“曹植”垂直领域大语言模型将进一步夯实达观产业应用智能化基座,全面增强AI全产品矩阵能力。这也是国内大规模语言模型中首批可落地的产业应用级模型,目前已在金融领域AIGC多场景投入应用。未来可持续赋能金融、政务、制造等多个垂直领域和通用场景人工智能的落地和发展。
访问地址:http://www.datagrand.com/products/aigc/
九、360:360智脑
4月9日,360官方正式宣布,基于360GPT大模型开发的人工智能产品矩阵“360智脑”落地搜索场景,将于4月16日面向企业用户开放内测。
360智脑是一款基于人工智能技术的搜索引擎产品。这款产品将采用先进的自然语言处理技术,通过语音交互和文字输入,智能识别用户的需求,并提供更准确的结果。此外,360智脑还将与浏览器、智能营销、苏打办公、数字助理等场景应用深度结合,提升用户体验及生产力。
360搜索引擎公司在国内市场拥有着广泛的用户基础,这也为他们在市场竞争中占据一席之地提供了有力的支持。
访问地址:https://www.so.com/zt/invite.html#/
十、澜舟科技:孟子MChat可控大模型
澜舟科技成立于2021年,由李开复的创新工场从0孵化的AI企业。据创始人周明介绍,澜舟科技致力于解决人类的语言理解和生成难题,提供基于NLP(自然语言理解)技术的开源大模型以及聚焦于营销、金融、文化创意等场景的功能引擎和应用。
通过近两年在自然语言技术上的研发积淀,澜舟科技已经基于“孟子大模型”核心技术打造了一系列能力平台和垂直场景应用。
在3月14日由创新工场举办的“AI 1.0 到 AI 2.0 的新机遇”趋势分享会上,澜舟科技正式发布了“类ChatGPT”的语言生成模型——孟子MChat可控大模型。
孟子MChat可控大模型强调了其本身“可控”的特色——模型能力相较于其他同类技术更为灵活,面向垂直领域、专业赛道落地会更加聚焦,可以根据行业、地域等需求做出快速调整。据周明介绍,孟子MChat可控大模型有以下几个特点:将陆续推出10B和100B参数级的大模型;具备聊天、问答、翻译、文本生成、信息抽取等多种能力;可融合搜索结果、领域数据和知识图谱;对功能、风格、人类认知等方面具可控性。
十一、网易:玉言
"玉言“是网易伏羲自主研发的中文文本预训练大模型系列。“玉言”大模型的前身是网易伏羲自研的GPT2生成模型,模型规模从最早的一亿参数增长至千亿参数,模型领域从文本拓展到图文、音乐、行为序列等多种模态。
“玉言”大模型的训练语料主要来源于小说、百科和新闻等,相关技术已应用在网易集团内的文字游戏、智能NPC、文本辅助创作、音乐辅助创作、美术设计、互联网搜索推荐等业务场景。
十二、中科院自动化所:“紫东太初”
2021年7月9日,中国科学院自动化研究所所长徐波在2021世界人工智能大会(WAIC2021)上就人工智能的最新进展进行报告,发布了自动化所研发的跨模态通用人工智能平台——“紫东太初”。
“紫东太初” 跨模态通用人工智能平台以多模态大模型为核心,基于全栈国产化基础软硬件平台,可支撑全场景AI应用。
“紫东太初”是全球首个图、文、音三模态大模型,开创性地实现了图像、文本、语音三模态数据间的“统一表示”与“相互生成”,理解和生成能力更接近人类,为打造多模态人工智能行业应用提供创新基础,迈出了向通用人工智能的重要一步。
“紫东太初”项目由中科院自动化所、华为与武汉人工智能研究院基于昇腾AI基础软硬件平台和新一代全场景AI框架——昇思MindSpore共同打造,突破了当前AI技术局限,有效解决当前AI技术“一专一能”、小样本学习能力欠缺、跨模态语义鸿沟的痛点,首次完成以图生音、以音生图等跨模态生成任务,性能在多项国际顶尖竞赛中登顶第一。
十三、智源研究院:悟道2.0
2021年6 月 1 日上午,由北京智源人工智能研究院主办的 2021 北京智源大会在线上线下同步拉开帷幕。会议发布了全球规模最大的人工智能预训练模型“悟道 2.0”,并邀请国内外专家学者分享有关 AI 预训练模型的真知灼见。
“悟道2.0”参数规模达1.75万亿,是AI模型GPT-3的10倍,打破了之前由Google Switch Transformer预训练模型创造的1.6万亿参数记录,是目前中国首个、全球最大的万亿级模型。
与悟道1.0相比,“悟道2.0”不仅在模型规模上实现了万亿级参数的跨越,还在世界公认的9项 Benchmark 上达到了世界第一,在多项基准测试中超越OpenAI GPT-3、DALL·E以及Google ALIGN等先进模型。
智源人工智能研究院是在科技部和北京市委市政府的指导支持下成立的新型研究机构。“悟道”是国内首个超大预训练语言模型系统,由来自北大、清华、人大、中科院等高校院所,以及阿里等诸多企业的100余位AI专家共同研发。
十四、复旦大学:MOSS
MOSS是复旦大学自然语言处理实验室发布的国内第一个对话式大型语言模型。
MOSS可执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。
2023年2月20日,解放日报·上观新闻记者从复旦大学自然语言处理实验室获悉,MOSS已由邱锡鹏教授团队发布,邀公众参与内测。2月21日,该平台发布公告,感谢大家的关注,同时也指出,MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。
访问地址:https://moss.fastnlp.top/
十五、清华大学:ChatGLM-6B
ChatGLM-6B,是清华大学研发的产品。
ChatGLM-6B是一个开源的、支持中英双语问答的对话语言模型,并针对中文进行了优化。该模型基于GLM架构,具有62亿参数。结合模型量化技术,用户可以在消费级的显卡上进行本地部署(INT4 量化级别下最低只需6GB显存)。
十六、知乎:知海图AI
4月13日,2023知乎发现大会在京举办。记者从大会获悉,知乎与面壁智能在AI大模型上将开展最新合作与应用,活动现场正式发布“知海图AI”中文大模型。
知乎和面壁智能合作开发的“知海图AI”中文大模型,已经运用进了知乎热榜,知乎首个大模型功能“热榜摘要”上线并开启内测,利用超强的语言理解能力对知乎热榜上的问题回答进行抓取、整理和聚合,并把回答梗概展现给用户,给大家直观清晰的回答。
展望未来,随着AI大模型在千行百业的深入应用,人工智能将在垂直领域有更多的落地机会。
十七、出门问问:序列猴子
出门问问大模型“序列猴子”是一款具备多模态生成能力的大语言模型,模型以语言为核心的能力体系涵盖“知识、对话、数学、逻辑、推理、规划”六个维度,能够同时支持文字生成、图片生成、3D内容生成、语音生成和语音识别等不同任务。
基于“序列猴子”大模型,出门问问内测探索了多款面向创作者的AIGC产品及应用,其中“奇妙文”的AI写作能力覆盖了职场办公、市场营销、新媒体和创意写作四大内容创作场景,能够在用户撰写年终总结、客服话术、剧本、广告文案等内容时,为其源源不断地提供灵感和创意方向;“言之画”AI绘画平台则支持二次元、蒸汽朋克、插画等8种创作风格,用户只需输入文字,“言之画”就能一次性生成8张光影逼真、细节丰富的2K高分辨率图像;AI配音产品“魔音工坊”则覆盖了AI写作、AI配音和剪辑等多个场景,用户可以在它的辅助下轻松完成影视解说、有声书、在线教育、新闻播报等集文案与配音于一体的内容创作;AI数字形象创作及直播平台“奇妙元”则凭借多模态生成技术,支持图片建模(2D数字人)、视频建模(2.5D数字人)、3D建模 (3D数字人)三种不同形式的数字人生成。
访问地址:https://openapi.mobvoi.com/index
十八、云知声:山海大模型
山海大模型是最新一代认知智能大模型,拥有丰富的知识储备,涵盖科学、技术、文化、艺术、医疗、通识等领域。与她对话即可获取信息、知识和灵感,是人类的良师益友,也是灵动强大的智能助理。
山海大模型可以连接第三方的服务,兼顾隐私性地拓展能力边界。如检索实时信息、理解个性化知识、执行用户操作。山海大模型不仅可以生成各种流畅、连贯的文本,包括新闻、作文、小说、邮件、古诗和对联等各种文案,还可以通过多语种、多文体和多风格的方式支持各种语言生成任务,包括创作、摘要、翻译。此外,还支持多种约束条件下的可控文本生成。
官网:http://shanhai.unisound.com/
十九、智源人工智能研究院:悟道·天鹰
悟道·天鹰(Aquila) 语言大模型是首个具备中英双语知识、支持商用许可协议、国内数据合规需求的开源语言大模型。
Aquila系列模型的中文语料来自智源多年积累的中文数据集,包括来自1万多个站源的中文互联网数据(其中99%以上为国内站源),以及获得国内权威机构支持的高质量中文文献数据、中文书籍数据等。仍在持续积累高质量、多样化的数据集,并源源不断加入Aquila基础模型后续训练中。
Aquila系列模型的源代码基于 Apache 2.0 协议,模型权重基于《智源Aquila系列模型许可协议》,使用者在满足许可限制的情况下,可用于商业目的。
开源地址:https://github.com/FlagAI-Open/FlagAI/tree/master/examples/Aquila
二十、上海人工智能实验室:书生·浦语(InternLM)
InternLM是在过万亿 token数据上训练的多语千亿参数基座模型。通过多阶段的渐进式训练,InternLM 基座模型具有较高的知识水平,在中英文阅读理解、推理任务等需要较强思维能力的场景下性能优秀,在多种面向人类设计的综合性考试中表现突出。
在此基础上,通过高质量的人类标注对话数据结合 RLHF 等技术,使得 InternLM 可以在与人类对话时响应复杂指令,并且表现出符合人类道德与价值观的回复。
开源地址:https://github.com/InternLM/InternLM
二十一、百川智能:baichuan-7B
Baichuan-7B是由百川智能开发的一个开源可商用的大规模预训练语言模型。基于 Transformer 结构,在大约 1.2 万亿 tokens 上训练的 70 亿参数模型,支持中英双语,上下文窗口长度为 4096。在标准的中文和英文 benchmark(C-Eval/MMLU)上均取得同尺寸最好的效果。
开源地址:https://github.com/baichuan-inc/baichuan-7B
二十二、北京大学:ChatLaw
ChatLaw法律大模型目前开源的仅供学术参考的版本底座为姜子牙-13B、Anima-33B,使用大量法律新闻、法律论坛、法条、司法解释、法律咨询、法考题、判决文书等原始文本来构造对话数据。
开源地址:https://github.com/PKU-YuanGroup/ChatLaw
二十三、哈尔滨工业大学:本草
本草大预言模型经过中文医学指令精调/指令微调(Instruct-tuning) 的LLaMA-7B模型。通过医学知识图谱和GPT3.5 API构建了中文医学指令数据集,并在此基础上对LLaMA进行了指令微调,提高了LLaMA在医疗领域的问答效果。
开源地址:https://github.com/SCIR-HI/Huatuo-Llama-Med-Chinese
二十四、OpenBMB:CPM-Bee-10B
OpenBMB开源社区由清华大学自然语言处理实验室和智源研究院语言大模型加速技术创新中心共同支持发起。CPM-Bee-10B是完全开源、可商用的中英双语基础模型,参数容量达百亿级,利用Transformer自回归架构,在万亿级代币的海量语料库上进行了预训练,拥有卓越的基础能力。
OpenBMB系统提供了全面的工具和脚本生态系统,用于高性能预训练、适配、压缩、部署和工具开发。CPM-Bee作为基础模型,附带所有必要的工具脚本,使开发人员能够有效地利用和探索高级功能。
开源地址:https://huggingface.co/openbmb/cpm-bee-10b
二十五、虎博科技:TigerBot
TigerBot是一个多语言多任务的大规模语言模型(LLM)。根据 OpenAI InstructGPT 论文在公开 NLP 数据集上的自动评测,TigerBot-7B 达到 OpenAI 同样大小模型的综合表现的96%。
开源地址:https://github.com/TigerResearch/TigerBot
二十六、上海交通大学:K2
K2是一个地球科学的开源大预言模型。首先通过收集和清理的地球科学文献(包括地球科学开放获取论文和维基百科页面)对 LLaMA 进行进一步预训练,然后使用知识密集型指令调优数据(GeoSignal )。
初步评估采用GeoBenchmark(由NPEE和AP Test on Geology、Geography、Environmental Science组成)作为基准。与具有相似参数的几个基线模型相比,K2 在客观和主观任务上的表现优于基线。
开源地址:https://github.com/davendw49/k2
二十七、智媒开源研究院:MediaGPT
MediaGPT(曾用名Media LLaMA)首先在大规模自媒体语料上进行连续预训练,系统地学习自媒体的知识体系。然后,借助ChatGPT收集了一批关于抖音运营、短视频创作、巨量千川投放、直播运营和直播话术技巧等领域知识问题的分析和回答,并利用这些数据对模型进行指令微调,使模型习得如何将自媒体知识应用到实际场景中。
开源地址:https://github.com/IMOSR/MediaGPT
二十八、度小满:轩辕
轩辕是国内首个开源的千亿级中文对话大模型,同时也是首个针对中文金融领域优化的千亿级开源对话大模型。轩辕在BLOOM-176B的基础上针对中文通用领域和金融领域进行了针对性的预训练与微调,它不仅可以应对通用领域的问题,也可以解答与金融相关的各类问题,为用户提供准确、全面的金融信息和建议。
开源地址:https://huggingface.co/xyz-nlp/XuanYuan2.0
二十九、东北大学:TechGPT
TechGPT是“东北大学知识图谱研究组”发布的垂直领域大语言模型。TechGPT还具备了对计算机科学、材料、机械、冶金、金融和航空航天等十余种垂直专业领域自然语言文本的处理能力。
目前,TechGPT通过提示和指令输入方式的不同,支持单轮对话和多轮对话,涵盖了领域术语抽取、命名实体识别、关系三元组抽取、文本关键词生成、标题生成摘要、摘要生成标题、文本领域识别、机器阅读理解、基础常识问答、基于上下文的知识问答、建议咨询类问答、文案生成、中英互译和简单代码生成等多项自然语言理解和生成能力。
开源地址:https://github.com/neukg/TechGPT
三十、京东:言犀大模型
言犀大模型源于产业、服务产业,融合70%通用数据与30%数智供应链原生数据,具有“更高产业属性、更强泛化能力、更多安全保障”的优势,致力于深入零售、物流、金融、健康、政务等知识密集型、任务型产业场景,解决真实产业问题。
依托京东言犀大模型,以及京东在产业和供应链侧的优势,京东还发布了两大服务平台,包括全新升级的优加DaaS和言犀智能服务平台,以及面向零售、金融、城市、健康、物流五大领域的行业解决方案。
AI俱乐部,致力于打造最专业的AI交流社群。
星球将分享:
1、ChatGPT的使用方法,最新资讯,商业价。
2、邀请顶尖行业大佬,每周给大家发现一个商业落地案例。
3、组织星球小伙伴一起参与实战项目,亲身感受AI浪潮。
4、系列课程和训练营,手把手带着大家去实操ChatGPT。
5、一些副业思考、创业案例、落地案例分享。
6、最早期、专业的AI交流社群。探讨未来关于ChatGPT的机遇,帮助大家解决遇到的问题。
如果有小伙伴感兴趣的话,可以一起加入星球哦!