昆仑万维宣布天工大模型3.0正式上线

2024年4月17日,昆仑万维宣布天工大模型3.0与天工SkyMusic音乐大模型正式开启公测。

天工大模型3.0

一年前的今天,第一版天工大模型正式对外发布上线。一年后的今天正值天工大模型的一周年纪念日,天工大模型3.0就在今天发布了。

天工大模型3.0拥有4000亿参数,超越了3140亿参数的Grok-1,是全球最大的开源MoE大模型。天工大模型3.0在语义理解、逻辑推理、通用性、泛化性、不确定性知识、学习能力等领域拥有突破性的性能提升,数学/推理/代码/文创能力提升超过30%,强大的模型技术实力赋予天工大模型3.0超强的性能表现。

天工大模型3.0的逻辑推理能力、语义理解能力、应对复杂需求能力、内容创作能力全面升级,并新增了多轮搜索与综合工具调用、图表绘制、研究模式、增强模式、改图扩图等多项AI能力,为用户带来全新AI体验。

多轮搜索与综合工具调用

天工大模型3.0针对模型独立规划、调用、组合外部工具及整合信息的能力进行了专项训练,使其能够独立生成并调用代码,完成包括产业研究、产品横评、信息分析、图片生成、图表绘制等多种复杂用户需求。同时,天工大模型3.0能够通过强大的语义理解能力将用户任务拆解成细分环节,实时判断是否需要联网或调用工具,进行单轮或多轮的联网搜索、工具调用,完成包括多轮搜索、热点信息分析、图片生成等复杂用户需求。

图表绘制

天工大模型3.0全面提高了逻辑推理能力与用户自然语言Query的理解能力,使其能够更精准地判断用户需求,独立生成并调用代码,结合文本需求实时进行内容分析及图表构建,为用户带来更直观、高效的对比结果。多轮搜索、综合工具调用、图表绘制等都是天工大模型3.0所独有的大模型综合能力,其从底层打通了天工大模型3.0的AI搜索、AI对话、AI代码生成、AI图片识别、AI图像生成等底层能力,通过语义识别能力直接触发,为用户带来更加便捷、高效的AI体验,成为真正的AI生产力工具。此外,天工大模型3.0中还增加了研究模式、增强模式、改图扩图等多项AI能力。

研究模式

在研究模式中,天工大模型3.0能够围绕用户的某个简单指令进行相关问题的延伸,自动生成研究大纲、图谱、实践总结、思维导图,帮助用户快速清晰地把握核心内容,完成用户复杂的研究需求。

增强模式

在增强模式中,天工大模型3.0能够针对用户的复杂Query进行拆解、细化、并进行追问、信息理解与补全,使其在自然语义理解方面性能更强,面对不确定性知识时表现更好,能够更精准、高效地满足用户需求。

改图扩图

天工大模型3.0多模态性能取得全面突破,超越GPT-4V,综合排名全球第一。在强大的技术底座支持下,天工大模型3.0的AI绘图能力新增了图片尺寸扩展、图片定向调整、垫图生图、垫图进化、垫图扩图等全新功能。

同时,天工SkyMusic也在今日面向全社会开放公测。天工SkyMusic作为天工大模型3.0旗下的音乐大模型不仅是中国首个公开可用的AI音乐生成模型,更是中国的自研大模型技术第一次在AIGC领域领跑全球。据介绍,与行业主流路径不同,天工SkyMusic采用自研大模型音乐音频生成技术路线。这一路线直接通过大模型技术实现乐器、人声、旋律、音量、音符的一体化端到端音乐生成,技术难度极大,全球只有包括昆仑万维在内的极少数顶尖玩家参与。

在与海外顶尖的AI音乐大模型Suno V3的横向测评中,天工SkyMusic在人声&BGM音质、人声自然度、发音可懂度等领域显著领先对手,并以6.65分的综合得分超越Suno V3,成为全球AI音乐SOTA模型。此外,天工SkyMusic还拥有独创的参考音乐生成与方言歌曲生成能力。

参考音乐生成

用户可上传自有参考音乐,或选择天工SkyMusic资料库中现有的参考音乐,从而生成风格、唱腔类似的歌曲,进一步降低音乐大模型的使用门槛,让不熟悉乐理知识的用户也能轻松玩转。

方言歌曲生成

天工SkyMusic生成的音乐不仅在人声自然度、发声可懂度等领域表现优秀,更能够支持粤语、成都话、北京话等众多方言,让用户能够更自由地实现音乐表达,传播方言文化。

行业动态

谷歌发布全新MoE模型Gemini 1.5 Pro

2024-4-10 9:36:07

行业动态

116个 AI 大模型成功备案 可在中国境内合法应用

2024-4-19 10:11:36

相关推荐