-
达观大模型管理平台上线两大全新功能
最近,达观大模型管理平台上线了两大全新功能。除了更大参数量级的70B曹植模型,更重量级的是上线全新曹植MoE模型,独家支持在平台上完成MoE大模型私有化部署、一键训练,支持用户对曹植MoE模型进行和常规模型同样的SFT微调、模型量化(支持INT8、INT4、INT3、INT2)、封装服务接口、Prompt指令定制等运维流程。 曹植MoE模型不光支持多语种,而且全面支持中文(Mixtral 8x7B…...- 0
- 2
-
阿里推出视频模型:AtomoVideo文本+图片生成视频
阿里巴巴集团的技术团队推出了文本+图片生成高保真视频模型——AtomoVideo。 用户通过AtomoVideo只需要提供高清图片和简单的文本提示,就能快速生成高清视频并保留逼真的细节。 根据评测数据显示,AtomoVideo生成的视频在动作连贯性、图片一致性、时序一致性、运动强度等方面超过了VideoCrafter、I2VGEN-XL、SVD开源模型,可媲美商业模型Gen-2和Pika。 论文地…...- 0
- 1
-
英伟达性能超强大模型Nemotron-4 15B上线
最近,英伟达推出了大型语言模型Nemotron-4 15B,以其卓越性能和创新架构引起广泛关注。该模型拥有150亿参数,在8T token上完成了训练,目标是打造一个能在单个A100/H100可跑的通用大模型。 Nemotron-4 15B采用了标准的Transformer架构,包括多头自注意力机制和前馈神经网络。其独特之处在于,Nemotron-415B结合了自注意力和全局注意力机制,以更好地理…...- 0
- 2
-
Anthropic官宣发布Claude 3 一举击败GPT-4
3月4日晚,著名生成式AI平台Anthropic在官网首次推出Claude 3系列模型,号称该公司最快、最强的AI模型和机器人聊天工具。Claude3在多项测试中表现优于GPT4,Claude 3在多模态和语言能力等指标上表现出色,树立了新的行业基准。 Claude 3系列包括Claude 3 Haiku、Claude 3 Sonnet和Claude 3 Opus,能力逐级增强。Opus作为最先进…...- 0
- 5
-
谷歌推出生成交互大模型Genie
2月26日,谷歌Deep Mind团队发布基础世界模型Genie,一个虚拟生成的可交互环境,110亿参数,通过给模型投喂视频数据进行训练,生成照片、草图甚至可以操控的虚拟世界。 此次,谷歌另辟蹊径,发布的这款交互式世界生成模型Genie,引起了业内很高的关注度。业内人士对于谷歌在AI领域的发展期待又有所回升。 Genie是一个110亿参数的基础世界模型,在超过20万小时的二维(2D)游戏视频上进行…...- 0
- 5
-
LTX Studio:生成式AI电影制作平台,比Sora更专业更精准
2月29日,著名AI平台Lightricks宣布,推出生成式AI电影制作平台—LTX Studio。 用户可以通过输入文本来生成超过25秒的微电影视频,并且可以对视频的镜头切换、角色、场景一致性、摄像机、灯光等进行可视化精准控制。这些视频由神经网络完成,用户无法对生成的内容进行任何内容控制。目前LTX Studio支持免费申请试用,将在3月27日开启第—批测试。 美国人工智能公司OpenAI于2月…...- 0
- 128
-
ChatGPT编程时代:GitHub Copilot Enterprise正式全面发布
2月28日,全球最大开源平台之一GitHub在官网宣布——GitHub Copilot Enterprise正式全面发布。 GitHub Copilot Enterprise核心模块之一GitHub Copilot,是一款基于OpenAI的GPT-4模型,并结合自身积累十多年真实、安全可靠的代码数据开发而成,开发人员通过文本提示就能获取、审核、扩展代码等功能。 例如,用C语言写一个吃豆游戏的代码;…...- 0
- 2
-
可文字可图片可视频的多模态大世界模型火爆上线
Sora的爆火,也使得人们对于大模型的探索愈演愈烈。他们深知未来主流模型一定是文本+音频+图像+视频的多模态模型,当然这其中的挑战也是非常大的。为了应对这些挑战,加州大学伯克利分校的研究人员开源了一种训练数据更多、理解能力更强的基础模型——大世界模型(Large World Model,简称“LWM”)。 Large World Model(LWM)是一个通用的大环境多模态自回归模型,它利用了一个…...- 0
- 4
-
OpenAI推出“Meta-Prompting”,显著提升GPT-4等模型内容准确性
OpenAI、斯坦福大学的研究人员推出了一个创新大模型增强框架——Meta-ProMetating(简称“Meta”)。 Meta可增强GPT-4、PaLM和LLaMa等模型的性能,使生成的内容更加精准、安全可靠。 其技术原理也很简单明确,通过将模型复杂的任务或问题分解为更小、可管理的子任务,并将其分配给功能更强的专家模型来进行指导。 实验数据显示,Meta与GPT-4相结合后,在不同任务中的测试…...- 0
- 2
-
微软推出LongRoPE框架 支持200万tokens上下文
最近,微软研究院便推出了LongRoPE框架,支持200万tokens上下文,超过了谷歌的输入上限。 在LLaMA 2、Mistral主流开源大模型上,微软研究人员对LongRoPE进行了评估。结果显示,使用LongRoPE后,各大模型保持了原始架构和性能,并对位置嵌入进行少量修改,就可以使用大部分现有的优化。 微调成本高、长文本稀缺以及新标记位置引入的灾难性值是大多数大模型的上下文窗口长度无法实…...- 0
- 3
-
国务院国资委召开中央企业人工智能专题推进会 扎实推动AI赋能产业焕新
2月19日,国务院国资委召开“AI赋能 产业焕新”中央企业人工智能专题推进会。国务院国资委党委书记、主任张玉卓在会上讲话强调,要深入学习贯彻习近平总书记关于发展人工智能的重要指示精神,推动中央企业在人工智能领域实现更好发展、发挥更大作用。中国科学院院士鄂维南应邀介绍人工智能创新发展情况。国务院国资委党委委员、副主任谭作钧、袁野、王宏志通过视频形式出席会议。国务院国资委党委委员、副主任苟坪主持会议。…...- 0
- 4
-
Stable Diffusion 3来啦!提示文本理解更好,图像质量更强
2月23日,著名大模型开源平台stability.ai在官网推出了——Stable Diffusion 3。 该版本与Stable Diffusion 2相比,在文本语义理解、色彩饱和度、图像构图、分辨率、类型、质感、对比度等方面大幅度增强,可对标闭源模型Midjourney。 Stable Diffusion 3的参数在8亿——80亿之间,也就是说Stable Diffusion 3可能是专为移…...- 0
- 4