-
Open-Sora开源大升级 支持16s视频生成和720p分辨率
开源文生视频模型Open-Sora目前已经进行了大升级,现已支持16s视频生成和720p分辨率。并且可以处理任何宽高比的文本到图像、文本到视频、图像到视频、视频到视频和无限长视频的生成需求。 Open-Sora坚持全部开源,包含Open-Sora的模型架构、最新的模型权重、多时间/分辨率/长宽比/帧率的训练流程、数据收集和预处理的完整流程、所有的训练细节。 据最新结果显示,Open-Sora在gi…...- 0
- 6
-
LTX Studio:生成式AI电影制作平台,比Sora更专业更精准
2月29日,著名AI平台Lightricks宣布,推出生成式AI电影制作平台—LTX Studio。 用户可以通过输入文本来生成超过25秒的微电影视频,并且可以对视频的镜头切换、角色、场景一致性、摄像机、灯光等进行可视化精准控制。这些视频由神经网络完成,用户无法对生成的内容进行任何内容控制。目前LTX Studio支持免费申请试用,将在3月27日开启第—批测试。 美国人工智能公司OpenAI于2月…...- 0
- 167
-
OpenAI重磅推出首个文生视频模型Sora
2月16日凌晨,OpenAI发布了首个文生视频模型Sora。Sora基于DALL-E与GPT框架,通用人工智能(AGI)迎来里程碑。 Sora取自日语中的“天空”一词,根据官方介绍,该模型可以生成长达一分钟的视频,同时保持视觉品质并遵循用户提示。它能够生成具有多个角色、特定类型的运动以及精确的主题和背景细节的复杂场景。除了能够仅由文本指令生成视频外,该模型还能够获取现有的静态图像并从中生成视频,并…...- 0
- 4
-
谷歌发布Project Astra 全面叫板OpenAI
近日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,以及在硬件方面发布的第六代Tensor处理器单元(TPU)Trillium芯片。 其中,Project Astra是谷歌DeepMind发布的一款全新的AI代理产品,可以实现跨文本、音频、视频多模态实时推理,丝毫不逊色OpenAI发布的GPT…...- 0
- 4
-
OpenAI推出新工具 能识别由DALL-E 3生成的内容
最近,OpenAI在官方社交媒体账号称,推出新的分类器,以帮助研究人员们识别由DALL·E 3所生成的内容。另推出一个媒体管理器,主要是面向媒体行业、内容创作者的产品,帮助控制自己的知识产权内容是否会被OpenAI搜集用于训练AI模型。 目前,OpenAI已经开放了DALL·E 3识别器的API,开发人员从今天开始至7月31日可申请试用。OpenAI会在8月31日之前公布获取使用权限的名单。 识…...- 0
- 7
-
StreamingT2V即将开源 两分钟生成1200帧的长视频
最近,Picsart AI Resarch等机构联合推出了StreamingT2V视频模型。StreamingT2V不仅能够根据文本描述生成长视频,而且能够保持视频的时间连贯性和高质量图像帧,其生成的视频长度可达到1200帧,即两分钟的播放时长。 长视频生成模型StreamingT2V的出现,标志着文本到视频内容生成领域迈入了一个新的里程碑。StreamingT2V在高速运动方面非常优秀,这为开发…...- 0
- 46
-
天翼云位列混合云价值影响力三维矩阵领导者域
近日,由中国信息通信研究院、中国通信标准化协会、弗若斯特沙利文联合主办的“2024云计算价值影响力矩阵发布会暨产业分析师闭门会”在京召开。会上重磅发布了《2023混合云价值影响力矩阵》三维成果图,天翼云位列混合云价值影响力三维矩阵领导者域。 凭借在混合云市场的技术成熟度、市场增长性、战略前瞻性三个维度的出色表现,天翼云领先于95%的企业,是混合云市场领导者、混合云技术引领者和混合云技术战略引领者。…...- 0
- 6
-
可文字可图片可视频的多模态大世界模型火爆上线
Sora的爆火,也使得人们对于大模型的探索愈演愈烈。他们深知未来主流模型一定是文本+音频+图像+视频的多模态模型,当然这其中的挑战也是非常大的。为了应对这些挑战,加州大学伯克利分校的研究人员开源了一种训练数据更多、理解能力更强的基础模型——大世界模型(Large World Model,简称“LWM”)。 Large World Model(LWM)是一个通用的大环境多模态自回归模型,它利用了一个…...- 0
- 8