-
谷歌推出全新图像生成器Imagen 3
最近谷歌宣布推出了Imagen 3,进一步增强了文本生成图片的技术能力。Imagen 3在文本语义还原、色彩搭配、文本嵌入、图像细节、光影效果等方面都比Imagen 2有了大幅度的提升。目前Imagen 3已经可以在美国地区使用,未来谷歌会持续扩大使用范围。 传统的扩散模型在处理高维复杂数据、图像质量和多样性以及训练稳定性方面有一些缺点,同时开发成本也比较高。在这种背景下谷歌推出了使用了潜空间扩散…...- 0
- 41
-
苹果开源最新通用多模态视觉模型AIMv2
苹果的研究人员最近开源了最新通用多模态视觉模型AIMv2,它是一系列开放式视觉编码器,包含19个不同参数大小的模型——从300M到2.7B,支持224、336和448像素的分辨率,适用于手机、PC等不同类型的设备。 AIMV2使用了一种创新的多模态自回归预训练方法,将视觉与文本信息深度融合,为视觉模型领域带来了新的技术突破。简而言之,就是AIMV2不再局限于仅处理视觉信息的传统模式,而是将图像和文…...- 0
- 27
-
谷歌推出最新视频生成模型Veo 2
近日,谷歌Deepmind推出了最新文生视频模型Veo 2,可直接生成8秒4K视频,同时能根据用户对镜头类型、拍摄角度、电影效果等需求进行精准摄像头生成,包括低角度跟踪镜头、特写镜头等不同类型。 值得一提的是,Veo 2具备很强的物理模拟效果,在动作一致性、光影处理、运动频率以及写真等方面非常优秀。 Veo2作为谷歌的新一代视频生成工具,能够生成多样化主题和风格的高质量视频。谷歌在发布会上指出,这…...- 0
- 45
-
OpenAI发布全新扩散模型sCM
近日OpenAI发布了全新扩散模型方法sCM,仅需两步即可生成高质量图片、3D模型等,速度提升约50倍。该模型以简化的连续时间一致性模型为基础,提供更高的训练稳定性和可扩展性。 sCM扩散模型核心原理是基于一致性模型思路,通过直接将噪声转换为无噪声样本来生成数据。与传统扩散模型不同,一致性模型可找到一条更直接的路径,在单步或少数几步内直接从噪声状态跳跃到数据状态。 sCM扩散模型的特点 1、采用连…...- 0
- 55
-
谷歌产品大更新:Bard可生成图像;文生音乐平台等5大免费功能
2月2日,谷歌在官网对生成式AI产品进行了大更新,包括类ChatGPT聊天助手Bard可以通过文本提示生成图像; 全新的文生音乐平台MusicFX;新的文生图像平台ImageFX;新的文本扩写平台TextFX;在谷歌地图中增加生成式AI功能,用文本提示快速查找路线、店铺等。 值得一提的是,这5大功能目前都是免费使用。其中,文生图像平台ImageFX的功能非常强悍,支持对文本提示中的“关键元素”进行…...- 0
- 55
-
谷歌对Vertex AI大更新 支持Llama 2模型微调
8月30日,谷歌在美国旧金山召开“Google Cloud Next 23”,生成式AI成为本次大会的核心主题。谷歌围绕生成式AI,从基础设施、开发工具到产品全方位多维度地进行了重磅更新。此外,谷歌为了帮助全球开发者提升对生成式AI、大语言模型等开发效率,加速应用场景化落地,对Vertex AI进行了多项功能优化,尤其是发布了全球首个数字水印,用于AI生成的图像识别和安全。 Vertex AI是G…...- 0
- 100