-
谷歌发布全新大模型Gemini 2.0
最近,谷歌发布了新一代人工智能大模型——Gemini 2.0。该模型是其目前最强大的人工智能模型,“专为智能体时代设计”,不仅性能卓越,还在多模态输入输出方面取得了重大进展。 Gemini 2.0的核心特点在于其强大的多模态能力,它支持原生图像和多语言音频输出,以及原生工具使用。这意味着,该模型能够理解和处理包括文本、图像、视频和音频在内的多种输入类型,并提供相应的输出结果。此外,Gemini 2…...- 0
- 5
-
OpenAI宣布ChatGPT全面接入苹果全家桶
OpenAI在第五天技术直播中宣布,ChatGPT已全面接入苹果,包括iPhone,iPad和Mac,支持Apple Intelligence(苹果智能)的苹果设备即可开启ChatGPT功能。 此次苹果与OpenAI的合作,主要包含三个方面: 1、Siri有了智能助手 用户可以在几乎任何应用程序中唤醒Siri或写作工具。通过双击命令键,就能调出Siri提示框,而当Siri判断任务过于复杂时,系统会…...- 0
- 11
-
OpenAI重磅发布ChatGPT内置功能Canvas
OpenAI在第四天技术直播中发布了最新功能Canvas。Canvas直接内置在ChatGPT中,提供了一个单独的窗口,主要用于编程、写作任务,会提供意见、审核和执行具体的功能,旨在提升用户在这些领域的工作效率和内容质量。 Canvas之前处于测试阶段,现在已广泛提供给所有ChatGPT用户,无论其支付等级如何。 Canvas是一个功能强大的协作平台,为用户开辟了独立的工作页面,在此页面中,用户能…...- 0
- 4
-
OpenAI正式发布Sora Turbo
近日,OpenAI在第三天技术直播中正式发布了Sora Turbo。该模型是目前全球生成时长最高的视频模型之一,能通过文本直接生成最多20秒1080P视频,同时支持文本+图片/视频,生成特定视频内容,使得模型的生成效果更加可控。 目前,Sora已经正式进入使用阶段,ChatGPT Plus和Pro会员无需额外费用就能使用。 为了让用户能够更好地使用Sora,OpenAI还开发了全新UI,同时提供社…...- 0
- 9
-
MetaLlama推出最新开源模型Llama 3.3-70B
最近,Meta发布了最新开源模型Llama 3.3-70B。Llama 3.3-70B采用了最新的后训练技术,参数规模仅700亿,能实现和Meta最大Llama模型——4050亿参数的Llama 3.1同样的性能,成本还比Llama 3.1更低。 在一系列行业基准测试中,Llama 3.3-70B的表现超越了谷歌的Gemini 1.5 Pro、OpenAI的GPT-4o以及亚马逊新发布的Nova …...- 0
- 5
-
OpenAI发布满血版推理模型o1
OpenAI在为期12天活动的第一天就推出了最强推理模型o1满血版,还有更强的Pro版本一同登台。o1是世界上最智能的模型,比o1-preview更智能、更快速、功能更多(例如多模态)。现已在ChatGPT中上线,即将在API中推出。新推出的ChatGPT Pro将能够充分利用模型和工具,包括无限接入OpenAI o1和一个仅仅有Pro版本的o1。 OpenAI表示,与预览版本相比,现在的o1模型…...- 0
- 7
-
OpenAI宣布将进行12天的技术分享活动
美国AI初创公司OpenAI于近日宣布将进行为期12天的技术分享活动,每个工作日都会有一个直播,展示最新技术或产品演示,包括许多重磅内容和一些小惊喜。 这次12天的技术分享活动是史无前例的,在整个科技界都非常罕见。据网友预测,本次活动内容可能包括:发布文生视频模型Sora、为ChatGPT引入圣诞老人风格语音、增强ChatGPT的高级语音模式并增加视觉功能、发布o1-preview、展示即将推出的…...- 0
- 13
-
腾讯开源了最强的类Sora文生视频模型HunyuanVideo
最近,腾讯开源了目前最强的类Sora混元视频生成大模型(HunYuan-Video)。模型参数量130亿,具备物理模拟、一镜到底、文本语义还原度高、动作一致性强、色彩分明、对比度高等技术特性。 腾讯混元视频生成模型HunYuan-Video是一款突破性的视频生成模型,提供超写实画质质感,能够在真实与虚拟之间自由切换。它打破了小幅度动态图的限制,实现完整大幅度动作的流畅演绎。 HunYuan-Vid…...- 0
- 11
-
谷歌发布双思维Talker-Reasoner AI框架
最近,谷歌DeepMind发布了具备两种思维模式的Talker-Reasoner AI框架,这一创新架构能够模拟人类的两种思维方式——快速和慢速思考,对于解决复杂、冗长的任务来说帮助巨大,也突破了传统AI Agent执行业务流程的方法,极大提升了效率。 Talker-Reasoner AI框架的设计灵感来源于诺贝尔经济学奖得主丹尼尔·卡内曼在其著作《思考,快与慢》中提出,并被广泛接受为理解人类思维…...- 0
- 14
-
谷歌Ai2开源最新语言模型OLMo 2
AI研究机构Ai2最近正式开源了最新的开放性语言模型OLMo 2,引起了广泛关注。这款模型不仅提供了强大的生成能力,更以其全面的开源特性和创新的训练方法,标志着生成式人工智能领域的一次重要进展。 OLMo,即Open Language Model,与Llama和Gemma等流行的开放权重模型不同,它不仅提供模型权重,还包括了工具、数据集、训练配方等所有用于开发模型的内容。 此次开源的OLMo 2包…...- 0
- 14
-
阿里开源QwQ-32B推理人工智能模型
近日,阿里巴巴Qwen团队开源了QwQ-32B-Preview推理人工智能模型,为人工智能领域带来重大突破。该模型不仅在数学和编程领域展示了卓越的深度推理能力,更在多项基准测试中表现出色,成为与OpenAI的o1模型相媲美的强劲竞争者。 QwQ-32B-Preview主要特点就是推理很强,可以给出很长的透明化推理流程,这与国内DeepSeek前不久刚发布的R1-Lite很相似。在数学、代码以及各种…...- 0
- 30
-
Runway推出全新文生图模型Frames
近日Runway推出了全新文生图模型Frames,该模型以卓越的风格一致性和视觉真实感为特色,为创作者提供了前所未有的风格控制能力。不仅能够保持风格的一致性和可控性,还允许用户进行广泛的创意探索,能生成复古、数码、杂志、动态、运动、拼图等不同类型风格的图片。 Frames不仅仅是一个AI工具,更是一个能够帮助用户构建完整视觉世界的创意引擎。Frames与传统的通用图像生成模型不同,具有以下几方面特…...- 0
- 18