-
谷歌宣布开源最新模型Gemma-3 号称能媲美DeepSeek
随着DeepSeek的爆火,国内外的人工智能研究机构都压力倍增。近日,谷歌宣布开源最新多模态大模型Gemma-3,主打低成本高性能。Gemma-3共有10亿、40亿、120亿和270亿四种参数。但即便最大的270亿参数,只需要一张H100就能高效推理,同类模型要达到这个效果最少要提升10倍算力,也是目前最强小参数模型。 谷歌表示,Gemma-3是一系列轻量级、最先进的开源模型,其构建基于与Gemi…- 26
- 0
-
OpenAI发布最新研究CoT监控器
近期,OpenAI发布了最新研究,用CoT(思维链)监控的方式,可以阻止大模型胡说八道、隐藏真实意图等恶意行为,同时也是监督超级模型的有效工具之一。 OpenAI使用了最新发布的前沿模型o3-mini作为被监控对象,并以较弱的GPT-4o模型作为监控器。测试环境为编码任务,要求AI在代码库中实现功能以通过单元测试。结果显示,CoT监控器在检测系统性“奖励黑客”行为时表现卓越,召回率高达95%,远超…- 11
- 0
-
阿里推出最新开源推理模型QwQ-32B
阿里云通义千问宣布发布并开源最新的推理模型QwQ-32B,这是一款拥有320亿参数的模型,在数学、代码及通用能力上整体性能比肩DeepSeek-R1,并降低了部署使用成本,在消费级显卡上也能实现本地部署。目前,QwQ-32B已在Hugging Face和ModelScope开源,并采用了Apache 2.0开源协议。 QwQ-32B通过整合强化学习和结构化自我提问,进一步提升了性能,旨在成为推理A…- 12
- 0
-
OpenAI推出NextGenAI联盟
OpenAI最新推出了NextGenAI,这是一个由加州理工学院、加州州立大学、杜克大学、佐治亚大学、哈佛大学等15家领先研究机构组成的首创联盟,致力于利用人工智能加速科研突破并变革教育。 NextGenAI联合了美国和国外的机构,旨在以比任何一个机构都更快的速度促进进步。这一倡议不仅是为了推动下一代的发现,也是为了让下一代人为塑造人工智能的未来做好准备。NextGenAI加强了学术界和工业界之间…- 14
- 0
-
微软发布医疗AI助手Dragon Copilot
近日,微软公司宣布推出一款名为Dragon Copilot的医疗AI助手,旨在加强临床工作流程。Dragon Copilot是基于语音+文本的混合架构,能够将医生的语音或临床口述内容实时转换为文本,之后它可做进一步处理自动生成专业的医嘱、病历、总结临床摘要、转诊信等,并将内容自动录入到专业的医疗系统中,极大简化了医疗流程解放医生双手。 微软首席执行官Satya Nadella对Dragon Cop…- 22
- 0
-
微软开源创新框架Prompt Wizard
最近,微软开源了一个创新框架-Prompt Wizard,旨在自动化和简化提示优化过程,提升大型语言模型(LLMs)在特定任务中的表现。PromptWizard通过自我进化和自适应机制,结合迭代反馈和高效的探索技术,能够在短时间内生成高效的提示,显著减少传统提示工程所需的时间和精力。 Prompt Wizard的核心由多个模块组成,通过其自我进化和自我适应的机制以及反馈驱动的批评和综合过程,实现…- 16
- 0
-
OpenAI发布最新模型GPT-4.5
美国开放人工智能研究中心(OpenAI)在线上技术直播中发布了最新模型GPT-4.5,作为预览研究逐步向用户开放。OpenAI在新闻稿中表示,这是公司有史以来最大、最好的聊天模型,在计算效率上较GPT-4提升超过10倍。 早期测试显示,与GPT-4.5的交互更加自然,超过OpenAI o1、OpenAI o3-mini并且幻觉非常低;其更广泛的知识储备、更强的用户意图理解能力以及更高的“情商”,使…- 19
- 0
-
苹果开源最新通用多模态视觉模型AIMv2
苹果的研究人员最近开源了最新通用多模态视觉模型AIMv2,它是一系列开放式视觉编码器,包含19个不同参数大小的模型——从300M到2.7B,支持224、336和448像素的分辨率,适用于手机、PC等不同类型的设备。 AIMV2使用了一种创新的多模态自回归预训练方法,将视觉与文本信息深度融合,为视觉模型领域带来了新的技术突破。简而言之,就是AIMV2不再局限于仅处理视觉信息的传统模式,而是将图像和文…- 19
- 0
-
微软开源多模态AI Agent基础模型Magma
最近,微软在官网开源了多模态AI Agent基础模型——Magma。与传统Agent相比,Magma具备跨数字、物理世界的多模态能力,能自动处理图像、视频、文本等不同类型数据,此外Magma还能内置了心理预测功能,增强了对未来视频帧中时空动态的理解能力,能够准确推测视频中人物或物体的意图和未来行为。 Magma模型的技术架构具有显著的创新性。它采用了先进的深度学习算法,能够自动学习和提取多模态数据…- 21
- 0
-
Anthropic发布首个双思维模型Claude 3.7
近日,人工智能初创公司Anthropic宣布发布Claude 3.7 Sonnet,称这是其迄今为止最智能的模型,也是市场上首款混合推理模型。 Claude 3.7提供了标准和扩展两种思考模式:标准思考是无需进行复杂的推理过程,就能立刻提供答案;扩展思维则提供复杂的推理过程,会展示详细的推理思维链,用户可以清晰地看到模型是如何逐步分析问题、应用逻辑,非常适合数学、生物等科研领域,还能通过API精准…- 16
- 0
-
微软发布专用于游戏领域创新大模型Muse
近日,微软发布了一款名为Muse的生成式人工智能模型,宣称将彻底革新视频游戏场景的制作方式。 Muse是基于Transformer架构的,但创建游戏场景的方式却非常独特,并不依赖传统的文本提示,而是通过游戏画面和控制器操作的序列化数据作为输入提示,从而生成连贯的游戏场景和玩法,同时更符合游戏机制和物理规则的游戏内容。 游戏开发是一个高度复杂的过程,涉及创意构思、角色设计、场景搭建、玩法策划等多个环…- 14
- 0
-
微软开源最新动态蛋白质生成模型BioEmu-1
近日,微软开源了BioEmu-1,一种最新动态蛋白质生成模型。该模型能在单个GPU上每小时生成数千种蛋白质结构,生成效率比传统MD模拟提高了几个数量级。 这种超高效率的蛋白质生成模型可以帮助医学家更全面、快速地了解靶点蛋白质的动态变化,设计出有效治疗癌症等绝症药物。此外,每位癌症患者的肿瘤细胞都具有独特的基因突变和蛋白质表达谱。而BioEmu-1可以根据患者特定的基因序列预测蛋白质的结构变化,提供…- 20
- 0
-
Meta宣布举办首届生成式AI开发者大会
最近,Meta宣布将在今年4月29日举行首届LlamaCon——专门面向生成式AI的开发者大会,旨在分享Meta在开源AI领域的最新进展,帮助开发者构建出色的应用和产品。 在这场即将到来的大会上,Meta计划展示多项与Llama模型相关的新功能和技术进展。Llama模型自推出以来下载量已达数亿次,已经吸引了至少25个合作伙伴进行托管,显示出其在行业中的广泛应用。Meta的CEO马克・扎克伯格表示,…- 7
- 0
-
OpenAI宣布开源SWELancer基准测试
近日,OpenAI重磅开源了SWE-Lancer,一个针对真实世界自由软件工程工作进行模型性能评估的基准测试。该基准测试基于来自Upwork和Expensify存储库的1400多个自由职业任务,总支付金额达到100万美元。 SWE-Lancer的一个重要创新是其采用的端到端测试方法。与传统的单元测试不同,端到端测试能够模拟真实用户的工作流程,验证应用程序的完整行为。这种方法不仅能够更全面地评估模型…- 27
- 0
-
韩国首尔国立大学推出创新文生视频模型FIFO-Diffusion
最近,韩国首尔国立大学推出创新文生视频模型FIFO-Diffusion,这是一种基于预训练扩散模型的新颖推理技术,用于文本条件视频生成,其无需训练即可生成无限长的视频。 FIFO-Diffusion模型使用了一种创新的“对角去噪”方法来克服生成长视频的难题,以队列的方式来处理视频帧的连续,该技术灵感来源于工厂的流水线作业。在每一步中,完全去噪的帧从前端出队,新的随机噪声帧在末端入队。这确保了每帧生…- 18
- 0
-
AMD与约翰霍普金斯大学联合开源Agent Laboratory
近日,AMD联合约翰霍普金斯大学的研究团队开源了一个名为Agent Laboratory的AI Agent。它利用LLM作为研究助手,能够从文献综述到实验设计和报告撰写全流程自动化,可以帮助科研人员节省时间快速撰写论文,显著加速科学研究过程。 简而言之,用户只需要提供概念想法,Agent Laboratory就能自动检索arXiv的文献、完成实验设计、内容生成和实验报告,一站式自动化写论文。 Ag…- 21
- 0
-
GitHub的AI编程助手Copilot迎来重磅更新
最近,全球最大的开源平台之一GitHub宣布了对AI编程助手Copilot的重大更新,新增了AI Agent模式,能够自动迭代代码、识别并修复漏洞,极大地提升了开发效率。同时还发布了Project Padawan的预览版,以及正式上线了去年10月推出的Copilot Edits功能,为开发者带来了全新的编程体验。 1、GitHub Copilot的Agent模式 在传统的代码编辑器中,开发者往往需…- 33
- 0
-
斯坦福&牛津联合发布高效的大模型攻击框架BoN
最近,斯坦福大学联合牛津大学、Tangentic、UCL等研究人员联合开发了一种高效的大模型攻击框架——Best-of-N Jailbreaking(简称BoN),该框架可以用来测试大模型的安全性。 BoN框架主要通过对输入提示进行多样化的变换,检测大模型在不同模态下的安全漏洞。据悉,当使用10,000个增强样本时,Claude 3.5 Sonnet的被攻击的成功率达到了78%,GPT-4o则达到…- 39
- 0
-
OpenAI推出AI智能体Operator
OpenAI宣布上线名为Operator的首款AI智能体,它能通过网页执行各种任务。该智能体可以像人类一样使用按钮、浏览菜单和填写网页上的表格,并自动执行预订旅行住宿、预订餐厅和在线购物等任务。 与传统Agent和RPA不同的是,Operator的最大技术特点是无需依赖API或特定网站就能完成所有自动化操作,它是通过对屏幕截图的分析,识别页面元素,然后使用鼠标和键盘进行模拟。Operator是基于…- 20
- 0
-
OpenAI发布o1模型新方法
近日,OpenAI发布了一项o1模型新方法,通过增加推理时间、算力资源来大幅度提升模型的对抗鲁棒性。OpenAI提出的新方法不需要对大模型进行专门的对抗训练,也不需要提前了解攻击的具体形式。只需要通过增加推理时间和算力资源,模型就可以更充分地利用其推理能力表现出更强的鲁棒性。 为了测试这项新技术,OpenAI在o1-preview和o1-mini模型进行了综合实验,结果显示,成功抵御了Many-s…- 24
- 0
-
Runway开放全新文生图模型Frames
近日,知名文生视频模型平台Runway面向所有用户开放了Frames使用权,可以在其官网使用了。该模型不仅能够保持风格的一致性和可控性,还允许用户进行广泛的创意探索,能生成复古、数码、杂志、动态、运动、拼图等不同类型风格的图片。 Runway联合创始人表示,Frames专为创意领域打造,其提示系统能让用户获得精确且有深度的结果,呈现出细腻、自然且富有电影感的画面。从用户反馈来看,他们对Frames…- 24
- 0
-
Adobe联合加州大学推出音乐模型DITTO-2
全球多媒体巨头Adobe联合加州大学的研究人员推出了一款创新音乐模型DITTO-2,该模型是在扩散模型的基础之上,对生成音乐的效率、控制能力,例如,音乐修复、音乐扩展、强度调整、旋律控制以及音乐结构控制等进行大幅度强化。 DITTO-2与传统的音乐模型相比,将音乐生成的效率提升了10—20倍左右,并且训练成本非常低,在A100 GPU上只训练了30多个小时。 DITTO-2亮点介绍 1、模型蒸馏模…- 33
- 0
-
OpenAI发布深度经济蓝图报告
近日,OpenAI发布了深度经济蓝图报告,长达15页,旨在探讨如何扩大美国在全球人工智能(AI)领域的影响力,尤其是在当前日益激烈的国际竞争中保持领先地位。 这份报告强调,芯片、数据、能源和人才是推动这一新一轮AI“军备竞赛”的四大关键要素,保证这些要素的强大供应链至关重要。 全球科技市场正经历深刻变革,OpenAI经济蓝图恰逢其时。当前,1750亿美元的全球投资基金正等待寻找合适的AI投资项目,…- 35
- 0
-
清华团队发布新的强化学习方法PRIME
最近,清华大学NLP实验室联合上海AI Lab,清华大学电子系及OpenBMB社区提出一种新的结合过程奖励的强化学习方法PRIME。通过这种学习方法,研究人员可以在不依赖任何蒸馏数据和模仿学习的情况下,仅用8张A100,花费一万块钱左右,不到10天时间,就能高效训练出一个数学能力超过GPT-4o、Llama-3.1-70B的7B模型Eurus-2-7B-PRIME。 据悉,研究人员利用Qwen2.…- 52
- 0