-
阿里巴巴开源新一代通义千问模型Qwen3
最近,阿里巴巴宣布推出新一代通义千问模型Qwen3并进行开源,该模型是国内首个“混合推理模型”,将“快思考”与“慢思考”集成进同一个模型,参数量仅为DeepSeek-R1的1/3,成本大幅下降,并在ChatBot Arena等榜单中性能全面超越R1、OpenAI-o1等全球顶尖模型,登顶全球最强开源模型。 此次,阿里一共开源了两个MoE模型的权重:Qwen3-235B-A22B和Qwen3-30B…...- 0
- 9
-
字节跳动开源多模态智能体UI-TARS-1.5
近日,豆包大模型团队(字节跳动大模型团队)表示,正式发布并开源多模态AI Agent UI-TARS的最新1.5版本。该版本智能体基于视觉-语言框架构建,旨在通过虚拟环境中的任务执行提升基础模型的通用推理能力,在计算机使用、浏览器使用和手机使用等基准测试中均表现非常出色。 在计算机使用方面,OSworld测试得分为42.5,高于OpenAI CUA的36.4、Claude 3.7的28以及之前的最…...- 0
- 19
-
谷歌AI发布全新的混合量子模拟方法
随着DeepSeek的全球火爆,带动了整个AIGC领域的发展,谷歌于近日发布了一种全新的模拟-数字混合量子模拟方法,可在保持速度的同时增强可控制性,颠覆了传统量子计算的模拟方法,在研究量子热化和临界现象方面实现了重大突破。 为了解决传统的量子模拟面临的“灵活性差”和“速度快却无法控制,速度上来了却无法精准控制所有粒子的相互作用”两大难题,谷歌发布了全新的混合量子模拟方法,该方法在保证模拟速度的前提…...- 0
- 6
-
OpenAI发布首个Agent官方开发指南
最近,OpenAI发布了首个关于Agent的官方开发指南,旨在帮助开发者如何通过其SDK快速开发智能体。这个指南详细介绍了从智能体的大模型选择,工具定义,复杂智能体,安全护栏等所有开发流程,并附加了大量实际开发案例,为开发者提供了清晰的开发框架和思路。 根据OpenAI的调研显示,在客服、供应链管理、代码审查等场景中,超过60%的流程因涉及非结构化数据处理或模糊决策,难以通过传统自动化技术实现。 …...- 0
- 23
-
微软重磅开源DeepSeek-R1魔改版MAI-DS-R1
最近,微软重磅开源DeepSeek-R1魔改版MAI-DS-R1,在保留原有推理性能的基础上,在响应和屏蔽词方面进行了改进。MAI-DS-R1可以响应99.3%的敏感话题提示,比原版R1提升了2倍,这对于政治学术研究、社会问题、伦理道德研究等帮助巨大。有一点需要注意的是,安全风险大幅度降低,比原版R1降低了50%。 微软在训练MAI-DS-R1的过程中,从大约350000个被屏蔽的主题示例中,收集…...- 0
- 40
-
谷歌首推开源标准智能体交互协议A2A
近日,谷歌在Google Cloud Next 2025大会上宣布开源首个标准智能体交互协议——Agent2Agent Protocol(简称A2A),标志着智能体交互领域的一大突破。此前,Anthropic的模型上下文协议(MCP)为智能体提供了一种结构化的工具使用方式,而A2A则为智能体提供了一种相互协作的方式,将孤立的机器人转变为数字工作团队。此外,谷歌还开源了Agent开发套件ADK,内部…...- 0
- 51
-
Together AI联合Agentica开源最新模型DeepCoder
近日,著名大模型训练平台TogetherAI和智能体平台Agentica联合开源了新模型DeepCoder-14B-Preview,引起了广泛关注。该模型以仅有的140亿参数,在代码测试平台LiveCodeBench上的得分为60.6%,超过了OpenAI的o1模型(59.5%),仅略低于o3-mini(60.9%)。这一成绩在Codeforces和AIME2024的评测中也表现出色,与o1和o3…...- 0
- 27
-
Meta发布最新开源AI大模型Llama 4
近日,美国科技巨头Meta公司发布了其大型语言模型Llama的最新版本,Llama 4 Scout与Llama 4 Maverick。该模型是Meta迄今为止最先进的模型,也是同类产品中多模态性最强的模型。此外Meta还预览了其迄今最强大最智能的模型——Llama 4 Behemoth,是“新模型中的教师”。 Llama 4模型是Llama系列模型中首批采用混合专家(MoE)架构的模型,这一架构也…...- 0
- 21
-
OpenAI开源全新AI Agent评测基准PaperBench
近日,美国开放人工智能研究中心OpenAI宣布推出PaperBench。这是一个评估AI智能体复现前沿AI研究能力的基准,主要考核智能体的搜索、整合、执行等能力,需要对2024年国际机器学习大会上顶尖论文的复现,包括对论文内容的理解、代码编写以及实验执行等方面的能力。 据悉,在PaperBench上测试多个前沿模型后发现,表现最佳的智能体Claude 3.5 Sonnet(新版)结合开源框架,平均…...- 0
- 31
-
OpenAI即将发布开放权重语言模型
近日,OpenAI CEO Sam Altman正式宣布,将在未来几个月内推出一款具备推理能力的强大开放权重语言模型力。这次OpenAI选择回归开源初心——这是自2019年GPT-2之后,OpenAI首次开源语言模型。 Sam Altman表示,虽然这一想法已酝酿许久,但此前其他优先事项占据了主导地位。如今,发布这款模型的时机变得尤为重要。 即将发布的新模型具有两大特点:开放权重和强化推理能力。 …...- 0
- 19
-
微软与清华联合发布SECOM
近期,微软和清华的研究人员联合发布了一种专用于个性对话Agent的记忆构建和检索的创新方法,SECOM。 研究人员在LOCOMO和Long-MT-Bench+两个超复杂数据集上进行了综合评估,结果显示,在LOCOMO数据集上,SECOM的GPT4-Score达71.57,比全历史方法(54.15)高17.42分,比轮次级方法(65.55)高6.02分。而在Long-MT-Bench+中,其88.8…...- 0
- 19
-
OpenAI发布Agent SDK重大更新
最近,OpenAI对Agent SDK进行了重大更新支持MCP服务,可以统一接口标准解锁无限工具。现在Agent SDK可以快速集成网络搜索、专业分析、本地查询、网络追踪等各式各样的工具,这对于开发超复杂自动化智能体来说帮助巨大。例如,在开发一个需要同时进行文件处理、数据查询和网络信息收集的智能体时,开发者可以通过MCP服务器分别集成文件系统工具、数据库查询工具和网络爬虫工具,更高效地完成复杂任务…...- 0
- 36