-
微软发布支持o1模型的10个AI Agent
最近微软一次性推出10个新的AI Agent,10个Agent组团出道,包揽客服、销售、财务、仓储等业务,开创全新的智能自动化工作模式。这些AI Agent支持OpenAI最新模型o1具备自主学习能力,可以自动执行跨平台的超复杂业务,能节省大量时间和运营成本。 AI Agent会从Microsoft 365 Graph、Dataverse以及其他业务系统的数据,分析工作数据,识别工作模式、趋势,以…...- 0
- 5
-
上海交大、腾讯联合发布新的微调方法SaRA
为了解决预训练模型微调及应用于实际业务场景中存在的一些问题,上海交大、腾讯联合发布了新的微调方法SaRA。这种微调方法主要是利用那些在预训练过程中由于训练不稳定性而变得看似无效,实则具有学习新知识的潜力的参数。 SaRA微调方法的特点: 1、在图像生成任务方面,传统的微调方法可能无法充分利用模型中的所有参数,导致部分参数在训练过程中未被有效利用;而SaRA方法通过对这些暂时无效的参数进行重新训练,…...- 0
- 11
-
OpenAI重磅推出ChatGPT Windows版
近日OpenAI宣布推出ChatGPT Windows版,所有ChatGPT Plus、Enterprise、Team和Edu用户都可以使用。用户可在微软的应用商店中下载,安装完成后通过Alt+Space快捷键就能迅速启用。 ChatGPT Windows版介绍 1、Companion Chat基本操作 在ChatGPT应用程序打开时按下Alt+Space键即可打开Companion Chat。C…...- 0
- 7
-
阿里国际发布首个大规模商用翻译大模型Marco
最近阿里国际发布了首个大规模商用翻译大模型Marco,支持中、英、日、韩、西、法等15种全球主流语种。目前已在阿里国际AI官网Aidge上发布,面向全球用户开放使用。 在BLEU自动评测指标上,Marco翻译大模型领先于Google翻译、DeepL、GPT-4等市面上的标杆翻译产品。 Marco的主要优势就是由大语言模型驱动,基于语境进行精准翻译。据悉,Marco翻译大模型通过面向多语言的数据筛选…...- 0
- 15
-
OpenAI开源全新智能体Swarm
近日OpenAI研究团队开源发布了多功能协同AI Agent:Swarm。它是一个实验性质的多智能体编排框架,主打的就是工效与轻量。 Swarm与普通AI Agent不同,它可以同时创建多个智能体互相协同工作来完成特定任务,包括客户服务、销售支持和售后服务等,同时每个智能体都配备了一套专属工具集以更高效的完成任务。 Swarm介绍 Swarm是轻量级、可扩展且高度可定制的,最适合处理存在大量独立功…...- 0
- 8
-
北大快手联合开源超高清视频模型Pyramid-Flow
近日北大联合快手开源超高清视频模型Pyramid Flow发布,仅通过文本就能生成最多10秒、1280x768分辨率和24帧视频。Pyramid Flow在光影效果、运动动作一致性、视频质量、文本语义还原、色彩搭配等多个方面表现非常出色。 Pyramid-Flow使用A100 GPU在开源数据集上仅训练了20,700小时,其能耗和生成效率比市面上同类开源视频模型好很多,对于没有大量算力的中小企业和…...- 0
- 14
-
Meta最新大模型Movie Gen发布
最近Meta公司发布了最新大模型Movie Gen,这是一款能够生成带有声音的高清视频的创新工具,也标志着Meta正式进军文生视频领域。 Movie Gen能够根据文本提示创造长达16秒、每秒16帧的1080P超高清视频,支持73K token上下文,为现有视频配上音频,或对现有视频进行编辑,甚至能够利用照片制作出以真实人物为主题的定制视频。 Movie Gen功能介绍 1、文生视频 Movie …...- 0
- 11
-
ChatGPT全新功能Canvas上线
最近OpenAI正式发布了全新的工作界面——Canvas,旨在为用户提供一个更为高效的写作与编程环境。这个界面是用OpenAI的最新主力模型GPT-4o构建,用于利用ChatGPT合作进行不仅限于聊天的写作和编码项目工作。 Canvas是一个独立的窗口,用户可以在这个页面中与ChatGPT、Canvas一起协作执行任务,并且是自动触发。Canvas的推出,是响应市场对更加协作、互动的AI工具日益增…...- 0
- 16
-
Meta发布多模态Llama 3.2新模型
最近Meta发布了多模态Llama 3.2新模型,能够同时理解图像和文本。此次一共发布了四个版本,分别为Llama 3.2 1B、Llama 3.2 3B、Llama 3.2 90B和Llama 3.2 11B。 其中Llama 3.2 1B和Llama 3.2 3B是整个系列最轻量级的模型,适合边缘设备和移动应用程序的检索和摘要,可用于个人信息管理和多语言知识检索等,支持128k标记的上下文长度…...- 0
- 9
-
字节跳动发布豆包视频生成大模型
最近字节跳动旗下火山引擎发布最新豆包视频生成大模型,分别是PixelDance和Seaweed,正式进军文生视频领域。 豆包视频生成大模型能够轻松实现自然连贯的多拍动作以及多主体复杂交互,生成的视频更加精准、逼真。通过该大模型生成的视频可以精准地遵循复杂提示指令,让不同人物在视频中完成多个动作指令的互动,且互动过程流畅自然,毫无生硬之感。以下就是豆包视频生成大模型的特色之处: 1、细节处理方面 豆…...- 0
- 6
-
OpenAI向ChatGPT付费用户开放高级语音模式
最近OpenAI向ChatGPT的所有付费用户开放了备受期待的高级语音模式,新增了自定义指令、语音记忆存储、5种新声音、语速以及新增了50多种语音(最初是40种),同时支持中文模式,接下来就一起来了解一下。 1、新增了5个声音模式 可以选择不同的声音来与你交互,包括冷静、热情、才艺、开朗等不同风格,来满足不同的场景。 2、新增的高级语音自定义指令功能 用户可以通过高级语音自定义指令功能进行更详细的…...- 0
- 17
-
IBM发布Docling模型 可快速转换PDF文档格式
为了解决PDF文档转换为机器可处理的格式的这一极具挑战性的难题,IBM的研究人员基于PDF解析器、大模型、OCR等多种技术开发了Docling模型。该模型可将PDF文档保留全部格式的情况下快速转换成JSON、Markdown格式。 Docling模型使用了模块化设计方法,将整个PDF文档处理流程拆解为一系列连续的操作步骤,每个步骤都由专门的模块来执行。这不仅提升了执行效率和准确率,还极大增强了模型…...- 0
- 27