谷歌发布Project Astra 全面叫板OpenAI

近日,在谷歌I/O开发者大会上的主题演讲中,谷歌展示了由升级后Gemini模型驱动的AI助手项目Project Astra、对标Sora的文生视频模型Veo,以及在硬件方面发布的第六代Tensor处理器单元(TPU)Trillium芯片。

其中,Project Astra是谷歌DeepMind发布的一款全新的AI代理产品,可以实现跨文本、音频、视频多模态实时推理,丝毫不逊色OpenAI发布的GPT4o。

Project Astra主要功能:

1、实时解读

研究员通过手机的摄像头让Astra对所有听到、看到的东西进行解读。可以点击扬声器、画笔、代码让其解释用途和含义。此外,Astra还可以与谷歌眼镜一起配合使用,这也就是说盲人戴上它在走路、看东西时获得实时解读功能。

2、视觉能力展示

研究员让Astra对一些草图、物品进行深度解读和联想。

3、提升搜索体验帮助

研究员通过视频让Astra解释,为什么留声机的指针没有放在转盘上,Astra会直接跳转搜索页面给出详细的解决方案。

4、诈骗电话提醒

当你接到诈骗电话时,Astra都可以及时提醒你。

AI代理可以做什么?

AI代理并非现阶段才出现的,最早的AI代理雏形就是20多年前一款外挂神器——按键精灵。它可以通过用户输入的指令来执行特定操作,例如,让游戏人物只在特定场景打怪。不过使用方法比较繁琐,需要一些编程基础。随后按键精灵演变成RPA(机器人流程自动化)从游戏场景扩展至办公领域,并在OCR、NLP、ML等多种AI加持下实现自动化完成,在金融、日常办公、数据搬运等应用非常广泛。

Astra、Project Astra在大模型加持下的AI代理属于第三代,在使用方式、能力方面获得巨大提升,为我们做的事情也更多。

  • 健康管理与医疗咨询:AI健康代理助手可以通过分析用户输入的症状、健康记录和生活习惯,提供个性化的健康建议和早期疾病预警。
  • 客户服务自动化:AI代理可以集成在客服系统中,提供7*24小时无间断服务。能够理解和回应用户查询,提供账户信息、解决常见问题、处理交易等。
  • 个性化学习辅导:AI学习代理可以根据学生的学习进度、兴趣和难点定制个性化学习计划。通过分析学生的互动,识别其强项和弱点,然后调整教学内容和难度,以适应学生的学习速度,从而提高学习效率和成效。

目前,谷歌并没有公布Project Astra具体的发布时间,仍处于开发阶段。估计很快会登录到Android、iOS等平台中使用。

行业动态

OpenA发布最新多模态模型GPT-4o

2024-5-14 9:55:53

行业动态

字节跳动正式发布豆包大模型

2024-5-16 14:40:29

相关推荐