微软Azure云服务新增多个AI功能

7月19日,在“Inspire 2023”大会上,微软公布了Azure云服务多个新AI功能,包括向量搜索(也叫矢量搜索)、Whisper音频模型、Llama 2大语言模型和自定义神经语音 (CNV) 等。

体验地址:https://azure.microsoft.com/en-us/homepage-b/

微软Azure云服务

一、向量搜索(矢量搜索)

向量搜索通过将文档和查询表示为高维空间(称为嵌入)中的向量来完成,使用嵌入捕获查询的意向,向量搜索可以返回更符合用户需求的相关结果,即使文档中没有确切的术语。与关键字搜索不同的是,向量搜索会比较查询和内容的向量表示,以便为客户提供更精准、高效的查询服务。简单来说,向量搜索通过比较多维数据点之间的相似性,来找出最相关的精准查询结果。

目前,微软已经将向量搜索功能无缝集成在Azure OpenAI中,使得用户可以开发更强大的生成式AI应用。例如,高效、准确地从大型混合数据集中搜索信息。

二、Llama 2大语言模型

Llama 2是科技巨头Meta最新发布的开源大语言模型。用户可以在Azure上,安全可靠地使用或微调70亿、130亿和700亿三种参数的LLama 2模型。同时Llama 2可以在 Windows上本地运行,这使得Windows 开发人员将能够通过 ONNX以 DirectML执行提供程序为目标来使用该模型,从而在为应用程序集成生成式 AI 体验时实现无缝工作流程。

Llama 2大语言模型

三、Whisper音频模型

Whisper是OpenAI发布的一款语音模型,可以精确高效地转录57种语言,例如,将中文语音转录成英文。Whisper支持批量转录、异步处理、扬声器分类、自定义等功能,最大支持1GB文件,单个请求中可批量处理多达1000个文件,极大提升了转录效率。

据悉,Whisper将很快在Azure OpenAI服务中推出预览版,同时会为用户提供企业级安全,严格保护用户的音频数据隐私,不会搜集用户数据用来训练AI模型。

四、自定义神经语音 (CNV)

自定义神经语音是Azure AI语音的一项功能,可以帮助用户创建与配音员相媲美的自然语音,开发语音助手、客户服务机器人等,适用于有声读物、新闻播报、在线教育等业务场景。自定义神经语音能够开发愤怒、快乐、兴奋、友好、希望、悲伤、大喊、害怕等多种风格语音,并且支持音频风格迁移,而无需添加新的训练数据。

目前,自定义神经语音已全面上市,已帮助AT&T、Progressive、Vodafone和Swisscom等知名企业开发了多种语音解决方案。

服务商动态

思必驰正式发布DFM-2语言大模型 赋能产业升级

2023-7-20 9:57:28

服务商动态

IDC发布AI大模型技术能力分析报告 阿里云获6项满分

2023-7-21 14:06:05

相关推荐