主页 > 资讯 > 新闻 > (none)

(none)

网络 2023-06-06

6月1日消息,阿里云智能今日发布了一项名为"通义听悟"的全新产品,该产品面向公众开放公测。据ITBEAR科技资讯了解,这是阿里云智能推出的首个面向普通消费者的应用产品。

通义听悟利用先进的语音AI技术,能够将音频和视频内容准确转写为易读的文字。在如今的多媒体时代,人们每天处理大量的音频和视频内容,通义听悟为用户提供了高效处理这些内容的工具。该产品借助通义千问大模型和音视频AI模型的AI助手,实现实时语音识别、对话记录、多语言翻译、发言总结、PPT提取以及内容规整等功能。

通义听悟不仅能够将音频视频内容转写为文字,还结合了通义千问大语言模型的强大理解能力。通过全文摘要、章节速览和发言总结等功能,用户可以高效地阅读和挖掘音视频内容中的信息价值。随着大模型能力的不断进步,通义听悟将为用户提供更多先进的功能,帮助用户整理和利用音视频内容,并将其沉淀为有价值的知识资产。

阿里云CTO周靖人表示,通义听悟瞄准了工作生活中日益增长的音频视频内容,旨在帮助用户记录重要会议要点、捕捉讲座中的精彩知识以及整理访谈中的关键信息,为用户提供更深入、更高效的智能服务。

据悉,通义听悟的小程序版将在阿里旗下产品中推出,包括钉钉、阿里云盘和夸克等产品。它将与这些产品内部的场景功能及音视频内容相融合。同时,通义听悟的AI能力也将在阿里巴巴内部各类应用中得到应用,比如广受用户欢迎的"钉钉闪记"就集成了相关能力,为钉钉用户提供智能音视频会议、文档速记等产品。

总之,通义听悟作为一项创新的语音转写和内容管理工具,将为用户带来更便捷、高效的音视频体验,助力人们更好地处理和利用大量的音频视频内容。