大模型应用竞争转写赛道,比谁更能“听懂”音视频

阿里云介绍,这款产品“悟性”高,能给音视频划分章节并形成摘要、总结全文及每个发言人观点、整理重点和待办事项等。

在音视频转写赛道,通义听悟直面的竞争对手是科大讯飞。不到一个月前,科大讯飞正式发布其认知大模型,基于它的相关功能已经开始收费。

责任编辑:张玥

阿里云峰会上,阿里云智能集团CTO周靖人介绍通义听悟。 (受访者供图/图)

距离阿里云大模型“通义千问”问世不到两个月时间,阿里云于2023年6月1日在广州的阿里云峰会上发布了通义家族新成员——通义听悟。

这是一款由阿里云达摩院研发的AI语音助手,也是中国首个开放公测的大模型应用产品。目前,市面上多数大模型还没有落地的应用,或是应用产品仅供邀请体验。

据阿里云介绍,这款产品不仅“听力好”,可以准确生成会议记录、区分不同发言人,“悟性”也高,能给音视频划分章节并形成摘要、总结全文及每个发言人观点、整理重点和待办事项。用户可以摘取关键信息到页面右侧的空白笔记中。

竞争转写的“AI”能力

阿里云智能集团首席技术官周靖人在峰会现场介绍通义听悟背后融合了十多项AI功能,瞄准的是具有高知识附加值

登录后获取更多权限

立即登录

校对:胡晓

欢迎分享、点赞与留言。本作品的版权为南方周末或相关著作权人所有,任何第三方未经授权,不得转载,否则即为侵权。

{{ isview_popup.firstLine }}{{ isview_popup.highlight }}

{{ isview_popup.secondLine }}

{{ isview_popup.buttonText }}