中国电信TeleAI星辰语音大模型升级-AET-电子技术应用

中国电信TeleAI星辰语音大模型升级

支持中英双语及40种方言任意混说

日期： 2024-11-04

来源：IT之家

关键词： 中国电信 TeleAI 星辰语音大模型

11 月 3 日消息，中国电信人工智能研究院（TeleAI）在今年 5 月发布业内首个支持 30 种方言自由混说的语音识别大模型 —— 星辰超多方言语音识别大模型。

时隔不到半年，TeleAI 星辰语音大模型的多方言能力再次升级，攻克了湛江话、宜宾话、洛阳话、烟台话等方言，将方言种类从 30 种提升至 40 种，并引入对英文的识别。

与传统的有标注训练方法相比，TeleAI 通过预训练语音识别模型，利用海量无标注数据进行预训练，再通过少量有标注数据进行微调。

由于方言语音数据普遍存在无标注数据多而有标注数据少的特点，这种“预训练 + 微调”的模型方案与方言场景的需求能够高度契合。

TeleAI 还在模型结构和成本优化上进行了创新，实现对人工标注数据的需求量大幅降低约 50 倍，且保障模型效果与有监督训练的方言模型水平相当。

Magazine.Subscription.jpg

版权声明：本站内容除特别声明的原创文章之外，转载内容只为传递更多信息，并不代表本网站赞同其观点。转载的所有的文章、图片、音/视频文件等资料的版权归版权所有权人所有。本站采用的非本站原创文章及图片等内容无法一一联系确认版权者。如涉及作品内容、版权和其它问题，请及时通过电子邮件或电话通知我们，以便迅速采取适当措施，避免给双方造成不必要的经济损失。联系电话：010-82306118；邮箱：aet@chinaaet.com。

中国电信TeleAI星辰语音大模型升级

日期： 2024-11-04

来源：IT之家

相关内容