科大讯飞推出超拟人语音合成技术 非常接近人类真实声音

2024-04-15 15:29:23 来源:上海证券报·中国证券网 作者:孙小程

  上证报中国证券网讯(记者 孙小程)紧跟大模型发展,超拟人合成技术作为重要的表达方式,近来成为国内外AI巨头争相布局的重点,一场超拟人合成技术PK赛正在上演。目前,微软上新的AI语音可以在Azure AI服务页面里进行试听和调用,科大讯飞超拟人语音合成在讯飞星火App和讯飞开放平台上均可体验和使用。

 

 

 

  近日,有第三方机构以相同的文本对两者的超拟人合成技术进行体验评测,发现微软和科大讯飞在超拟人合成的拟人度上相较传统语音合成效果都有显著进步,克服了合成声音“板正”“一丝不苟”的“播音腔”问题,同时在停顿、语速变化等副语言上的表现也相当自然。

  结果显示,科大讯飞超拟人合成在情感表达上表现更为突出。在输入表达不同程度开心的相关文字后,讯飞超拟人合成的效果能够根据程度不同展现出可感知的差别。综合来看,科大讯飞的超拟人技术在拟人度与情感表达上更优。

  科大讯飞表示,公司在此前的讯飞星火V3.5发布会上,率先推出超拟人语音合成技术,并搭载在讯飞星火App中开放给全民体验。评测显示,其拟人度超过83%,MOS分达到4.5分(满分5分,分数越高表示语音质量越好),体验下来它的声音流畅自然,表达已非常接近人类的真实声音。

  在创立之初,科大讯飞就在1998年的国家“863”计划语音合成比赛中夺得冠军。此后,科大讯飞更是在国际语音合成界的“奥斯卡”Blizzard Challenge评测赛事中拿下十四连冠,还实现了中英文语音合成业界首次超过普通人说话水平等一系列成就。

  近年来,讯飞在多语种语音合成应用、方言合成、合成语音情感上持续创新,并且推出全新语音合成系统SMART-TTS,实现多风格、多情感合成,能够根据需求对声音进行调节和创作。超拟人合成技术的率先上线和惊艳效果,背后是科大讯飞多年如一日的积累与突破。据介绍,讯飞超拟人合成升级版本也会在近期推出,将进一步增强喜怒哀乐等各种类型的情感反馈能力。