喜马拉雅AIGC项目“单田芳声音重现”被工信部评为“超卓互联网应用”
来源:今报在线 发布时间:2023-03-24 11:14:40

近日,喜马拉雅的“单田芳大师声音重现”项目在2022年度工业和信息化部新闻宣传中心(人民邮电报社)“ICT优秀案例”征集活动中,荣获“超卓互联网应用”荣誉称号,这肯定了喜马拉雅通过技术不断创新内容生产方式、赋能音频行业发展所作出的努力。喜马拉雅已成为音频领域AIGC的先行者,推动着音频行业的技术革新。

喜马拉雅始终坚持以科技赋能文化,通过AI技术,赋能创作者、服务用户。如今,喜马拉雅正在现有的“UGC+PGC+PUGC”内容生态之外,探索多模态AIGC的更多可能性。单田芳大师声音重现项目是喜马拉雅AIGC的标杆项目,喜马拉雅通过TTS(文字转语音)技术完美还原已逝的单田芳先生的声音,首次将单田芳先生的AI合成音全新演绎听众耳熟能详的经典之作。截至目前,喜马拉雅已上线100多张运用单老AI合成音制作的AIGC专辑,总播放量超过1亿。其中,有15张专辑播放量破百万,例如,《民国四大家族》播放量近730万,《十二金钱镖》播放量近700万,《卧虎藏龙全集》播放量超390万。

这一项目所使用的TTS技术由喜马拉雅珠峰智能实验室自主研发,该实验室定位于新一代数字出版平台技术研发,长期专注于语音合成、识别、语音信号处理、编解码以及智能音效的研究和开发,由喜马拉雅首席科学家卢恒博士带领。目前,这一实验室已在多种技术的研究和应用上取得了突破。

喜马拉雅自研的TTS前端文本处理分析模块已经能够高精度、全自动地对文本进行多音字识别、韵律预测和风格分类,并已开发出可以实现多情感、多风格、多语种声音的TTS技术模型,不仅可以演绎不同情绪的文字,还可以自动区分旁白、对白,并支持英文,极大地丰富了TTS能表达的情感和韵律,这让单田芳先生声音的重现成为可能。为了最大程度保留单老那苍劲、沙哑的独特嗓音以及情感充沛、跌宕起伏的评书腔调,喜马拉雅珠峰智能实验室还通过自主设计单独的韵律提取模块,让单老的AI合成音仿佛本尊再现。

喜马拉雅成多情感、多风格、多语种声音的TTS技术模型可广泛运用于图书、期刊、报纸、新媒体等多种内容的数字出版、语音修复、语音再现等。另外,AIGC制作速度快、成本低,这极大地革新了音频行业的内容生产方式,让内容生产更高效。

目前,喜马拉雅已经与近百家网络平台和出版机构合作,运用TTS技术上线近6万张AIGC专辑。不仅为上游出版产业数字化转型提供技术平台支持,通过数字化分发提高其经济效益,也让下游用户能更便捷地享受边听边看的内容消费体验。

同时,喜马拉雅也通过AIGC也进一步赋能创作者,帮助其高效生产音频内容,推动创作者布局音频,让作家、撰稿人、主播等内容创作者能更轻松地将内容通过声音带到用户耳边。

目前,喜马拉雅已申请了20多项语音技术相关专利,其中有10多项TTS语音合成相关专利, 还有两项语音技术成果先后被世界顶尖学术会议“2022年IEEE国际音频、语音与信号处理会议”收录。除了TTS技术,喜马拉雅在其他技术领域也成果颇丰。2022年8月,喜马拉雅ASR技术在SpeechIO TIOBE评测中获得第一名。 同时,喜马拉雅还通过AI文稿、喜马拉雅专属音效、全景声长音频内容打造、喜韵音坊AI剪辑工具等,赋能创作者、服务用户,让内容生产提效,让内容体验增值。未来,我们将有望看到更多AI技术在喜马拉雅平台上落地生根,推动着音频行业不断发展。

标签:

猜你喜欢