近日,火山引擎正式推出有声内容创作平台。该平台历经2年研发,相较传统平台,其具备多情感演绎和自动化预测两大优势。

据了解,多情感演绎上,有声内容创作平台的“声音超市”不仅提供70余款适配不同题材的精品音色,还可通过丰富的情感实现更精彩的演绎;自动化预测层面,平台的AI自动区分文本中的对话和旁白、识别对话的情感,整体合理率高达90%以上。

目前,火山引擎也针对新用户开展了5折限时特惠活动,感兴趣的用户可前往火山引擎官网获取优惠。

70余款精品音色,情感更丰富的听觉体验

火山引擎的AI配音家族已拥有70余款精品音色,覆盖各年龄段不同风格的精品音色,可适配各类题材,满足不同企业和用户的有声创作需求。

火山引擎首发“会表演”的有声内容创作平台

火山引擎精品“声音超市”

“副语言”也称“类语言”,是指伴随话语出现的某些声音现象,例如停顿、重音、语速、语调等,以及言语的功能性发声,例如笑声、哭腔、咳嗽等。在有声内容创作过程中,仅有音色数量上的积累并不够,为了让AI主播像专业配音演员一样演绎出更深层次的“人类情感”,火山引擎为AI音色赋予了多样的声音情绪和“副语言”。

自动化预测工具,为业务降本增效

在精品AI有声内容制作中,需要人工对文本进行标注制作,尤其是长文本中,需要区分人物角色的台词以及对应情感。这一过程耗时耗力,是造成精品AI有声内容很难大规模批量生产的原因。

针对这一痛点,火山引擎自研「AI 文本理解」模型 ,自动预测人物和情感,包括提取文本中对话人物、自动判定情感等能力。

在整体听感与纯人工标注的效果齐平的前提下,AI文本理解模型可以解放大部分的标注人力,大幅缩减标注的时间和成本,为企业降本增效。

火山引擎首发“会表演”的有声内容创作平台

「AI 文本理解」模型

在火山引擎「AI有声内容创作平台」中,

● 用户只需将目标文本导入,由平台自动完成人物的抽取、并判定对话所属的人物和情感;

● 在配音环节,用户可以自主选择配置AI音色来匹配人物,也可选择简单标定角色人设,依据平台内置策略一键配音;

● 配音完成后,平台会根据自动预测的信息完成音频的自动合成和拼接。

火山引擎首发“会表演”的有声内容创作平台

AI有声内容创作平台

未来,火山引擎会持续投入有声内容创作平台的建设与创新,在底层技术和实际应用层面不断探索从“文本”到“有声作品”全流程的一体化智能创作方式,为用户打造更好的使用体验。