金融界 2024 年 11 月 28 日音讯,国家知识产权局信息数据显现,谷歌有限责任公司请求一项名为“运用说话者嵌入和所练习的生成模型的说话者日志”的专利,公开号 CN 119028321 A,请求日期为 2018 年 9 月。
专利摘要显现,本请求公开了运用说话者嵌入和所练习的生成模型的说话者日志。说话者日志技能,使得可处理音频数据以生成音频数据的一个或多个细化版别,其间,音频数据的每个细化版别别离单个相应的人类说话者的一个或多个言语。各种完成方法经过以下来生成别离单个人类说话者的言语的音频数据的细化版别:为单个人类说话者生成说话者嵌入,而且运用所练习的生成模型来处理音频数据,以及在处理期间,在确认所练习的生成模型的躲藏层的激活中运用说话者嵌入。根据该处理,在所练习的生成模型上生成输出,而且该输出是音频数据的细化版别。