在今年早些时候的 Made by Google 活动中,Google 宣布 Pixel 设备上的 Recorder 应用程序将很快能够通过一项新功能区分不同的扬声器。该公司在活动期间展示了该功能,展示了它如何使用机器学习来自动识别不同的演讲者并分别转录每个演讲者的话。谷歌表示,这项新功能将于今年晚些时候在 Pixel Recorder 应用程序中推出,看来这个时间终于到了。
9to5Google报告说,新的 Speaker labels 功能将通过最新的 Pixel Recorder 更新(版本 4.2)到达用户。该更新已经开始通过 Play 商店推出,但目前尚未广泛使用。尽管如此,你应该会在未来几天内将它安装到你的 Pixel 上,之后你会在应用程序中看到一个新的启动画面来解释该功能。
启用后,Recorder 应用程序将自动识别并标记多个扬声器。它会给每个演讲者一个通用的名字,但用户可以选择在录音中更改他们的名字。谷歌解释说,该应用程序将暂时在设备上存储语音模型以标记扬声器。一旦它完成了在文字记录中标记说话人,它就会在几分钟内删除语音模型。
要在录音中标记不同的扬声器,Recorder 应用程序:
计算录音中检测到的声音模型,
为检测到的每个语音提供通用文本标签(例如 Speaker 1、Speaker、2),以及
比较整个录音中的声音,以便转录可以反映每个声音说的内容和时间。