
你可能在说英语,但是对于正在参加微软团队会议的巴黎同事来说,你听起来像是在说法语。
微软目前正在测试一项新的解释器人工智能功能,该功能可以克隆你的声音,并实时将其转换为另一种语言。根据该公司的说法,结果是一个声音听起来“就像用另一种语言表达的你”。该翻译项目将在明年初以意大利语、德语、日语、韩语、葡萄牙语、法语、英语、普通话、西班牙语等9种语言进行试运行。据《华盛顿邮报》报道,只有拥有微软365副驾驶执照的账户才能访问Interpreter。
微软的人工智能业务正在蓬勃发展。微软首席执行官萨蒂亚·纳德拉在上个月的财报电话会议上表示,微软的人工智能部门“下个季度的年收入有望超过100亿美元”,并成为“我们历史上达到这一里程碑的最快业务”。
在一个演示视频中,Interpreter在团队会议中实时将西班牙语翻译成英语,在保持说话者声音特征的同时改变听者听到的内容。
在另一个演示中,Interpreter从英语到韩语做同样的事情。
微软向用户保证,它不会存储他们的生物特征信息,只有在用户同意的情况下才允许进行语音模拟。
语音克隆技术不仅对实时口译有用。今年7月,人工智能初创公司ElevenLabs推出了一款应用程序,其中包含了朱迪·加兰、詹姆斯·迪恩、伯特·雷诺兹和劳伦斯·奥利维尔爵士的克隆声音。用户可以利用这些声音来叙述他们上传的任何书籍、文档或文件。
然而,这项技术也有一个缺点:它使诈骗更加个人化。一种人工智能克隆方案仅从三秒钟的音频中复制某人的声音,就像发布在社交媒体上的视频一样。在克隆声音后,骗子给受害者的朋友和家人打电话以获取钱财。
一些人工智能公司不愿发布复杂的语音克隆技术,因为它可能被用于错误的目的。今年4月,chatgpt制造商OpenAI宣布了一款语音引擎AI生成器,据称它可以从15秒的音频中逼真地模仿某人的声音,但由于“潜在的合成语音滥用”,决定不广泛发布。











