(华盛顿23日综合电)面子书的母公司Meta Platforms推出一款人工智能(AI)模型,能够翻译和转录数十种语言的语音,是实现跨语言实时交流工具的潜在基础。
Meta周二在一篇博客文章中表示,其SeamlessM4T模型可以支持近100种语言的文本和语音翻译,以及35种语言的语音到语音翻译。
Meta总执行长朱克伯格说,他设想这样的工具能够在元宇宙中促进来自全球各地用户之间的互动。

博客文章中说,Meta将这个模型提供给公众用于非商业用途。
Meta今年推出了一系列的人工智能模型,其中大部分是免费的。朱克伯格称,开放的人工智能生态系统对Meta更有利,因为公司通过有效的众包方式为其社交平台创建面向消费者的工具,比对模型的访问收费,获益更多。
对于SeamlessM4T模型,Meta的研究人员在一篇研究论文中表示,他们从约400万小时的“原始音频”中收集了音频训练数据。这些音频源自公开可用的网络数据库,但未具体指明是哪个库。
研究论文说,文本数据来自于去年创建的数据集,这些数据集从维基百科和相关网站中提取内容。
文:新加坡联合早报
图:法新社