bg
搜索
简
APP
主页 > 国际 > 欧美

AI

微软

文 文 文

微软正式发布自家AI 文字语音影像3模型齐上线

(华盛顿4日综合电)不只投资人工智能(),帮别人卖,现在连文字、语音、影像模型都自己下场做了。

“TechCrunch”报导,旗下研究部门Microsoft 周五(3日)宣布推出3款基础模型,分别可用于文字、语音与影像生成,进一步和其他实验室正面竞争,尽管目前仍与Open维持紧密合作关系。

这3款模型包括语音转文字模型M-Transcribe-1、语音生成模型M-Voice-1,以及影像生成模型M-Image-2。

表示,M-Transcribe-1可支援25种语言语音转文字,速度是Azure Fast方案的2.5倍;M-Voice-1则可在1秒内生60秒音讯,且能建立自订声音;M-Image-2则主打影像生成能力。

阅读更多

其中,M-Image-2其实已于3月19日先在M Playground上线。


如今进一步把3款模型都推上Microsoft Foundry,而语音转文字与语音生成模型也同步在M Playground开放使用。

报导指出,这些模型由M Superintelligence团队开发,该团队由Microsoft 执行长苏莱曼(Mustafa Suleyman)领军,并于2025年11月正式成立与对外公布。

苏莱曼表示,Microsoft 正在打造“以人为本”的,强调在开发模型时,会把人放在中心,依照人们真实的沟通方式进行优化,并以实际应用场景作为训练方向。他也预告,未来还会有更多模型进入Foundry,甚至直接整合进产品与使用体验中。

在大型语言模型市场竞争愈来愈拥挤之际,认为这批模型的一大卖点,是价格比Google与Open的部分产品更便宜。

以定价来看,M-Transcribe-1每小时0.36美元(约1令吉45仙);M-Voice-1每100万字元22美元(约89令吉);M-Image-2则是文字输入每100万tokens收费5美元(约20令吉15仙),影像输出每100万tokens收费33美元(约133令吉03仙)。

尽管持续推出自家模型,苏莱曼接受外媒访问时仍重申,对Open的合作承诺并未改变。不过他也透露,双方近期重新谈判合作内容后,确实让能更自由推进所谓的“超级智能”研究。

根据报导,至今已对Open投资超过130亿美元(约524亿令吉),并透过多年合作,将Open模型部署到旗下多项产品中。在晶片策略上也采取类似做法,一方面自行研发,一方面也向外部供应商采购。

文:台湾壹苹新闻网
图:美联社


end-banner

高兴
高兴
惊讶
惊讶
愤怒
愤怒
悲伤
悲伤
支持
支持
听你讲
*本網站有權刪除或封鎖任何具有性別歧視、人身攻擊、庸俗、詆毀或種族主義性質的留言和用戶;必須審核的留言,或將不會即時出現。

AI

微软

相关文章

美国AI机器人挑战分拣包裹 最终输给人类

比尔盖茨基金会不再持有微软 值127亿股票清仓

男大生为高考打气 帅到以为是AI

旺姐:青年要保持竞争力 勇于探索数码经济AI领域

中国留学生遭掰断手指 连夜开发AI自救工具

聊天机械人任咖啡店店长 误订3000双手套 6000包纸巾