DeepSeek-R1登上期刊训练成本123万令吉

责任编辑: 国际小编

（北京19日综合电）最新一期《自然》期刊收录的《 DeepSeek-R1 透过强化学习激励大型语言模型推》的论文显示，DeepSeek-R1 的训练成本仅29.4万美元（约123万令吉）。

论文由 DeepSeek（深度求索）公司团队完成、DeepSeek 创办人梁文锋担任通讯作者，18日刊发在《自然》期刊上。这一期封面即以AI的自我学习和改良为主题，相关论文登上，是首个通过同行评议的主要大型语言模型（LLM）。

界面新闻报导，这篇新版 DeepSeek-R1 论文，与今年1月未经同行评审的预印本有较大差异，作者根据评审意见增加了模型训练的技术细节说明，包括模型训练数据类型和安全性考虑等，并回应了先前关于知识“蒸馏”的质疑。

高兴

惊讶

愤怒

悲伤

支持

听你讲

*本網站有權刪除或封鎖任何具有性別歧視、人身攻擊、庸俗、詆毀或種族主義性質的留言和用戶；必須審核的留言，或將不會即時出現。

DeepSeek-R1登上期刊 训练成本123万令吉