(北京19日综合电)最新一期《自然》期刊收录的《 DeepSeek-R1 透过强化学习激励大型语言模型推》的论文显示,DeepSeek-R1 的训练成本仅29.4万美元(约123万令吉)。
论文由 DeepSeek(深度求索)公司团队完成、DeepSeek 创办人梁文锋担任通讯作者,18日刊发在《自然》期刊上。这一期封面即以AI的自我学习和改良为主题,相关论文登上,是首个通过同行评议的主要大型语言模型(LLM)。
界面新闻报导,这篇新版 DeepSeek-R1 论文,与今年1月未经同行评审的预印本有较大差异,作者根据评审意见增加了模型训练的技术细节说明,包括模型训练数据类型和安全性考虑等,并回应了先前关于知识“蒸馏”的质疑。
立即签购 解锁全文
我已订阅登入