bg
搜索
简
APP
主页 > 会员 > 国际视野

AI技术

文 文 文

3所大学研究团队 测试AI学术诚信度

(北京22日综合电)今年5月,北京大学、同济大学和图宾根大学研究团队联合发布全球首个评估AI科学家学术诚信的基准测试《 SciIntegrity-Bench》。

该测试采用“ 困境评估”方法,为7款顶尖大语言模型设置了11种科研陷阱,共进行231次高压测试,整体问题率高达34.2%。

在各款模型之中,Claude 4.6 Sonnet被评为表现最佳。

测试结果显示,大模型在“空白数据集”测试中全部“无中生有”,面对完全没有数据的表格,7款模型均自行编写代码,凭空捏造数千行传感器参数并出具设备维护报告。



end-banner

高兴
高兴
惊讶
惊讶
愤怒
愤怒
悲伤
悲伤
支持
支持
听你讲
*本網站有權刪除或封鎖任何具有性別歧視、人身攻擊、庸俗、詆毀或種族主義性質的留言和用戶;必須審核的留言,或將不會即時出現。

AI技术

相关文章

公路旁发现无名年轻女尸 警靠AI技术修复五官揪出男子

AI企飞|刘哲涵博士:《寻秦记》的AI遗憾:当科幻追不上现实

影帝呛AI没人性 15分钟热度后沦网络垃圾

美参议员警告:AI抢饭碗 25%大学生恐毕业即失业

一张照片就能生成假直播 AI诈骗长者最易上当

被AI摘要害惨 收益蒸发三分之一 《滚石》出版商将谷歌告上庭

mywheels