(首尔18日综合电)谁是AI数学解题王?韩国西江大学数学系教授金钟洛(音译)研究团队近日公布“国家代表AI”模型挑战的性能评估结果,发现以韩国大学入学考试(CSAT)题目实测,韩国企业开发的AI模型得分远低于国外AI。
韩国《中央日报》报导,金钟洛团队的评估对象包括参加韩国科技部自主AI基础模型项目的5家韩国企业,包括Naver、NC AI、LG AI研究院、SKT、Upstage AI模型,以及OpenAI、谷歌、DeepSeek等5家国外AI企业的最新模型。
研究团队从韩国大学入学考试的数学4领域(公共科目、概率与统计、微积分、几何)中,各选出5道最难题目共20题,加上韩国论述及印度大学入学考试各10题和日本东京大学工学院研究生入学考试10题,总计50道题目让AI解答。
结果显示,5个国外AI模型全都有70%以上的正确率,尤其是谷歌最新模型“Gemini 3 Pro”答对50题中的46题,正确率达92%。

相比之下,韩国AI企业的模型正确率明显偏低。除Upstage的“Solar Pro2”有58%正确率外,其余多只有20%左右的正确率。
对此,韩国AI业界认为,这是模型用途不同而导致的结果。业界指出,受评估的韩国AI开发商主要专注于开发工作用AI,数学解题得分低是必然的。
文: 韩国《中央日报》