巨人天成
产经 科技 企业 数据 峰会 快讯 商业

苹果AI研究揭秘:简单算术竟难倒20多个顶尖模型,AI真能超越人类智慧?

2024-11-02来源:ITBEAR编辑:瑞雪

近日,苹果公司内部研究团队揭露了一个令人惊讶的发现:即便是目前最尖端的AI模型,在处理包含干扰信息的简单算术问题时,表现竟不如小学生。这一结果引发了关于人工智能真实能力的新一轮讨论。

据《洛杉矶时报》报道,苹果团队采用了一道涉及猕猴桃采摘数量的算术题进行测试。题目描述了一个简单的场景:Oliver在三天内采摘了不同数量的猕猴桃,其中还包括了一些额外的、与总数计算无关的信息。然而,就是这样一个看似简单的问题,却让20多个高级AI模型纷纷“栽跟头”。

正确答案应为190个猕猴桃,但多数AI模型给出的答案却是185个。研究发现,这些模型在处理问题时,难以忽略那些看似相关、实则无关的干扰信息,如“其中有5个猕猴桃的块头要比平均值要小”。这一细节虽不影响总数的计算,却成功迷惑了众多AI。

苹果团队进一步指出,这一问题的根源在于,当前的AI模型主要依赖于训练数据中的语言模式进行推理,而非真正理解了数学概念本身。这意味着,在面对稍微复杂或包含非典型信息的问题时,AI的“智能”可能就会变得不再可靠。

值得注意的是,苹果的研究并非旨在全盘否定AI的价值。相反,他们希望通过这一发现,提醒人们在热情拥抱AI技术的同时,也应保持理性的认知和审慎的态度。简单的数据扩展或计算能力提升,并不能从根本上解决AI在逻辑推理方面的局限性。

此次研究不仅揭示了AI模型在处理复杂问题时的潜在弱点,也为未来AI技术的发展提供了新的思考方向。随着技术的不断进步,我们期待看到更加智能、更加可靠的AI系统出现。

AI录音笔怎么选?科大讯飞Magic等五款热门产品全方位性能大比拼
其操作简单,适合初学者使用,但在智能转写功能上,索尼的表现不如科大讯飞Magic。经过对比,我们可以得出以下结论:科大讯飞AI录音笔Magic在转写速度、音质、续航等方面均表现优异,适合需要高效记录和转写的用…

2026-01-05

科大讯飞回应投资者:智能办公本在售X5系列,市场销售表现稳健向好
有投资者在互动平台向科大讯飞提问:“智能办公本X6的预售订单量同比增长多少?供应链产能能否满足春节前的交付需求?”针对上述提问,科大讯飞回应称:“您好,讯飞智能办公本目前最新在售型号为 X5 系列,该系列产…

2026-01-05

科大讯飞音响方案受关注,投资者追问出货量等,董秘回应关注定期报告
来源:问董秘投资者提问:智能座舱音响方案iFLYSOUND已在19家车企量产,目前单月出货量多少?配套车型的平均单价和毛利率水平如何?董秘回答(科大讯飞SZ002230):您好,公司在年度报告与半年度报告中对…

2026-01-05