欢迎光临环球时报网!

今天是 2025年02月08日 星期六

关注社会热点

一起实现我们的中国梦

当前位置: 首页 > 科技

苹果新论文证明LLM大模型存在缺陷!没有进行真正的逻辑推理

快科技10月13日消息,近日,苹果公司的AI研究团队发表了一篇题为“Understanding the Limitations of Large Language Models in Mathematical Reasoning”的论文,揭示了大型语言模型(LLM)在数学推理方面的显著局限性。

尽管这些模型在生成人类水平的文本方面表现出色,但当处理简单的数学问题时,即使问题仅进行了微小的改动,如添加无关信息,模型的表现也会急剧下降。

在论文中,研究人员通过一个简单的数学问题证明了这一点。

他们提出了一个关于采摘猕猴桃的问题:奥利弗在周五挑选了 44 个猕猴桃,然后他在周六挑选 58 个猕猴桃,周日,他采摘的猕猴桃数量是周五的两倍。奥利弗有多少个猕猴桃?

此时,LLM能够正确地计算出答案。

但是,一旦问题中加入了无关的细节,如“其中5个奇异果比平均小”,模型便给出了错误的答案。

研究人员进一步对数百个类似的问题进行了修改,发现几乎所有问题的修改都导致了LLM回答成功率的大幅降低。

这一发现表明,LLM并未真正理解数学问题,而是更多地依赖于训练数据中的模式进行预测。

当需要进行真正的逻辑推理时,这些模型往往无法产生合理的结果,这一发现对人工智能的发展提供了重要的参考。

虽然LLM在许多领域表现优异,但其推理能力仍有待改进。

【本文结束】如需转载请务必注明出处:快科技

责任编辑:文祥

新浪众测 新浪众测 新浪科技公众号 新浪科技公众号

“掌”握科技鲜闻 (微信搜索techsina或扫描左侧二维码关注)

相关新闻
本文来源于网络,不代表环球时报网立场,转载请注明出处
我要收藏
0个赞
转发到:
推荐阅读
  • 中国北京,2024年12月24日——近日,Cloudera发布2025年五大科技趋势预测,揭示了在未来一年生成式AI和AI Agent等创新技术的发展趋势。其中包括生成式AI的应用将趋向务实,AI Agent将在商业决策中发挥重要作用。同时[全文]
    2024-12-25 04:09
  • 近日,德国零售商已开始上架搭载英伟达下一代显卡的宏碁掠夺者Orion 7000系列游戏主机,并首次曝光了RTX 5090和RTX 5080显卡的配置信息和价格差异。根据零售商的商品列表,宏碁掠夺者Orion 7000(型号P07-660)搭[全文]
    2024-12-21 04:01
  • 感谢IT之家网友 华南吴彦祖、西窗旧事 的线索投递!IT之家 12 月 9 日消息,乘联分会今日发布公告称,11 月全国乘用车市场零售 242.3 万辆,同比增长 16.5%,环比增长 7.1%。今年以来累计零售 2,025.7 万辆,同比[全文]
    2024-12-10 04:28
  • 周一大盘震荡回踩,整体弱势整理,但是盘后会议利好横空出世,形势再次转折。会议政策提到更加积极的财政政策和适度宽松的货币政策,进一步夯实了牛市基础,上周五实际上指数已经突破调整格局,周一缩量回踩,盘后利好一出,牛市第二波估计要正式启动了!而且[全文]
    2024-12-10 04:18
腾讯云秒杀
阿里云服务器

Copyright 2003-2025 by 环球时报网 hq.cdxinw.cn All Right Reserved.   版权所有

未经授权请勿转载 | 网站所有内容来源于网络,如有侵权联系我们删除。