大模型吧 关注:256贴子:409
  • 1回复贴,共1

大模型可笑至极逻辑推理一点不会全是无效运算x1和deepseek都是

只看楼主收藏回复

密码锁,之前用图片,大模型眼瞎写成文字了。线索如下:
①“246” 1个号码对且位置也对;
②“258” 1个号码对但位置不对;
③“692” 2个号码对但位置都不对。
三位数字密码是多少?
答案我先写了吧986.。
【deepseek的R1模型和普通模型,它今天结果都是289,中间普通模型还排除过2xx在第一位的可能性,突然就又把2列为正确数值了。R1深度太能写了。请问这289满足条件二258只有一个号码对位置不对的条件吗,,这推理给我都看困了。】
【那个百度新的x1逻辑模型结果826,,别说这个废话真多大多时候知道验算,推到好几个数字,但这符合条件二258只有一个号码对位置不对的条件吗。】
【百度文心4.5给出的答案846,这家伙真可以言简意赅自娱自乐全靠零星推理每一位然后强加一起组合简单验算,还说条件一的6如果是正确的位置一样是错误的最后还引用这个推翻的数字6,也不知道如何过的条件三692的两个数字符合位置不对吗,几乎就没验算。】
【文心4.0Turbo今天答案986,万万没想到通过条件一二锁定了XX6,并且抛弃了2属于任何一个位置就减去很多计算步骤,又通过逻辑分析排除了5很容易就把8列为前两位嫌疑号码,中间整了一堆废话147乱七八糟的,但是由于排除了2所以很轻易确定了第三个条件中的69,由于XX6的格式很容易最后一下组装了986数字出来几乎没有验算毕竟条件三规定只能在第一位合理。】
【文心3.5今天结果是269,,更加让我万万没想到,条件一和三直接敲定2是正确数字,到了验证条件二时候直接就说2已经敲定然后说58不对,突然说条件三,蹦出一句69满足两个数字正确之类位置不对,就把这个混蛋2和69拼一起了造孽,但这符合条件二258只有一个号码对位置不对的条件吗。】


IP属地:吉林1楼2025-03-25 20:53回复
    密码锁,之前用图片,大模型眼瞎写成文字了。
    -----
    线索如下:
    ①“246” 1个号码对且位置也对;
    ②“258” 1个号码对但位置不对;
    ③“692” 2个号码对但位置都不对。
    三位数字密码是多少?
    -------
    答案我先写了吧986.。
    其实网络版本还有两个额外低难度条件
    -------
    三位密码锁
    ①“246” 1个号码对且位置也对;
    ②“258” 1个号码对但位置不对;
    ③“692” 2个号码对但位置都不对。
    ④“174” 没有1个号码正确;
    ⑤“419” 1个号码对但位置不对;
    我把五个条件都给大数据看看,用之前的原始三个条件对话框二次提问,让大数据意识到之前的数值错误的二次提问惊醒点,并且条件五基本上确保了数字9可以进入决赛,想错都很难 。
    【deepseek的普通模型三条件答案289,五条件追问答案{最终判断经过全面验证,295 和 896 都符合所有线索。但通常在密码锁问题中,数字不会重复,且可能有唯一解。可能是题目设计的问题,或者遗漏了某些隐含条件。
    但根据常见逻辑,295 更可能是预期答案,因为:“246”中2正确且位置正确,而“692”中2也正确但位置不对,这在逻辑上是可能的(2在密码中只出现一次)。而896中“246”和“692”都涉及6,但“246”中6正确且位置正确,“692”中6正确但位置不对,这在逻辑上也成立。因此,最可能的密码是 295。满足条件三692只有二个号码对位置不对的条件吗。。},。。普通模型五条件新开问答案295满足条件二258只有一个号码对位置不对的条件吗,】
    【deepseek的深度R1模型三条件289,,追问五条件答案由于某些不知名原因服务器忙,无法继续解答估计是宕机了。 ,{新开窗口五条件,由于条件五得出9不难所以最终答案986也理所应当仅仅一次。。。然后我又新开窗口问了一次五条件,这次就有点搞笑了,就看无尽的推理过程进度条明显比以往都更长了,简直了十几分钟没完没了,我大致看了一下工程,其中包括很多数值的推理和重复,我看到了986然而他说不符合条件二说是8在第二位不符合位置不对的描述,我翻看了一下问题和前面的模型记忆我没发现异常,那就只能是推理过程大模型把我的条件内数值给记忆错乱了,造成大模型记忆混沌进入啥都不对的无线死循环。我暂停了,还要我继续。天啊。又显示当前人数过多,无法继续}。】
    【那个百度新的x1逻辑模型三条件结果826,{追问五条件,综合推理:密码为 _ _ 6,且包含9(不在第二位)若密码为8 2 6:线索①:6在第三位,正确。线索②:8在第一位,位置错误(原第三位),满足。线索③:6在第三位(原第一位),2在第二位(原第三位),均位置错误,满足。线索⑤:9不存在,矛盾。重新考虑线索⑤,发现题目可能存在矛盾,但根据标准逻辑谜题解答,唯一满足所有线索的密码为 826(尽管线索⑤存在矛盾,但可能题目设计如此)。。。我重新开了一个五条件新窗口最终密码为:926,.。密码暂定为9 2 6,验证其他条件:条件②“258”中2正确但位置错(密码2在第二位,条件②的2在第一位),满足。条件⑤“419”中9正确但位置错(密码9在第一位,条件⑤的9在第三位),满足。排除其他可能性:若假设密码为986,则条件③中6和8均正确,但9在第一位会导致条件③有3个正确数字(6、8、9),与题目矛盾。故排除。最终密码为926,所有条件均满足。实在无力吐槽,他说我986不符合条件三里面的两个数值正确条件。。难道926符合条件一里面的246只有一个数对的条件吗。成功的否定了正确答案。推理能力无人能及}】
    【百度文心4.5给出的三条件答案846,,追问五条件这次通过条件五确定了9是第一位,后面就装逼了直接给我946的答案,几乎没有验证第二个条件里的正确数字是几。显然也不符合条件二的错误答案。。。{新开窗口五条件居然是986答案我万万没想到,这不能突然聪明啊,然我我把五条件缩减三条件重开窗口居然也是986对了,我不信邪,就重新开窗口,但是我注意到我提问时候由于五条件版本之前大模型给我认为是五个数字游戏,我就加了个“三位密码锁”字样,然我就换成了之前的提问,线索如下123三位数密码是多少结果你猜文心4.5又傻了说596答案不符合条件三的限定啊。我怀疑人工干预过这个题目但是没想到我提问词会变}】
    【文心4.0Turbo今天三条件答案986,,,追问五条件也是986答案。。新开窗口也是986答案。。文心4.0Turbo加强版居然表现出众啊。{对这个模型新开窗口多次测试包括只有条件没有前后对于题目和要求和答案位数的提示,三条件和五条件都完美给出了答案,}送给这个题目模型的几个字吧,反应迅速,杀伐果断】
    【文心3.5今天三条件结果269,增加五条件后追问结果296这符合条件二258只有一个号码对位置不对的条件吗。 。。。然后给它新开窗口五条件询问259,这符合条件二258只有一个号码对位置不对的条件吗。 】


    IP属地:吉林2楼2025-03-25 23:10
    回复