Joffoo's blog

The ethereal flight, oft rehearsed in the theater of one's dreams...

远人之道:神经网络幻觉

为什么,星象大师,你看着我的
眼珠,仿佛那是世界的轮中轮,为什么
人生有缺憾,绝句有生命,而伟大的木匠
属于伟大的钉子;为什么,给我一个残忍的答案?

——王敖《绝句》

人类幻觉的纪念碑

神经网络的“幻觉”是模型在有限知识和统计模式驱动下的“创造性失误”。比起 DeepSeek-R1 这类具有思维链的模型,社交媒体上人类用户即兴发挥的内容里“幻觉”含量其实更高。

比如,在一个 DeepSeek-R1 解考研数学题的帖子下面,能看到这样一道题:

\[ \int_{0}^{\pi} x \cdot \sin^8(x) \, dx \]

据出题人说,“开了深度思考之后也错了,三纸无驴,废话写了三分钟,还算错了。”

如果你有考研数学的备考经验,应该会记得这道积分题可以通过“区间再现公式”结合“点火公式”(即华里士公式)来解决。从这些公式的名称就能看出,这道题是可以“工业化求解”的,绝对算不上难题,因为早有老师总结出了顺口溜。

既然 AI 就在手边,完全可以验证一下。DeepSeek-R1 不仅直接给出了正解,还包含两种解答,可以作为交叉验证:

我以截图回复此人,他后来补充说,“这种题还有时对有时不对,最好多找几个人看正确率,如果正确率不到 60%,那这考 90 分都够呛。”

这句话中的“幻觉”非常典型:它基于一个凭空出现的前提,迅速得出了结论。我非常好奇“60%”这个数字是如何得出的,但如果追问这种细节可能会显得像是在故意抬杠。我更好奇的是,前面那个复杂的“错误”结果究竟是如何产生的。

我忽然注意到页面头部的 \(\pi/2\),于是用 Wolfram 验证一下,果不其然,这人给错了积分限。

还有许多评论的大意是:“给 AI 出点新题,它还能做出来吗?我看不行!”时代已经不同了,以前看到这类评论时,我会觉得其中有些道理,可能会留个心眼。但现在,我只会想:你为什么不亲自选几道题问问呢?虽然即使不问,你也能猜到结果——有些题 AI 能做,有些题不能——但问与不问之间,还是有区别的。

评论区的每一个问句都可以让 AI 回答一下

在看到社交媒体上妙趣横生的评论区时,我多半只会觉得好玩,而不会尝试说服别人,因为解释笑话是很扫兴的。但摩根·豪泽尔提醒我们,“没有谁真的失去了理智——我们都在依靠自己独特的经验做出选择,而这些经验在特定的时间点和情境下都是合理的。”

在很多人看来,AI 不过是升级版的小猿搜题(我不清楚现在的情况),只是题库更大而已。但对于使用过 Mathematica 和 Rubi 的我来说,AI 解题不仅能给出过程,还能进行交叉验证,这与那些基于符号积分算法或一系列积分规则的工具截然不同。可以说,只有 AI 这个工具能够真正教会你如何独立解决这道题。

汽车最初并不比马车更快,日心说的预测结果一开始也不比地心说更准确,但我们应该能够看出这些“新事物”的价值,而不是仅仅用旧有的标准去衡量它们,因为这些“新事物”本质上已经完全不同了。

AI 的教育

发问的习惯

我从小接受的教育是“不要问为什么,没有那么多为什么”。长大后,我补上了这句话的“为什么”:因为你的问题可能会难住别人。

然而,仅仅认识到这一点是不够的。我至今仍保持着这种扭曲的性格,不相信周围的人能为我答疑解惑,同时也没有“人往高处走”的动力。

以前,仅靠网上的资料基本够用,但现在 AI 能够接住这些问题,甚至能应对孩子的连环提问。这种问答形式比阅读更接近文明的本源,是一种更直接的学习方式。当我面对对话框时,只会懊恼自己要问的东西太少。

提问的艺术

很多人把提示词复杂化了,仿佛它成了一门“机器心理学”课程。

冯·诺依曼曾说:“你坚持认为有些事情机器无法做到。如果你能准确告诉我机器究竟无法做什么,那么我总是可以造一台机器专门去做你描述的事情。”

有了“思维链”之后,提示词更应该回归本质。你需要做的,只是准确地告诉机器你想要完成什么任务。

在社交媒体上浏览一番,你会发现,就连这最基本的门槛都能绊倒不少人。

清晰的提问技巧不仅适用于与机器的交互,还可以在现实生活中复用。但如果不分场合地让别人“角色扮演”,就显得不太礼貌了:

“大夫,我这病要是长在您身上……”

结论的更新

书里常告诫我少看新闻,多关注那些相对稳定的知识。

去年年末,我读到评论尸的一篇文章,其中提到“在某些领域,人的优势是比 AI 更便宜。”

之前提到的写拼盘式人物特稿的场景就是一个例子,许多媒体这类稿件交给实习生或应届毕业生去做,月薪在 2000~3000 元左右。这些实习生的主要工作是根据选题,在抖音、小红书等平台上寻找采访对象,进行简单的线上采访,并将采访录音整理成稿件,一个月能出 4~5 篇稿件,并且由于是全职员工,还可以做些其他工作。这意味着,之前提到的将工作利用 AI 自动化是得不偿失的,因为 AI 太贵了。 《评论尸的 AI 生产力经验》

然而,今年年初 DeepSeek 开始活跃在公众视野中,以其开源、低成本以及同时支持思维链与网络搜索的特点而闻名。这提醒我们,需要及时更新 AI 相关的认知。

“远人”的世界

还是前面那篇文章,提到评论尸开发了一个单机版微博,并且接入 AI。他说,“我发现我不需要和真实的人互动了。”

AI 生成的评论和反馈,仍然难以完全模拟人类的思维方式和情感表达。但这已经是一个不错的选择,至少比在充斥着喷子的真实社交网络中,更容易获得有价值的信息和观点。 《评论尸的 AI 生产力经验》

我对这个细节印象很深,一方面表示理解,另一方面却发现自己难以做到。即便我深知社交媒体上鲜有价值信息,但我对它的沉迷程度依然高于与 AI 聊天。这或许暗示了人类社交需求的独特价值。

不过,《打破社交媒体棱镜》一书中提到,用户互动最多的内容并非政策观点或讨论,也不是自己阵营内极端派的发言,而是对对方阵营极端派的批评。这些批评的目的并非为了改变对方的看法,而是为了获得更多来自同阵营的认同。

“我们对社交媒体成瘾的更深层原因是,它可以让我们更容易地做一些太符合人性的事情:呈现不同的身份认同,观察其他人的反应,并更新我们的自我呈现,以让自己觉得有归属感。” 《打破社交媒体棱镜》

孔子说:“道不远人,人之为道而远人,不可以为道。”然而,在社交媒体上持续关注异见者,并不等同于“近人”,也不一定会让你对事物有更全面的认知,反而可能强化你已有的观念。

“为道而远离社交媒体”,对我来说几乎不可能。除此之外,评论尸还做了许多让我惊讶的事。比如在这篇文章中,他介绍了通过刷抖音获取“非二手信息”的方法:

不要把读书当成习惯,不要把阅读当成寻找答案与成长的唯一方式。因为,在一个快速流变的世界里,知识本身理应是速朽的。能够在一定程度上抵御时间雨的作品,要么非常宏观(比如哲学与物理),要么非常微观(比如积极心理学和烹饪),而夹在此二者之间的部分,都在以月为单位更新。 《少读点书,多刷刷抖音吧》

可我深知自己的自控力有限,甚至不敢把抖音留在手机上。

俗话说,“小鸡不撒尿,各有各的道。”无论是“近人之道”还是“远人之道”,最终都需要自己去探索与妥协。

25/01/31

文章目录

  1. 人类幻觉的纪念碑
  2. AI 的教育
    1. 发问的习惯
    2. 提问的艺术
    3. 结论的更新
  3. “远人”的世界

Proudly powered by Hexo and Theme by Hacker
© 2025 Fengyukongzhou