Joffoo's blog

The ethereal flight, oft rehearsed in the theater of one's dreams...

Vol.015 个人的体验

“她的肌肤像摄影机一样录制下了寒冷。”

🐎 跑马场

🎧 声音/个人的体验

这(《4 分 33 秒》)是一个关于时间节奏、音乐节拍和延长记号的“声音”的作品。在这 4 分 33 秒里,乐手们安静地坐在未使用的乐器旁边,你实际上听到的不是寂静,而是日常生活的配音。你可以听到人们在座位上的晃动声,以及偶尔的咳嗽声。有雨水打在屋顶上的声响,或是汽车驶过的嘈杂声。木地板吱嘎作响,关门声,灯发出嗡嗡声。你的听觉变得高度敏感,甚至触摸自己的脸都会产生噪声,而那声音大到妨碍坐在旁边的人。

——威尔·贡培兹《改变艺术的 31 种凝视》

耳机会营造一种幻觉,使你的感官误以为听到了音乐的全部细节。许多艺术家在录音室坚决不用耳机,因为这只是真实世界听觉体验的劣化赝品。音箱出来的声音就更接近房间里演奏乐器时的声音——听者沉浸在全频段的、立体的震动中。

——里克·鲁宾《创意行为》

通常,重新获得私人声音空间的唯一方法是用自己的声场来填充,比如 MP3 播放器或智能手机。英国萨塞克斯大学媒体与电影教授迈克尔·布尔(Michael Bull)说:“iPod 的泛滥可以被简单地理解为一种令人愉快的中毒形式,在这里,用户所处的‘完全和解’的世界是一个不曾被入侵的梦想。就是说,iPod 能够同时直接介入世界和人的情感之间。”

——迈克·戈德史密斯《牛津通识课:声音》

📚 奇喻记

理查德·布劳提根专题

作家简介:

理查德·布劳提根(Richard Brautigan,1935–1984)是美国独树一帜的后现代主义作家与诗人,常被视为连接“垮掉的一代”与 1960 年代嬉皮士文化的关键纽带。他出生于华盛顿州的贫寒家庭,童年动荡不安,青年时期移居旧金山,凭借 1967 年出版的《在美国钓鳟鱼》一举成名,成为“爱之夏”运动中的文学偶像。布劳提根的文字风格轻灵、荒诞且充满碎片化的诗意,擅长用极简的语言构建超现实的隐喻世界,这种独特的“布劳提根式风格”对后世作家(如村上春树)产生了深远影响。然而,随着反主流文化的退潮,他的声誉在 70 年代末逐渐衰落,晚年深陷酗酒与抑郁的泥沼,最终于 1984 年在加州家中饮弹自杀,留下了一个关于才华、孤独与美国梦碎的传奇背影。

风格评述(Gemini 3.0 Pro):

布劳提根的写作风格是一种极简主义与超现实主义的奇异杂交,常被形容为“举重若轻的虚无”。在修辞上,他摒弃了传统现实主义的逻辑链条,创造了极具辨识度的“布劳提根式隐喻”:他不寻找事物外观的相似性,而是通过通感思维跳跃,强行将微观的私人情绪与宏大的工业、地理或历史意象焊接(如将“沉默”比作“章鱼”,将“性”比作“葬礼”),在文本中制造出一种时空错位的蒙太奇效果。这种风格用童话般天真、透明的语调包裹着内核深处的孤独、死亡焦虑与反主流文化的幻灭感,仿佛一位看着世界崩塌却仍在专心搭积木的孩子,在荒诞的冷幽默中透出一种温柔而易碎的诗意。

🔄 Scale Displacement

这种比喻将极小的事物扩大为宏大的地理概念,或者将人体景观化。这种错置感制造了一种迷幻的微观世界,将亲密关系或个人情绪“地图化”。

那是一只黑猫,像她头发的城池中延伸出的一片郊县

——《天上掉下个大草帽》

我们大部分的人生都是在衣服的遮掩下私密地度过的,除非是像维达这样的特殊情况。她的身体活在她本人的外面,供人欣赏,就像一片失落的大陆。而她的衣服则是她凭自己喜好选择的恐龙,栖居在这片世外桃源上。

——《去蒂华纳做手术》

“五年。”她重复道,仿佛这是一个国家的名字,而她是那里的总统,那些在酒店房间里的烛光下生长的花朵则是她的内阁,而我是图书馆的秘书长。

——《去蒂华纳做手术》

💭 Materialization of Abstract

将看不见的声音、梦境、神圣概念,比作具体的、甚至有些粗糙的日常工业制品、食物或动作。这消解了崇高感,带来一种“平民化的虚无”和感官的通感。

猫的呼噜声就是日本女人梦的发动机

——《天上掉下个大草帽》

上帝这个词几乎迷失在了他的喉咙里。它听上去像是有人把屁股撂在了一张旧椅子上

——《霍克林之妖》

当你吃了你的避孕药,就像发生了一场矿难

——《布劳提根诗选》

一阵慢雨在河面上嘶嘶作响,像一只装满油炸鲜花的平底锅

——《布劳提根诗选》

📖 Narrative Simile

布劳提根的比喻往往不只是一个短语,而是一个微型故事。他会顺着比喻的逻辑多走几步,让比喻本身变成一个小剧场,甚至有了自己的时间线和结局。

好比一只鸭子不知道自己为什么一到秋天就要南飞,或者一头老骆驼有一天突然发现自己背上长了一个驼峰。

——《天上掉下个大草帽》

他把手伸到打字机里,像殡仪馆工作人员给棺材里的死人收拾遗容一样取出一张纸。

——《天上掉下个大草帽》

太阳就像一枚巨大的五十美分硬币,有人在上面浇了煤油,用火柴点着,然后说:‘来,拿着,我去买份报纸。’他把硬币放在我手里,再也没有回来

——《在美国钓鳟鱼》

😟 Neurotic Personification

赋予静物以人类的性格,而且通常是那种疲惫、焦虑、抑郁、甚至带有官僚气息的性格。万物皆有灵,且万物皆丧。

我看了床边桌上的钟。时钟的五官费力地从千疮百孔的斑驳中显露出来。钟表看起来不是很高兴。我想,它更希望自己生在一个银行家或者是有教职的老处女家里头,而不是来自旧金山一个不走运的私家侦探之家。钟表意志垂丧的双臂显示着 5:15。我还有四十五分钟时间,前去鲍威尔街的广播电台和我的客户碰面。

——《梦回巴比伦》

这场暴雨编造了一个难以置信的复杂故事,说它不得不去拜访一个人的祖母,那人的祖母有一台坏了的冰激凌机,不知怎么的,需要大量的雨水来修理它。“但也许几个月后我们可以聚一聚。我来之前会打电话给你。”

——《草坪的复仇》

地面覆盖着厚厚的积雪,看起来像刚刚领好了政府养老金,正期待着漫长而惬意的退休生活。

——《草坪的复仇》

⚰️ Domestic Death

布劳提根总是用死亡、葬礼、棺材来比喻日常生活中的小事,或者将身体部位比作腐烂或冰冷的物体。这种反差制造了“甜蜜的恐怖”。

他的脑中已经闪过了自己的葬礼。
那是一场很美妙的葬礼。
他在自己的葬礼上看到了这个美丽的日本女孩,她戴着一条相当衬她黑眼睛的面纱。
他的棺材被抬进坟墓时,她就走在棺材前方。
她与棺材以及两边的护灵人保持着一致的步伐节奏。
他的这场葬礼如同河流汇入永恒。
停不下来。
他们已经走过了他的坟墓。
他们没有在那个敞开的大洞前停留。
在她的带领下,他们只是继续前进,直至永远。

——《天上掉下个大草帽》

他的棺木在海上穿行,像贝多芬的手指,抚过一杯酒。

——《布劳提根诗选》

一个穿绿色迷你
裙的女孩,不怎么漂亮,
走在大街上。

一个商人停下来,转身
盯着她的屁股看,
她的屁股就像一只
发霉的冰箱。

美国
已经有 200,000,000 人口。

——《布劳提根诗选》

💡 闪念集

流感病毒的潜伏期,足以扰乱大脑对感冒的归因。"归因"的图景是直接的、明晰的,稍微复杂一些的情况,就不让人有谈论的兴致了。虽然一部都没看过,但我敢断言,"死神来了"系列没有拍过"久坐"。


有的人,这本书看一会儿,换一本书再看一会儿,能同时看五六本书。但他也不会看杂志。


语言本身就很容易造成幻觉。比如,"虽然……但是……"的内容往往是并列的,但却是不可交换的。


清朝人的发型可以说是:头发长,头发短。


可乐麦炫酷(雪顶可乐)喝到最后像是一杯脏雪。

🛠️ 操作台

🔍 OCR(续)

早就听说过 PaddleOCR,不过此前多为本地部署。这次看到它推出了在线版,便试用了一下。

工作流和之前 MinerUOCR 大致相同,可以总结如下:

  1. 使用 Acrobat 等工具逐章拆分 PDF
  2. 批量拖动至 PaddleOCR 进行 OCR 识别(我用的 PaddleOCR-VL
  3. 将识别后的 Markdown 文件下载至同一文件夹
  4. 使用 Gemini 3.0 Flash 校对文本,Temperature 调为 0,Thinking level 调为 Medium
  5. 调用 Pandoc 合并 Markdown 文件,再转换为 Epub 等文件格式

注意:目前版本的 MinerU 识别竖版书存在问题,每一段从左到右一列一列读取。PaddleOCR 还是可用的,但部分段落也会出现这样“颠倒”的问题。另外,由于存在“跨页断行”问题,需要进一步校对。

如果用 Google AI Studio 的 Gemini 3.0 Pro 模型,速度会慢一些,但步骤也会少一些:

  1. 使用 Acrobat 等工具逐章拆分 PDF
  2. 使用 Gemini 3.0 Pro,系统提示词不变,Thinking level 改为 Low
  3. 每章开新窗口,识别结果保存为 Markdown 文件(可以直接保存在一个文件里)
  4. 调用 Pandoc 转换为 Epub 等文件格式

效果如下(PaddleOCR 的结果经过 Gemini 3.0 Flash 校对),都达到了我的可读标准。

🤖 AI 翻译(续)

现在可以更新一下之前的 AI 翻译工作流

第一阶段:准备工作

  1. 在 Google AI Studio 中选用 Gemini 3.0 Pro / 3.0 Flash 模型
  2. 将翻译提示词填入"系统指令"

第二阶段:翻译

  1. 使用 Calibre 编辑器打开 Epub 文件
  2. 依次打开每个 XHTML 文件,全选复制文本内容,发送给大模型进行翻译
  3. 将每章翻译结果保存为独立的 Markdown 文件

第三阶段:校对

  1. 使用 AI CLI(或者直接用 AI Studio 的 Flash 模型)逐个检查 Markdown 文件
  2. 识别并修正多语言混杂问题

第四阶段:重新打包

  1. 将原 Epub 文件重命名为 .zip 并解压
  2. 提取图片文件夹
  3. 将图片文件夹与翻译好的 Markdown 文件放在同一目录
  4. 使用 AI CLI 调用 Pandoc 工具:合并所有 Markdown 文件,转换为新的 Epub 文件

用 Google AI Studio 的 Build 模式写了一版(Gemini EPUB Translator),可以调用 Gemini 3.0 Flash,一键实现上述工作流:

EPUB 效果:

如果功能需求更复杂,或许不如直接用 AiNiee,自制应用主要还是满足自己的使用需求,比如:

  • 不翻译版权页、目录等页面,输出结果中也直接删去
  • 不翻译参考文献,毕竟我也不看,但还是保留在输出结果中
  • 不翻译书里的人名,这样不需要术语表,前后文也能保持一致
  • 不使用英文电子书的原始排版,而是通过 Epub->Markdown->Epub 的流程,套入自己满意的样式模板

后续,我复制了这个项目,改成一个可以自定义调用 API 的版本:AI EPUB Translator,这样就可以下载后用 npm 运行了。

下面是几个模型的效果对比,分别是 minimaxai/minimax-m2.1qwen/qwen3-next-80b-a3b-instruct 和 Gemini 3.0 Flash:

谈论心理健康从禁忌变成常态的速度可谓前所未有。就在几十年前,承认自己与抑郁症、焦虑症、强迫症或其他心理健康问题作斗争,还会构成严重的社会负担。寻求治疗的人可能被贴上"疯狂"或"精神病"的标签;他们可能被认为脑子有问题,甚至可能被认为具有危险性。然而如今,公开谈论心理健康困境被视为真诚和个人力量的象征。—— minimaxai/minimax-m2.1

谈论心理健康从禁忌话题转变为日常话题的速度,前所未有。仅仅几十年前,承认自己患有抑郁、焦虑、强迫症(OCD)或其他任何心理健康问题,仍会被视为严重的社交负担。寻求心理治疗的人可能被贴上“疯子”或“精神病”的标签,被认为“脑子有问题”,甚至可能被视为危险人物。然而今天,公开谈论心理健康困扰却被视为真诚与个人力量的体现。—— qwen/qwen3-next-80b-a3b-instruct

心理健康话题从讳莫如深转变为家常便饭,其速度之快,前所未有。就在几十年前,承认自己正与抑郁、焦虑、强迫症(OCD)或其他心理问题作斗争,还是一件足以产生严重社交负面影响的事。那时,寻求心理咨询的人冒着被贴上“疯子”或“精神病”标签的风险,被视为“脑子有问题”,甚至可能被认为具有危险性。然而在今天,公开谈论心理挣扎被视为真实自我的体现,也是内心强大的象征。—— Gemini 3.0 Flash

📧 邮件沟通提示词(续)

这个小更新我已经用了很长时间,就是给之前的提示词加上下面这一小段内容来限制输出格式:

1
2
3
4
5
6
## 输出格式
在代码块上方单独一行先写出邮件标题
在代码块内只包含邮件正文,方便一键复制:
- 从称呼(Dear XXX)到结束语(Best regards)
- 纯文本格式,不要添加任何 Markdown 标记
- 不包含署名,我会自己添加

为什么要把正文内容写入代码块呢,因为 Google AI Studio 的代码块可以一键复制,一切为了方便。

文章目录

  1. 🐎 跑马场
    1. 🎧 声音/个人的体验
  2. 📚 奇喻记
    1. 🔄 Scale Displacement
    2. 💭 Materialization of Abstract
    3. 📖 Narrative Simile
    4. 😟 Neurotic Personification
    5. ⚰️ Domestic Death
  3. 💡 闪念集
  4. 🛠️ 操作台
    1. 🔍 OCR(续)
    2. 🤖 AI 翻译(续)
    3. 📧 邮件沟通提示词(续)

Proudly powered by Hexo and Theme by Hacker
© 2026 Fengyukongzhou