Nano Banana：最新换装小游戏

Lovart 的 Nano Banana 模型不限量试用今天截止，我正好写篇东西，记录这个周末用它做了哪些实验。权当一篇周记。

我在用的 Nano Banana（正式名称为 Gemini 2.5 Flash Image）免费使用窗口主要有两个：一个就是最常用的 Google AI studio，另一个则是之前没用过的 Lovart。

前者是经典对话界面，后者则整合了更多 Agent 功能（也就是说你的提示词可以不那么面面俱到），也不止可以调用 Nano Banana 这一个模型。

常言道，一切免费的东西都是广告。这次试用发现，Lovart 与之前用的 Recraft 虽然乍看相似，但功能上几乎可以全方位替代。

谁从小玩到大

不知道为什么，我对操作图像很有兴趣。

至于换装小游戏，我先不承认了。小时候特别喜欢找到一张有趣的图片，然后调一下滤镜、饱和度、亮度和对比度，直到把它变成一张废片。

后来有个手机应用，已经记不住名字了。它和前段时间很火的“吉卜力风格滤镜”差不多，只不过更为基础，比如铅笔、水粉风格，比如梵高、蒙德里安风格。

现在的模型可以做到太多了，有“万物皆备于我”的错觉，几乎是一种“纵欲”。

刚刚翻了一下“仅自己可见”的微博，发现我的兴趣点始终不变，也从没动过认真研究一下的心思，技术长进多半是因为工具的迭代。

不悔少作之“热成像梵高”

不悔少作之“垂泪观音”

以下是我从几个博主那里学到的思路，然后用一段素材整合起好几个案例。另外不得不说，虽然这个模型很强大，但也会出现“词不达意”的状况，不知是我表达的问题还是模型理解的问题，总之积累一些提示词还是有用的。

动漫转真人：Generate a highly detailed photo of a girl cosplaying this illustration, at Comiket. Exactly replicate the same pose, body posture, hand gestures, facial expression, and camera framing as in the original illustration. Keep the same angle, perspective.¹
人物换动作：Figure 1 character replaced with Figure 2 pose.²
首尾帧生成视频：Lovart 调用可灵模型生成视频。
抠图并生成贴纸：Isolate the all character from this cartoon screenshot. Remove the background completely and replace it with a solid {green} background. {Add a clean, smooth, and uniform white outline around the entire character}. The final output should be a high-resolution, die-cut sticker with sharp edges, vibrant colors, and a clean overall look with green background, ready for printing.³
人物转手办：Turn this photo into a character figure. Behind it, place a box with the character’s image printed on it, and a computer showing the Blender modeling process on its screen. In front of the box, add a round plastic base with the character figure standing on it. Set the scene indoors if possible.⁴
换装小游戏：Try them on. （实际是 Lovart 分步实现的，效果好于直接调用 Nano Banana。）

Gemini 2.5 Pro 模型是会玩“图寻”的⁵，也就是通过谷歌街景图推断所在位置的游戏。我之前试过几盘，最大难点是找不准 AI 所说的地级市到底在哪儿。

这是一个反向的操作，从地图出发去推断风景⁶。

因为有画刷工具，这个案例很适合在 Lovart 上实现。可以看到生成的图片大意不错，但是细节怪怪的，你会看到一些陌生的建筑物，仿佛进入了一个“有可能是这样”的平行时空。

这是我之前玩过的一盘图寻。这个街景让我莫名有种一种“既视感”，转了好几圈，感觉不是梦到过，而是亲自到过，应该就是学校所在地附近的“大珠山”。

于是我赶紧放大地图，找到山东，找到黄岛，找到珠山，选中！

选中了“小珠山”……不过已经很近了。

看看 AI 画的大珠山，不得不说是有些相似的，山的秃顶处同样建有木栅栏，虽然整体看来，植被要茂密一些。但我连大小珠山都分不清，很难说是 AI 错了，很有可能是我记错了，还有可能是季节错了，也有可能是珠山错了，因为如果它想，它也可以多长几棵树的。

这就是我说的“有可能是这样”的平行时空。

这周末又去了趟图书馆，站在书架间翻完了一本书——《珠唾集》。作者的名字较长，我一直记不住，反倒是译者范晔更为有名。这本书体量很小，是几百个句子，像是没有戾气、但有谐趣的微博合集。

每句话都有配图。这些插图都是简笔画，但恰到好处，没有喧宾夺主，只是在文字旁边做好伴舞的角色。有几句也是多亏了插图才看明白是什么意思，比如“天鹅集天使与蛇于一身”，配了这样一幅图：

“我们捡起掉落的手套时是在与死亡握手”，配了这样一幅图：

有点离题了，赶紧回来。

站在书架间，想把书页拍清楚并不容易。照片多少会因为镜头位置和书页弧度而畸变，也会因为光线不足和手机阴影而变暗。

于是我灵机一动、福至心灵，写了一串提示词：

1	请用蓝黑钢笔重新绘制这幅简笔画，要求保持细节，画在纯净RGB(255,255,255)素描纸的正中位置，不要显示纸张背面透过的杂影。

效果大概是这样的，反正我还算满意：

你可能会问，好多“扫描王”应用不都能干这事吗，还需要写一段提示词用最新模型重复实现一遍吗？那我只能说——

趁着还免费，用呗。

25/08/31

¹. 参考 https://x.com/ZHO_ZHO_ZHO/status/1960960372078469426 ↩

². 参考 https://x.com/ZHO_ZHO_ZHO/status/1961024423596872184 ↩

³. 参考 https://x.com/karminski3/status/1961388726216790473 ↩

⁴. 参考 https://x.com/MrLarus/status/1960412313862987797 ↩

⁵. 相关文章 https://mp.weixin.qq.com/s/nApsHJlY_gK1JQWbMgi3IA ↩

⁶. 参考 https://x.com/op7418/status/1961443121662951687 ↩