Joffoo's blog

The ethereal flight, oft rehearsed in the theater of one's dreams...

Nano Banana:最新换装小游戏

Lovart 的 Nano Banana 模型不限量试用今天截止,我正好写篇东西,记录这个周末用它做了哪些实验。权当一篇周记。

我在用的 Nano Banana(正式名称为 Gemini 2.5 Flash Image)免费使用窗口主要有两个:一个就是最常用的 Google AI studio,另一个则是之前没用过的 Lovart。

前者是经典对话界面,后者则整合了更多 Agent 功能(也就是说你的提示词可以不那么面面俱到),也不止可以调用 Nano Banana 这一个模型。

常言道,一切免费的东西都是广告。这次试用发现,Lovart 与之前用的 Recraft 虽然乍看相似,但功能上几乎可以全方位替代。

谁从小玩到大

不知道为什么,我对操作图像很有兴趣。

至于换装小游戏,我先不承认了。小时候特别喜欢找到一张有趣的图片,然后调一下滤镜、饱和度、亮度和对比度,直到把它变成一张废片。

后来有个手机应用,已经记不住名字了。它和前段时间很火的“吉卜力风格滤镜”差不多,只不过更为基础,比如铅笔、水粉风格,比如梵高、蒙德里安风格。

现在的模型可以做到太多了,有“万物皆备于我”的错觉,几乎是一种“纵欲”。

刚刚翻了一下“仅自己可见”的微博,发现我的兴趣点始终不变,也从没动过认真研究一下的心思,技术长进多半是因为工具的迭代。

不悔少作之“热成像梵高”

不悔少作之“垂泪观音”

以下是我从几个博主那里学到的思路,然后用一段素材整合起好几个案例。另外不得不说,虽然这个模型很强大,但也会出现“词不达意”的状况,不知是我表达的问题还是模型理解的问题,总之积累一些提示词还是有用的。

  1. 动漫转真人:Generate a highly detailed photo of a girl cosplaying this illustration, at Comiket. Exactly replicate the same pose, body posture, hand gestures, facial expression, and camera framing as in the original illustration. Keep the same angle, perspective.1
  2. 人物换动作:Figure 1 character replaced with Figure 2 pose.2
  3. 首尾帧生成视频:Lovart 调用可灵模型生成视频。
  4. 抠图并生成贴纸:Isolate the all character from this cartoon screenshot. Remove the background completely and replace it with a solid {green} background. {Add a clean, smooth, and uniform white outline around the entire character}. The final output should be a high-resolution, die-cut sticker with sharp edges, vibrant colors, and a clean overall look with green background, ready for printing.3
  5. 人物转手办:Turn this photo into a character figure. Behind it, place a box with the character’s image printed on it, and a computer showing the Blender modeling process on its screen. In front of the box, add a round plastic base with the character figure standing on it. Set the scene indoors if possible.4
  6. 换装小游戏:Try them on. (实际是 Lovart 分步实现的,效果好于直接调用 Nano Banana。)

对着地图做梦

Gemini 2.5 Pro 模型是会玩“图寻”的5,也就是通过谷歌街景图推断所在位置的游戏。我之前试过几盘,最大难点是找不准 AI 所说的地级市到底在哪儿。

这是一个反向的操作,从地图出发去推断风景6

因为有画刷工具,这个案例很适合在 Lovart 上实现。可以看到生成的图片大意不错,但是细节怪怪的,你会看到一些陌生的建筑物,仿佛进入了一个“有可能是这样”的平行时空。

这是我之前玩过的一盘图寻。这个街景让我莫名有种一种“既视感”,转了好几圈,感觉不是梦到过,而是亲自到过,应该就是学校所在地附近的“大珠山”。

于是我赶紧放大地图,找到山东,找到黄岛,找到珠山,选中!

选中了“小珠山”……不过已经很近了。

看看 AI 画的大珠山,不得不说是有些相似的,山的秃顶处同样建有木栅栏,虽然整体看来,植被要茂密一些。但我连大小珠山都分不清,很难说是 AI 错了,很有可能是我记错了,还有可能是季节错了,也有可能是珠山错了,因为如果它想,它也可以多长几棵树的。

这就是我说的“有可能是这样”的平行时空。

陪我做点小事

这周末又去了趟图书馆,站在书架间翻完了一本书——《珠唾集》。作者的名字较长,我一直记不住,反倒是译者范晔更为有名。这本书体量很小,是几百个句子,像是没有戾气、但有谐趣的微博合集。

每句话都有配图。这些插图都是简笔画,但恰到好处,没有喧宾夺主,只是在文字旁边做好伴舞的角色。有几句也是多亏了插图才看明白是什么意思,比如“天鹅集天使与蛇于一身”,配了这样一幅图:

“我们捡起掉落的手套时是在与死亡握手”,配了这样一幅图:

有点离题了,赶紧回来。

站在书架间,想把书页拍清楚并不容易。照片多少会因为镜头位置和书页弧度而畸变,也会因为光线不足和手机阴影而变暗。

于是我灵机一动、福至心灵,写了一串提示词:

1
请用蓝黑钢笔重新绘制这幅简笔画,要求保持细节,画在纯净RGB(255,255,255)素描纸的正中位置,不要显示纸张背面透过的杂影。

效果大概是这样的,反正我还算满意:

你可能会问,好多“扫描王”应用不都能干这事吗,还需要写一段提示词用最新模型重复实现一遍吗?那我只能说——

趁着还免费,用呗。

25/08/31

1. 参考 https://x.com/ZHO_ZHO_ZHO/status/1960960372078469426
2. 参考 https://x.com/ZHO_ZHO_ZHO/status/1961024423596872184
3. 参考 https://x.com/karminski3/status/1961388726216790473
4. 参考 https://x.com/MrLarus/status/1960412313862987797
5. 相关文章 https://mp.weixin.qq.com/s/nApsHJlY_gK1JQWbMgi3IA
6. 参考 https://x.com/op7418/status/1961443121662951687

文章目录

  1. 谁从小玩到大
  2. 对着地图做梦
  3. 陪我做点小事

Proudly powered by Hexo and Theme by Hacker
© 2025 Fengyukongzhou