找回密码
 注册
关于网站域名变更的通知
查看: 120|回复: 0
打印 上一主题 下一主题

不止能做钟馗手办!全网最强图像生成AI实测:这是终极版PS?

[复制链接]

该用户从未签到

跳转到指定楼层
1#
 楼主| 发表于 2025-9-2 10:40 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
最近两周,“手办化”突然就火了。) K" y& B$ m; P! q, x& T" c* J

: i, T! Q6 v+ d0 T% I& e: f5 g$ H4 Y7 F, v6 ~' V; ~
事情是这样的,大约在两周之前,大模型竞技场LMArena上架了一个只闻其名,不见其身的神秘模型——“nano banana”,按照官方说法,这是一个顶尖的图像生成与编辑模型,能实现前所未有的创作控制力。- o1 D  ?) p/ ]8 J$ `
. i+ u$ j- Z0 B$ s9 }; H3 H. \* {

3 b( P. L9 J" A1 p% U" x* ~/ R! P结果呢?整个互联网的AIGC玩家,都在用它变身“手办大师”。
# y% M  f1 A2 l
; a: `- t4 j8 K+ H0 a7 @% ~4 Q' ~* k* h0 }9 p: x
不开玩笑,小雷是真被这玩意给刷屏了,这两天一打开群聊,就能看到无法无天的群友们在拿这玩意疯狂整活,有把自己头像做成限量版GK模型的,有把自家猫狗“手办化”的,甚至还有给刚发布的《黑神话:钟馗》弄雕像和游戏盒的,推特上的国外网友玩得更是乐此不疲,看得我都有点心痒痒的。2 [8 J* z) t. e- G, l+ k" _+ i6 x, s

5 a* {9 |  E' Q1 d& t( i; I- y+ h
2 [. q: z4 o' o2 j. w7 m8 m# R( j9 ~幸好,这次我们不用眼巴巴地羡慕了。
/ E5 ?: r! O" s* W9 n/ D0 M
' `3 J" H" J- d% D' s/ t1 E
7 S/ d. I3 J( h; a2 \0 L" `
% m. M0 p5 |% z$ W
(图源:LMArena)

8 K, b/ Q$ n% J6 D1 W. V% P7 m
! y' G. L; Z9 c0 [7 j
7 H3 f+ j+ u/ @0 `0 w! k3 N- d2 |. W随着Google的正式发布,如今Gemini 2.5 Flash Image已经通过Gemini API和Google AI Studio向公众开放预览,用户只需访问官网,就能直接体验到下一代图像模型的威力。# o$ P# r0 V. U( P* j& X: @2 V
8 Y: C2 p- \( D  A; Q$ P( S5 F  y

* @3 j- m8 C5 K3 |' w  I( M最重要的是,这玩意在AI Studio里进行测试是完全免费的,对于我们这种热爱尝鲜的玩家来说,简直是把探索未来的门槛给直接铲平了。& h; Q1 p3 |( q6 e5 `, p. G
$ L% I: o# n5 _& I9 P0 \' A
' ?! S( h8 n+ J) w# f+ U
话不说多,我们这边直接开整!
9 n2 z, H3 m3 ]$ W, Z! |" P/ ^7 v1 O* A" `
) l. v0 ?! S5 V. s) w# r# B" m
Gemini 2.5 Flash Image让人人成手办大师
1 E3 V( p! s0 H% H$ e
7 g3 {, d6 {# d3 W. F2 b; B* r+ T. G' ~8 ]9 ^7 Y5 G

5 ]7 |4 j7 r+ s! }& k2 Y想体验这个功能的话,其实还蛮简单的就是了。0 B( \; p; n# R2 d4 E
+ W3 L) W, }' M* `/ l! h9 H2 s

! L$ x" E# W3 u0 N6 S打开Google AI Studio网页版,在Generate media选项卡下就能找到Gemini 2.5 Flash Image。界面非常直观,一个提示词输入框,一个上传图片的区域,这就是通往新世界的大门。
. ^! i: o4 b7 ]+ X0 W( l# I9 g0 C. D3 @. h
: |0 ]0 c5 @8 c
要做的事情很简单,上传一张图片,然后用自然语言告诉它我们想要生成的内容就像。, D: r' ]& g/ A/ s2 `1 W2 ^8 h
/ |2 }8 ?3 y( p. J
* i) i/ j0 D' n
+ U# G' F" g4 V* \+ v  V% \
(图源:Gemini)

, [1 y# K* @1 H2 w6 \* ]
+ o; k% g' [# }% q( k( v% V+ E+ J: p0 J6 t5 U
话不多说,先来看图。0 E8 |! L0 Z7 Y1 J& e
" ]% C; L9 Z* D2 m+ C
' ~  v+ K3 b) R& q* @+ n3 |( ]8 L* N" n
首先,我们准备一张自己想要进行“手办化”的图片,可以是动漫,也可以是真人,甚至不必是全身照,比如这张来自漫画《捉摸不透的***织子桑》里的有阿谷織子的单人图就很不错。) q1 ?* F0 ?+ G! V; j

- y+ u3 H7 m2 q9 ?5 ^( {% b% k
8 x0 h) ^) l9 t接下来,输入提示词:* h, }: y/ w4 G- p! Q4 N
- A) W4 c9 Z. C' x/ q/ X6 H8 W
" |% g2 u+ ?, W3 Q) P* f, K
Please turn this screenshot of the character into a kotobukiya figure. Behind it, place a toy box printed with the character's image. Next to it, add a computer with its screen displaying the design, complete with the the character. In front of the box, add a round plastic base for the figure and have it stand on it. The PVC material of the base should have a crystal-clear, translucent texture, and set the entire scene indoors.

& e# |& J$ O; Q- A# y8 n" v6 u/ q
  ~0 k5 k! T% X4 o1 m+ b最终成品如下:
9 y1 O( H8 S+ U& L
# v% {9 g" \# K# ~) u1 C" I
! Q* B1 _, \. k/ L9 e% ^
9 F1 z! F  Q. j, ?, o3 i: h+ L! M# \
(图源:雷科技自制)

) i: o8 m# N* D- W! ^. n8 Y9 q: y8 j5 \# }) p: E' @+ H
' b/ a5 Z8 Q6 y( f4 v7 p
不得不说,Gemini对“手办质感”的理解已经超出了我的预期。' |1 p! c, v/ {& f1 s

! f- r, ]0 q, z6 Y% G8 P7 k5 P: y4 @% O& Q  p
这张图的生成效果达到了以假乱真的水准,无论是手办本身的材质(蕾丝、皮革、肌肤)、包装盒上的文字和品牌Logo,还是背景电脑屏幕上复杂的建模界面都很不错,只有高度模糊的背景能看出些端倪。
" c: F1 u( @' L( }- O8 l/ V& i" c; S$ ?2 _! {

. H% l/ m0 y5 b% ?% V, b: N+ P% s再来些热门的,比如说《黑神话:钟馗》:% F: V$ B& o8 k* |8 j' V9 F4 h
$ q' D' R+ r) R- n* N; \. ^

/ E' B4 b& i& K9 a9 r
$ ^7 V2 j% u" R% E2 _* Q
(图源:雷科技自制)

0 q( J3 D. x) Q- O' w: S. ~; H1 z

; O+ G9 v: {% Q5 E! f; B) V接着试一下大家都关心的名人,比如说马斯克:
' a! B5 z6 P" i' Q3 M: O
" y3 a8 A5 s4 F% N! }; K9 X- B9 Z; x& ?
7 M% M. g4 Q9 v; G1 M& J
(图源:雷科技自制)
: ~2 V' m" \# z
, d( ]8 y0 L) B, A
1 {; p) f9 O( L0 M  P
从结果来看,转换效果可以说是几无失手,非常成熟。3 l; ]2 _+ n: F

5 D! |. b, v* Y$ f. k5 L9 i5 e0 R  b% _. i
如果你想玩点更高级的,我们把这张生成的图片,扔进同样是豆包视频生成中,用提示词“画面外的人从两边伸出亚洲人的双手,拿起手办把玩并展示桌上手办的视频”,生成一段把玩手办的视频。
2 T- s% D% F0 M" ~0 [6 A* V: I$ ], j: y& H7 y3 m% a7 x

" b6 T4 }( k7 }3 P/ s* U0 N! C

0 p% I/ E" z: z
2 \2 k. Z! k7 }+ P
1 z0 u5 T/ I( g) w2 p- h$ }: ?) r. `
(图源:雷科技自制)

6 ~$ S9 c' a$ e! u5 k1 P2 {3 k4 ]# p

+ [$ V; x: ~1 R2 {# ~3 ]3 p如果用提示词“360度缓慢旋转这个手办,转台拍摄”,就能生成一段平滑的环绕展示视频。
" Z) `* e% r2 i) U- I
4 s" `: c. Q$ U: h2 x! z' t" g: d' C- p

. e, |) K8 k0 v7 P
(图源:雷科技自制)

, u. Y+ D: r2 `2 u1 ?8 t/ l) P1 P' R, H' x

: u* a' Q& B5 h5 T* G最后还可以用Meshy或者腾讯混元3D,将手办3D建模化,我们就能得到一个可以自由旋转、缩放的3D模型。/ t: E" B: @+ O: G+ c
( W" i, J" @1 O% b: c: ]
/ p! f& A$ F$ Y' t5 D
(图源:雷科技自制)

6 M9 I" Q( z3 Y' K/ b; i
3 B7 \1 \. D& k( Q
  a; W. n6 E! N虽说后两步借助了其他工具,但由Gemini 2.5 Flash Image产出的高质量初始素材,是整个工作流成功的基石。这种打破次元壁的做法,让每个人都能低成本地实现从一个想法到3D产品的完整流程,在过去是很难想象的。( r% K+ ], P! h+ }+ T

1 D1 \- _( P5 d% d' ]3 Q2 V7 X  v: Y  o  T* F
修图能力更强了,其实是终极版PS?
4 i) N. }. ^% ~! ~$ a/ w( z) t

# M, O4 s# f' C  L- Q4 K" A2 x. F, O8 y5 s/ r  a, w, X* e

( P2 R5 q# g( s9 o; b
! f* k- t3 K8 J: b* X# T. G不过,人人都在玩手办化,是不是有点大材小用了?; s' @% D+ M. p: n  |

& W: g  v! s- w( s5 ~
3 d" p% `9 C' H) D# _我们不妨转换一下思路,把它当成终极版的PS来用?
9 F0 H8 Q3 K1 p& Q$ T( E% c5 `" q0 v) R) w% _& K7 q. ~

6 H  H; P% w2 C+ L! J; `% s, C举个例子吧,比如说那些珍贵的、但因年代久远而模糊破损的老照片,它能不能修复呢?
" P* C( _) _1 @* k# v& J7 ~. F" h1 f9 o; q% `* u8 x* H6 E

2 H- p: ]4 p0 T! {' V  g. z0 f我上传了一张黑白老照片,照片上有划痕和噪点,清晰度也很低。5 _* t8 r* o! [$ p! ]! `7 C
# \* F) S$ P% d3 m! t5 L
2 m+ l/ K1 p: d" @
' i* @! H, |2 U- X) P
(图源:X)
- R5 u* h# a& V/ P( c: N: J

0 |  e: _  C& b
$ D% H9 j$ g* h1 k0 o; v接下来,输入提示词:
9 J0 c3 m9 O) y  q7 V' \4 ~6 v* z) }1 A( o0 Q& M

; j$ p6 K" R/ |( K$ }% M1 e8 y" [
Restore this old photo, remove scratches and noise, increase the resolution, and colorize it realistically.
- H. R# D5 ^. y& b" x
! p5 y# T0 K2 e$ s
4 S  c' k, J# m
(图源:Gemini)

! O9 r3 P9 f3 p$ H" _
( X' U% s- K2 t, f$ w+ |
0 v7 |; v  e* l+ g. N9 D2 U答案是,“完全可以,而且效果惊人”。2 ], E! ~% ^4 K% ^* y+ }- \
) F' a' ~! D$ I5 q3 L
3 n0 C! U, i* {! e4 N) F, V, J; L
可以看到,Gemini 2.5 Flash Image不仅清除了物理损伤,还通过算法补全了缺失的细节,面部的纹理和眼神光都得到了合乎逻辑的重现。上色的效果也偏近自然,没有出现早期AI上色那种“塑料感”,充满了温暖的时代气息。
3 h7 U$ r% M$ g/ F3 H' s, H+ `2 M/ i
  j5 i. I* @6 l1 S1 @4 i5 v4 G2 z& ?- J2 e  F; K) V+ f% O5 }
再试试设计行业里源远流长的梗,“把白天改成黑夜”这种要求,它能不能实现呢?# }. o; q7 b9 R+ D  ]
$ I& i* w5 S! R' q: `

' g9 u0 ]% {3 M& Q
& A& w5 G! Z/ @, W$ _  w
(图源:雷科技)
' Q$ m. q7 p8 d

( n' t! d  }  x9 q/ A
/ g* y, _3 B& Q5 Q- h提示词:  _7 a) c1 ^, c4 {* S

1 L" K9 ?  s4 V! B! L* s, u
1 o) g9 T" ]4 F8 ^- U
Change the scene to night time, turn on the streetlights and the lights inside the buildings, make it look like it's raining slightly.
' `/ d  S5 _+ X$ d  j6 J

7 N: h( X# y; G8 h* g2 [9 k1 C* z
8 F: J7 u7 {% X& I, Y/ `. o1 h& f
4 ^0 p) q% F+ O& `4 b1 h0 o
(图源:Gemini)

' M- c- @( h6 |0 M6 \+ R1 {6 G' i' L5 u. D( t- }9 q/ o

% c+ L6 t2 F; j  O7 d6 F, T" d只能说,Gemini 2.5 Flash Image在语义理解和光影重构这块,已经达到了很出彩的水平。它不仅仅是简单地调暗画面,而是真正理解了“夜晚”、“灯光”、“下雨”这些概念,并合乎物理逻辑地对整个画面进行了重新渲染。$ L) Q# g; j6 m- W  _- w# j
4 u; J! [, ~+ |( e

) |; F& E& Q% t! m最后,我也试了一下它的风格切换能力。这次就拿《Panty&Stocking》里的画面做例子:4 j0 }8 A6 X6 p. {" N6 w# n

: b9 _# ]! T$ Y4 g% p. a' [6 s0 U0 s
(图源:X)

0 t6 b/ a- i1 e- x
' ^. j8 U/ v; T
& W% `- u' c8 c
; C4 g  w( [! z
4 b( N( w* l( F; b提示词:  T; Y! A+ c/ [! b- y7 Q9 p

. I; |0 [) ~7 Q- [
3 e0 ?7 `2 O' q& B: v
Convert this scene into a photorealistic movie still from a 1990s live-action film, directed by Wong Kar-wai.
2 _9 Q! @& Q: c' F( v

9 k* N# R# g0 \* ]) v
(图源:Gemini)
% n5 j" f: o. M4 o. R% H

& `2 j! U2 e* B; G% |9 J! t" z; s# `% S' o6 Z
很有意思,它不仅做到了“三次元化”,还微妙地捕捉到了王家卫电影那种独特的色彩、光影和氛围感。  f  H( j( w$ ~% c! F
$ n3 q! }1 M$ C4 I

' o4 N6 B" o: C& D这种跨越媒介和导演风格的无缝切换,为艺术创作提供了更多可能。
) q* h4 r2 a! e9 P6 K. d. E1 j3 t/ I* B# V
4 `! P" P/ F; `& Q+ l& n: [; p: q  L
不算完美,却堪称图片AIGC新标杆7 s$ v, Q  D, t" E+ D$ z- d8 U
  y7 q3 [" e: l- [

* z4 c* B- M+ t: R! J# Y# ^9 E' [" U% F5 G* z% B- t
不可否认,Gemini 2.5 Flash Image的发布,标志着AI在图像生成领域实现了重大突破。
( Y) P9 I6 b( m
! L. v+ d" C# f2 F, j
/ x2 X5 ^* O! f3 i8 ~* t7 q$ j  j就像我展示的那样,曾经需要专业人士花费数小时在PS里用蒙版、图层、笔刷精雕细琢的工作,如今只需一句自然语言就能瞬间完成,甚至修图效果比我这种半吊子还要好上不少,属实有点惭愧。
+ {  r9 o6 j9 w5 B
0 B5 x/ r9 u  c- h
) D" x0 m# K- Z& k7 t. P( R1 ]. _目前该模型在预览阶段,并非完美无瑕。
4 e4 i& D! G/ }# z* m! y, n( O. |4 [! \" \* p
8 r# C1 a: H" ~+ @
在处理极其复杂的、包含大量人物的场景时,Gemini偶尔还是会出现轻微的逻辑错误或细节失真。对于一些过于抽象或违反物理常识的指令,它的理解能力也还有提升空间。
5 [$ @$ f9 [5 v! O) s. q/ {  I! l3 t# g; W3 O3 w3 o1 @# q8 T- E
. \( t+ f: v9 K2 p4 G9 Z
不管怎么说,Gemini 2.5 Flash Image算是为AI图片生成应用树立了一个新的标杆。1 I4 n2 H& |: |4 \1 x6 r+ t& k

, U- X( b( {7 B# k7 G+ {; d( n1 a
5 X- _2 |! R+ w1 E/ `' g; r可以预见的是,随着技术的不断成熟和成本的降低,未来手机、电脑的相册和编辑器都可能会原生集成这项功能,就像AI消除、AI扩图那样走进寻常百姓家。无论是专业设计师还是普通用户,每个人都有机会轻松上手,将自己脑海中的创意和对美的理解,更直观、更高效地展现出来。1 n! }4 {( m; n# @  J1 g5 F

# x# I$ E/ ~- K- J' x* S9 j: n+ b5 `( F) g( d5 B; f$ T
修图有手就行?或许真的不是梦。" V$ y; d9 p2 L2 g4 m: I$ \& @: o
6 q* Y6 d9 U. j* m' J, f" w
『本文转载自网络,版权归原作者所有,如有侵权请联系删除』
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-10-31 18:25 , Processed in 0.171875 second(s), 24 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表