|  | 
 
| 
说实话,五年前字节跳动官宣成立火山引擎时,我确实是属于看不懂的那一个。. o8 k- L- A; e& ^
x
EDA365欢迎您登录!您需要 登录 才可以下载或查看,没有帐号?注册  % e+ u1 v/ K0 W3 B: b+ I
 
 ; j- A. Y6 B& t在我印象里,当时云计算的牌桌上早已坐满了阿里、腾讯、华为这些巨头,战局胶着,利润微薄。字节跳动凭借抖音和头条手握着巨大的流量和现金流,为什么要一头扎进这片吃力不讨好的红海里?
 2 @5 b6 y- E+ n" u$ |' h! Z4 W
 % J) U2 B# p: t. F6 ]0 i  q0 Y3 F; m$ o# d
 这个问题,不仅是我,当时身边的许多同行都感到困惑。
 : _: |* P' c: J' @- Q! W3 Z3 q' F
 : U0 K8 @3 c( ]. Z! k* P' e# k
 % R/ ^2 _* @; Y; {* Z然而,最近几年,这个问题的答案开始变得异常清晰。* v3 p4 u, p6 r$ c
 
 7 Q1 o0 F. p. ~" F, m7 c" r- k  Z9 `; u7 I4 j. G
 尤其是在ChatGPT点燃了大模型的战火之后,云计算市场被重新激活,阿里云、火山引擎、百度智能云纷纷加大投入,让整个中国AI云市场的话语权争夺变得日益激烈,这一点从国际数据公司IDC的多份调研报告中可以看出端倪。* E, K3 C2 v+ D% j
 
 % \- a' n6 i+ f/ {. _4 c% y  j. k$ J! d2 U% U
 根据IDC 9月19日公布的报告,目前火山引擎在大模型公有云服务市场(即MaaS市场)位居国内第一,2025上半年市场份额49.2%,俨然接近半壁江山。/ r8 y# }6 k- b
 ' |  f) ]1 V- d4 i7 O$ O( a
 
 * h7 C/ X; B3 b& v/ B* V& g' i5 \5 Q: }
 
 (图源:火山引擎) 1 e& d/ L. o9 t" l8 a
 " s" v7 ]! T0 H8 s, j' G0 `8 N' |' U5 Y9 s) _# r3 Q7 b
 然而在日新月异的AI行业,这样的优势显然不足以掉以轻心。10月16日,2025 火山引擎 FORCE LINK AI创新巡展 武汉站正式拉开帷幕。在这场与NVIDIA联合举办的盛会上,火山引擎用一系列发布,诠释了“模型升级创新驱动”的真谛。
 ) M* X1 i, I# f/ k, j/ u  f
 p- I0 v0 W: A7 i0 l0 e) V
 7 [2 u7 p' \. H3 t雷科技受邀参加此次巡展,想知道火山引擎要折腾些什么新东西吗?跟着我来就行了。
 4 `. ~  r. d/ q2 B, |( e7 e
 # ^3 z6 j& w0 p8 e5 I; R* `四大模型上新,成本进一步下降5 m  G/ v: d, E1 I  L$ M5 e5 J8 C
 
 ' M' L* V3 b5 ]
 & z) h1 X7 q8 Z8 A: n
 ( q# X2 M- [% e" G; K  q: A在火山引擎总裁谭待看来,目前全球AI大模型正在三个方向上快速发展:
 " T1 a0 j1 [0 S1 z1 t0 Z; K% [
 ; m% J9 _/ ^4 b0 i6 p% p7 o; T8 F
 9 L! z" |. C. N, r1 j" ]  k0 y一是深度思考模型正与多模态理解能力融合,二是视频、图像、语音模型逐步实现生产级水平,三是企业级复杂Agent正在走向成熟,为企业激发新的生产力潜能。# G2 W# e8 a0 l! j# u' v
 
 ; w# n! i7 \0 X  n, c. _; `  M" t% J
 p$ R* Q$ j) ]5 l
 
 (图源:雷科技) % [! m! ?+ \7 T2 u6 y! \$ c. O# ~' u' R, |- y
 0 ?: y9 B# \( d# ^
 然而,在服务的过程中,火山引擎发现,开启深度思考模式下,模型效果确实提升了,但也会提高模型延迟和使用成本,这导致实际应用中深度思考的使用占比仅有18%。
 9 C5 H  m, C2 Y
 " s, C5 w1 m2 a$ Z/ l
 6 q5 N. G, b8 p/ L2 l针对这一痛点,豆包大模型1.6正式提供 Minimal、Low、Medium、High四种思考长度,平衡企业在不同场景下对模型效果、时延、成本的不同需求,并进一步提升了思考效率,这也让豆包1.6成为国内首个原生支持“分档调节思考长度”的模型。
 7 P- K  `2 `. S! q# n6 J( n( W$ C2 ~1 ]9 n/ q( L7 t- q, C
 
 1 p0 g2 a7 ^. T3 ~0 Q- l: _( a% k" T2 _6 f; h
 
 (图源:雷科技) ) X% _3 V% g. T, j& w+ I6 }( v6 m+ D
 5 Y3 t) e% \$ O$ D) O
 不仅如此,为进一步满足企业的多样化需求,火山引擎正式推出豆包大模型1.6 lite,号称性能超越豆包大模型1.5 pro,同时价格上,在使用量最大的0-32k输入区间里,综合使用成本较豆包1.5 pro降低53.3%,推理速度更快、更具性价比。6 a3 w& E( r: Z
 
 $ W6 D8 C2 L6 r* e* A- T6 H" x4 P3 }
 9 D2 m+ R: o5 E& e/ h
 
 (图源:雷科技)6 }, a. N4 I& F3 ] 4 m8 q3 D* t, n$ g5 g* D* x. D; W5 K
 
 . H# n* B/ o7 z2 c只能说,价格控制这块,火山引擎确实是行家中的行家。" d) _; N; v$ d) `
 8 V- J% u; v/ v! r
 
 9 n2 @- w% |  O' d' a- W# H对了,在今天大会上,火山引擎正式发布豆包语音合成模型2.0、豆包声音复刻模型2.0,它们都具备更强的情感表现力、更精准的指令遵循能力。
 % x9 m# a5 x' [/ k- b8 g
 % P, s* v0 N/ m3 J
 * D3 H; ?, r9 Y# H! b. D最重要的是,还能准确朗读复杂公式。& F4 [! [1 U' \8 n# M
 C( {+ ?; h9 w) f4 f$ i/ H7 F
 2 ]/ H8 L/ v4 p5 y  T) T
 
 7 m& c) u& D& s
 (图源:雷科技)% k. W! v" \- g* r) `- ]$ Q ! ^9 T# G# T% |+ l
 
 ~, j% a2 Y- T# t事实上,在教育场景中,复杂公式和符号的朗读一直是业界难题,目前市面上的语音大模型朗读准确率普遍低于50%,而豆包新发布的两大语音模型进行了针对性优化,目前在小学至高中阶段全学科的复杂公式朗读中,准确率可达90%。
 3 e5 `" l- t5 l# Y8 ~4 F9 J! l; R, J# E' S. d# i
 
 1 m5 R: F$ {+ O) l6 j听着蜡笔小新抑扬顿挫地读出这样一段复杂且冗长的化学公式时,我承认,我真的偷笑了。
 ' Z4 e! i. |, g; @
 # ]7 |. o0 ~4 t* R4 ~, ]8 Y& @9 V& A6 z) u/ V# S/ U5 ]' ?7 R
 全新的语音模型还能搭配图像模型来使用,快速创造出各种有声绘本,对即梦未来的发展也会有所加持。; m$ m% U1 ?& }' Y  X
 
 9 ^; t  `9 K  r; k% R! W4 }# K# _+ s
 正所谓,要“有好模型”,才能“做好应用”。% S( n9 g$ b$ A" R: Q- O
 
 ( p9 T4 _% I' Q: C8 s5 b  |8 s- W( y! F  ?" w% j. z- w4 q
 在小雷看来,好应用的底层必须由好模型来支持。而一个好模型,既要能精准捕捉用户需求,又得具备稳定的响应能力,更要做到出色的成本控制。
 + p4 t: p) e) j+ c; y0 Z3 o; Z' [: x& l% w! D# ?! k0 ]
 # y. j1 F3 m" m/ w6 S4 ^
 这样,才能让用户感受到“用得顺、靠得住、敢去用”。
 ' S8 x/ t. d5 R/ S1 T+ o2 N  f( _; ^3 ~
 智能路由加持,应用开发更省心
 5 D  Z; [. C. Y7 E; J5 D
 . x$ o) M* G% w4 C# w4 N1 C
 ! r+ K  K' e( [! Z/ U5 p8 W( H现在有了“好模型”,那么问题自然落到了如何“做好应用”上。% k4 Y5 e8 H$ l: c. P  T
 & B& D0 L. ]+ x+ I! h
 . s2 j+ C. M, A6 t
 在很多企业看来,如今市面上的模型越来越多,哪怕只看豆包大模型家族,也有不下十来款产品。面对具体需求时,如何选择模型最有性价比?
 t) m3 F3 N, D% S% v; E, y: b
 / o# |! C8 m; B3 E5 k' h* M  G. i; K% t" [% w
 为了解决这个问题,火山引擎在今天正式发布智能模型路由(Smart Model Router),这也是国内AI云行业首个针对模型智能选择的解决方案。
 ( \9 F0 J  K6 ~$ s5 j6 f1 `
 2 D9 ?' f1 B* Q5 Z& d" U
 & H: i9 h: u* @" r2 Z
 ' Z+ n, N3 [% m2 |- d5 b1 x
 (图源:雷科技) ( ~% B$ W) E7 I) @0 m* J
 4 i2 L1 z# u" `9 F: t$ }3 O1 X! ~. s0 k) F2 r
 这玩意的功能很好理解,就是能够根据用户的实际需求自动选择不同的模型运行任务。& O( u( `% {$ E  s- M% |
 
 2 q! ]* s& S' c3 B
 9 x/ L) |2 N* k用户可以在火山方舟上选择“智能模型路由”功能,从“平衡模式”、“效果优先模式”和“成本优先模式”三种方案进行选择,智能路由会针对任务请求自动选择最合适的模型,达到效果与成本的最优解。2 k( n- Z! e4 _
 * K9 v7 s$ P3 m4 U5 s& D7 j
 
 6 f# N8 E! W0 G( H0 m4 [- X在会后进行的群访中,谭待表示,在部分场景中,小模型效果其实是优于大模型的(如简单客服问题用Flash模型,复杂问题用大尺寸模型)。开启智能路由后,无论是效果还是成本,都会比直接使用对应模型得到显著优化,他们希望借此降低企业技术门槛,实现“效果+成本双优”。
 , P3 F% A& Y/ J" W; X9 N! f3 Q$ p* L* Q) |% u/ ^
 ! K. u+ H, _0 S6 p: L$ _. B
 另一个比较有趣的更新,则是VideoPilot工具。$ W" A" J. K0 l( \+ m9 W
 # P' C; V& A7 i1 l7 Y, @) e8 n: s- [
 # ~$ F2 z0 B7 b- i4 G  V
 $ s! F0 G  a1 `. m* ?4 D
 
 (图源:雷科技) 4 `. d, S3 L+ C- X7 i* H1 V3 C2 v
 / r: K, r5 }6 d& F. }  Y1 J* i9 p$ x# `$ J8 t2 c/ `
 借助这个工具,你可以深入理解参考视频,自动生成对应的Prompt,让你更方便地进行视频创作,甚至还能支持语言反馈,在原视频基础上实现多轮交互式优化。
 V7 e" p2 a( t. `8 R" J6 M/ y2 _& K0 {! D' d/ D9 ~& C
 
 , [- ~% B6 g8 z, [6 \: B" c当然了,这种逆推Prompt的方式,在AI玩家里早已不是什么秘密。( V3 L+ S/ P3 _9 ?' l+ p$ O
 3 m3 W5 l- {3 g- z
 
 2 w. D4 H, H+ G: z就拿我自己为例吧,可能是因为用多了的原因,我现在养成了看到场景、镜头、拍摄手法独特的***都保存一下的习惯,需要创作时只要一句简单的:2 y# Y4 j% l; z
 ' H4 n8 O' m9 K+ F1 a* z4 f- Q
 
 * R0 T% a% n" z, @5 ~“分析可用于生成这种图片的连贯prompt,忽略角色本身外观/穿着特征,注重画面构成、角色动作、环境描写和镜头角度,最多200字。”
 % U# L# A1 h) H  |' M6 e
 + \1 z( c) l( ], ~1 ^5 b! T7 F0 p" E+ U( A# C
 如此一来,豆包就能自动生成用于制作同类型图片的Prompt,而VideoPilot则是把这种能力扩充到了视频上,让用户可以快速、精准地完成对既有内容/目标内容的模仿和扩展。+ `/ X3 G" `- B& Q9 I
 ! X" q( T; J+ f7 \
 对于视频生成而言,拥有这样的功能确实是省心省力不少。
 6 t2 d! V) @9 [& B
 6 {9 Z" C% v( w/ \- q- C% w" ^# i( y0 k! J
 在今天上午的群访最后,谭待也表达了这样一个观点:生成类模型(生图、生视频)将会成为短期增长的核心趋势之一,而展望未来的话,Coding领域有望爆发。
 / z2 h' E/ ]( x/ P: d- h" q7 f; E. P" G- {3 v( X
 
 h; m6 x: I0 U* W0 A+ S归根结底,还是当前国内受模型能力限制尚未完全释放,未来潜力较大。, ?& z+ ?) ?( Q. w. o# o
 
 % S8 s- A3 K) t) i总结
 # b+ ]- U  V- j3 H
 T/ B! b' ~: j9 C7 J/ Y1 |, f6 O" }! P3 O/ j6 W. L
 从会场出来,武汉的风吹在脸上,我脑子里乱糟糟的,但又有一条线索越来越清晰。! ^" U/ W3 }. I6 P2 b2 V' ^3 n
 
 # P: N7 X; f% p1 }9 O
 ' t& k6 p( F4 _, Q5 l8 o今天的发布会,表面上看是发了新模型、新工具,但骨子里,我感觉字节跳动或者说火山引擎,其实是在简化着AI时代的“游戏规则”。
 + I! L: h) R* L7 B/ z1 G  D2 ~% S$ m, S4 g% H0 E2 n5 `4 Z( M0 f- [0 c
 6 K0 J7 _" k, s( J" x8 A
 " ]# |3 ^. S+ \) T" P
 
 (图源:雷科技) A" O) X; C  c5 O, k/ W. t  w" l8 J* H# i6 S
 
 5 F! I1 F$ _( d过去,大家比的是谁的“大脑”更聪明,参数更多,跑分更高,是一场军备竞赛。但火山引擎今天似乎在说:光有大脑没用,能动手、会干活、听指挥,还不贵,能踏踏实实地去为企业创造价值,这才是王道。
 % {' v% `: S/ ~& Y0 w+ f+ @5 |6 q1 N. D$ L$ [* h  }
 7 v. n/ t: D3 o# q$ W1 O
 正如巡展的“城市计划”所展示的,从厦门的持续运营方案,到武汉的智能路由进化,火山引擎正一步一个脚印,将其在字节跳动内部海量业务中锤炼出的AI能力,系统性地开放给千行百业。
 4 r' S: @. c1 o' y. T: y0 y  B3 t! m1 y& `+ N. }2 L
 3 e/ w4 L& m# D" _- a% A
 在AI浪潮席卷全球的今天,许多企业依然在“如何用上AI”的门前徘徊。5 Z- E4 x8 [. i: f# l
 7 i. R0 C' b- a# G6 A) g
 
 ; |  E# f* n7 V3 c2 O# m现如今,在模型全面升级、技术门槛有效降低的情况下,为了加强市场的竞争力,企业将更勇敢地迈出转型的步伐,加速推进AI能力和自家业务的融合。4 M3 I1 c2 f* Q" s5 {! |
 
 ) u" b! o3 A0 J4 Z/ {( ?# x; W7 |6 n5 X. Y' i6 p7 C
 当大模型真正成为企业生产力的一部分,一场真正的效率革命,才算刚刚开始。/ _. V8 Y2 S; w. ?0 v# y5 ]
 
 7 w6 `! I/ f3 D『本文转载自网络,版权归原作者所有,如有侵权请联系删除』
 | 
 |