找回密码
 注册
关于网站域名变更的通知
查看: 103|回复: 0
打印 上一主题 下一主题

豆包新模型四箭齐发!火山引擎意在加速企业级Agent落地?

[复制链接]

该用户从未签到

跳转到指定楼层
1#
 楼主| 发表于 2025-10-17 10:26 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
说实话,五年前字节跳动官宣成立火山引擎时,我确实是属于看不懂的那一个。. o8 k- L- A; e& ^
% e+ u1 v/ K0 W3 B: b+ I

; j- A. Y6 B& t在我印象里,当时云计算的牌桌上早已坐满了阿里、腾讯、华为这些巨头,战局胶着,利润微薄。字节跳动凭借抖音和头条手握着巨大的流量和现金流,为什么要一头扎进这片吃力不讨好的红海里?
2 @5 b6 y- E+ n" u$ |' h! Z4 W
% J) U2 B# p: t. F6 ]0 i  q0 Y3 F; m$ o# d
这个问题,不仅是我,当时身边的许多同行都感到困惑。
: _: |* P' c: J' @- Q! W3 Z3 q' F
: U0 K8 @3 c( ]. Z! k* P' e# k
% R/ ^2 _* @; Y; {* Z然而,最近几年,这个问题的答案开始变得异常清晰。* v3 p4 u, p6 r$ c

7 Q1 o0 F. p. ~" F, m7 c" r- k  Z9 `; u7 I4 j. G
尤其是在ChatGPT点燃了大模型的战火之后,云计算市场被重新激活,阿里云、火山引擎、百度智能云纷纷加大投入,让整个中国AI云市场的话语权争夺变得日益激烈,这一点从国际数据公司IDC的多份调研报告中可以看出端倪。* E, K3 C2 v+ D% j

% \- a' n6 i+ f/ {. _4 c% y  j. k$ J! d2 U% U
根据IDC 9月19日公布的报告,目前火山引擎在大模型公有云服务市场(即MaaS市场)位居国内第一,2025上半年市场份额49.2%,俨然接近半壁江山。/ r8 y# }6 k- b
' |  f) ]1 V- d4 i7 O$ O( a

* h7 C/ X; B3 b& v/ B* V
& g' i5 \5 Q: }
(图源:火山引擎)

1 e& d/ L. o9 t" l8 a
" s" v7 ]! T0 H8 s, j' G0 `8 N' |' U5 Y9 s) _# r3 Q7 b
然而在日新月异的AI行业,这样的优势显然不足以掉以轻心。10月16日,2025 火山引擎 FORCE LINK AI创新巡展 武汉站正式拉开帷幕。在这场与NVIDIA联合举办的盛会上,火山引擎用一系列发布,诠释了“模型升级创新驱动”的真谛。
) M* X1 i, I# f/ k, j/ u  f
  p- I0 v0 W: A7 i0 l0 e) V
7 [2 u7 p' \. H3 t雷科技受邀参加此次巡展,想知道火山引擎要折腾些什么新东西吗?跟着我来就行了。
4 `. ~  r. d/ q2 B, |( e7 e
# ^3 z6 j& w0 p8 e5 I; R* `四大模型上新,成本进一步下降5 m  G/ v: d, E1 I  L$ M5 e5 J8 C

' M' L* V3 b5 ]
& z) h1 X7 q8 Z8 A: n
( q# X2 M- [% e" G; K  q: A在火山引擎总裁谭待看来,目前全球AI大模型正在三个方向上快速发展
" T1 a0 j1 [0 S1 z1 t0 Z; K% [
; m% J9 _/ ^4 b0 i6 p% p7 o; T8 F
9 L! z" |. C. N, r1 j" ]  k0 y一是深度思考模型正与多模态理解能力融合,二是视频、图像、语音模型逐步实现生产级水平,三是企业级复杂Agent正在走向成熟,为企业激发新的生产力潜能。# G2 W# e8 a0 l! j# u' v

; w# n! i7 \0 X  n, c. _; `  M" t% J
  p$ R* Q$ j) ]5 l
(图源:雷科技)

% [! m! ?+ \7 T2 u6 y! \$ c. O# ~' u' R, |- y
0 ?: y9 B# \( d# ^
然而,在服务的过程中,火山引擎发现,开启深度思考模式下,模型效果确实提升了,但也会提高模型延迟和使用成本,这导致实际应用中深度思考的使用占比仅有18%。
9 C5 H  m, C2 Y
" s, C5 w1 m2 a$ Z/ l
6 q5 N. G, b8 p/ L2 l针对这一痛点,豆包大模型1.6正式提供 Minimal、Low、Medium、High四种思考长度,平衡企业在不同场景下对模型效果、时延、成本的不同需求,并进一步提升了思考效率,这也让豆包1.6成为国内首个原生支持“分档调节思考长度”的模型。
7 P- K  `2 `. S! q# n6 J( n( W$ C2 ~1 ]9 n/ q( L7 t- q, C

1 p0 g2 a7 ^. T3 ~
0 Q- l: _( a% k" T2 _6 f; h
(图源:雷科技)

) X% _3 V% g. T, j& w+ I6 }( v6 m+ D
5 Y3 t) e% \$ O$ D) O
不仅如此,为进一步满足企业的多样化需求,火山引擎正式推出豆包大模型1.6 lite,号称性能超越豆包大模型1.5 pro,同时价格上,在使用量最大的0-32k输入区间里,综合使用成本较豆包1.5 pro降低53.3%,推理速度更快、更具性价比。6 a3 w& E( r: Z

$ W6 D8 C2 L6 r* e* A- T6 H" x4 P3 }
9 D2 m+ R: o5 E& e/ h
(图源:雷科技)
6 }, a. N4 I& F3 ]
4 m8 q3 D* t, n$ g5 g* D* x. D; W5 K

. H# n* B/ o7 z2 c只能说,价格控制这块,火山引擎确实是行家中的行家。" d) _; N; v$ d) `
8 V- J% u; v/ v! r

9 n2 @- w% |  O' d' a- W# H对了,在今天大会上,火山引擎正式发布豆包语音合成模型2.0、豆包声音复刻模型2.0,它们都具备更强的情感表现力、更精准的指令遵循能力。
% x9 m# a5 x' [/ k- b8 g
% P, s* v0 N/ m3 J
* D3 H; ?, r9 Y# H! b. D最重要的是,还能准确朗读复杂公式。& F4 [! [1 U' \8 n# M
  C( {+ ?; h9 w) f4 f$ i/ H7 F
2 ]/ H8 L/ v4 p5 y  T) T

7 m& c) u& D& s
(图源:雷科技)
% k. W! v" \- g* r) `- ]$ Q
! ^9 T# G# T% |+ l

  ~, j% a2 Y- T# t事实上,在教育场景中,复杂公式和符号的朗读一直是业界难题,目前市面上的语音大模型朗读准确率普遍低于50%,而豆包新发布的两大语音模型进行了针对性优化,目前在小学至高中阶段全学科的复杂公式朗读中,准确率可达90%。
3 e5 `" l- t5 l# Y8 ~4 F9 J! l; R, J# E' S. d# i

1 m5 R: F$ {+ O) l6 j听着蜡笔小新抑扬顿挫地读出这样一段复杂且冗长的化学公式时,我承认,我真的偷笑了。
' Z4 e! i. |, g; @
# ]7 |. o0 ~4 t* R4 ~, ]8 Y& @9 V& A6 z) u/ V# S/ U5 ]' ?7 R
全新的语音模型还能搭配图像模型来使用,快速创造出各种有声绘本,对即梦未来的发展也会有所加持。; m$ m% U1 ?& }' Y  X

9 ^; t  `9 K  r; k% R! W4 }# K# _+ s
正所谓,要“有好模型”,才能“做好应用”。% S( n9 g$ b$ A" R: Q- O

( p9 T4 _% I' Q: C8 s5 b  |8 s- W( y! F  ?" w% j. z- w4 q
在小雷看来,好应用的底层必须由好模型来支持。而一个好模型,既要能精准捕捉用户需求,又得具备稳定的响应能力,更要做到出色的成本控制。
+ p4 t: p) e) j+ c; y0 Z3 o; Z' [: x& l% w! D# ?! k0 ]
# y. j1 F3 m" m/ w6 S4 ^
这样,才能让用户感受到“用得顺、靠得住、敢去用”。
' S8 x/ t. d5 R/ S1 T+ o2 N  f( _; ^3 ~
智能路由加持,应用开发更省心
5 D  Z; [. C. Y7 E; J5 D
. x$ o) M* G% w4 C# w4 N1 C
! r+ K  K' e( [! Z/ U5 p8 W( H现在有了“好模型”,那么问题自然落到了如何“做好应用”上。% k4 Y5 e8 H$ l: c. P  T
& B& D0 L. ]+ x+ I! h
. s2 j+ C. M, A6 t
在很多企业看来,如今市面上的模型越来越多,哪怕只看豆包大模型家族,也有不下十来款产品。面对具体需求时,如何选择模型最有性价比?
  t) m3 F3 N, D% S% v; E, y: b
/ o# |! C8 m; B3 E5 k' h* M  G. i; K% t" [% w
为了解决这个问题,火山引擎在今天正式发布智能模型路由(Smart Model Router),这也是国内AI云行业首个针对模型智能选择的解决方案。
( \9 F0 J  K6 ~$ s5 j6 f1 `
2 D9 ?' f1 B* Q5 Z& d" U
& H: i9 h: u* @" r2 Z

' Z+ n, N3 [% m2 |- d5 b1 x
(图源:雷科技)

( ~% B$ W) E7 I) @0 m* J
4 i2 L1 z# u" `9 F: t$ }3 O1 X! ~. s0 k) F2 r
这玩意的功能很好理解,就是能够根据用户的实际需求自动选择不同的模型运行任务。& O( u( `% {$ E  s- M% |

2 q! ]* s& S' c3 B
9 x/ L) |2 N* k用户可以在火山方舟上选择“智能模型路由”功能,从“平衡模式”、“效果优先模式”和“成本优先模式”三种方案进行选择,智能路由会针对任务请求自动选择最合适的模型,达到效果与成本的最优解。2 k( n- Z! e4 _
* K9 v7 s$ P3 m4 U5 s& D7 j

6 f# N8 E! W0 G( H0 m4 [- X在会后进行的群访中,谭待表示,在部分场景中,小模型效果其实是优于大模型的(如简单客服问题用Flash模型,复杂问题用大尺寸模型)。开启智能路由后,无论是效果还是成本,都会比直接使用对应模型得到显著优化,他们希望借此降低企业技术门槛,实现“效果+成本双优”。
, P3 F% A& Y/ J" W; X9 N! f3 Q$ p* L* Q) |% u/ ^
! K. u+ H, _0 S6 p: L$ _. B
另一个比较有趣的更新,则是VideoPilot工具。$ W" A" J. K0 l( \+ m9 W
# P' C; V& A7 i1 l7 Y, @) e8 n: s- [
# ~$ F2 z0 B7 b- i4 G  V
$ s! F0 G  a1 `. m* ?4 D
(图源:雷科技)

4 `. d, S3 L+ C- X7 i* H1 V3 C2 v
/ r: K, r5 }6 d& F. }  Y1 J* i9 p$ x# `$ J8 t2 c/ `
借助这个工具,你可以深入理解参考视频,自动生成对应的Prompt,让你更方便地进行视频创作,甚至还能支持语言反馈,在原视频基础上实现多轮交互式优化。
  V7 e" p2 a( t. `8 R" J6 M/ y2 _& K0 {! D' d/ D9 ~& C

, [- ~% B6 g8 z, [6 \: B" c当然了,这种逆推Prompt的方式,在AI玩家里早已不是什么秘密。( V3 L+ S/ P3 _9 ?' l+ p$ O
3 m3 W5 l- {3 g- z

2 w. D4 H, H+ G: z就拿我自己为例吧,可能是因为用多了的原因,我现在养成了看到场景、镜头、拍摄手法独特的***都保存一下的习惯,需要创作时只要一句简单的:2 y# Y4 j% l; z
' H4 n8 O' m9 K+ F1 a* z4 f- Q

* R0 T% a% n" z, @5 ~“分析可用于生成这种图片的连贯prompt,忽略角色本身外观/穿着特征,注重画面构成、角色动作、环境描写和镜头角度,最多200字。”
% U# L# A1 h) H  |' M6 e
+ \1 z( c) l( ], ~1 ^5 b! T7 F0 p" E+ U( A# C
如此一来,豆包就能自动生成用于制作同类型图片的Prompt,而VideoPilot则是把这种能力扩充到了视频上,让用户可以快速、精准地完成对既有内容/目标内容的模仿和扩展。+ `/ X3 G" `- B& Q9 I
! X" q( T; J+ f7 \
对于视频生成而言,拥有这样的功能确实是省心省力不少。
6 t2 d! V) @9 [& B
6 {9 Z" C% v( w/ \- q- C% w" ^# i( y0 k! J
在今天上午的群访最后,谭待也表达了这样一个观点:生成类模型(生图、生视频)将会成为短期增长的核心趋势之一,而展望未来的话,Coding领域有望爆发。
/ z2 h' E/ ]( x/ P: d- h" q7 f; E. P" G- {3 v( X

  h; m6 x: I0 U* W0 A+ S归根结底,还是当前国内受模型能力限制尚未完全释放,未来潜力较大。, ?& z+ ?) ?( Q. w. o# o

% S8 s- A3 K) t) i总结
# b+ ]- U  V- j3 H
  T/ B! b' ~: j9 C7 J/ Y1 |, f6 O" }! P3 O/ j6 W. L
从会场出来,武汉的风吹在脸上,我脑子里乱糟糟的,但又有一条线索越来越清晰。! ^" U/ W3 }. I6 P2 b2 V' ^3 n

# P: N7 X; f% p1 }9 O
' t& k6 p( F4 _, Q5 l8 o今天的发布会,表面上看是发了新模型、新工具,但骨子里,我感觉字节跳动或者说火山引擎,其实是在简化着AI时代的“游戏规则”。
+ I! L: h) R* L7 B/ z1 G  D2 ~% S$ m, S4 g% H0 E2 n5 `4 Z( M0 f- [0 c
6 K0 J7 _" k, s( J" x8 A
" ]# |3 ^. S+ \) T" P
(图源:雷科技)

  A" O) X; C  c5 O, k/ W. t  w" l8 J* H# i6 S

5 F! I1 F$ _( d过去,大家比的是谁的“大脑”更聪明,参数更多,跑分更高,是一场军备竞赛。但火山引擎今天似乎在说:光有大脑没用,能动手、会干活、听指挥,还不贵,能踏踏实实地去为企业创造价值,这才是王道。
% {' v% `: S/ ~& Y0 w+ f+ @5 |6 q1 N. D$ L$ [* h  }
7 v. n/ t: D3 o# q$ W1 O
正如巡展的“城市计划”所展示的,从厦门的持续运营方案,到武汉的智能路由进化,火山引擎正一步一个脚印,将其在字节跳动内部海量业务中锤炼出的AI能力,系统性地开放给千行百业。
4 r' S: @. c1 o' y. T: y0 y  B3 t! m1 y& `+ N. }2 L
3 e/ w4 L& m# D" _- a% A
在AI浪潮席卷全球的今天,许多企业依然在“如何用上AI”的门前徘徊。5 Z- E4 x8 [. i: f# l
7 i. R0 C' b- a# G6 A) g

; |  E# f* n7 V3 c2 O# m现如今,在模型全面升级、技术门槛有效降低的情况下,为了加强市场的竞争力,企业将更勇敢地迈出转型的步伐,加速推进AI能力和自家业务的融合。4 M3 I1 c2 f* Q" s5 {! |

) u" b! o3 A0 J4 Z/ {( ?# x; W7 |6 n5 X. Y' i6 p7 C
当大模型真正成为企业生产力的一部分,一场真正的效率革命,才算刚刚开始。/ _. V8 Y2 S; w. ?0 v# y5 ]

7 w6 `! I/ f3 D『本文转载自网络,版权归原作者所有,如有侵权请联系删除』
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-10-31 09:55 , Processed in 0.156250 second(s), 25 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表