找回密码
 注册
关于网站域名变更的通知
查看: 97|回复: 0
打印 上一主题 下一主题

两阶段攻坚、91.5%准确率,荣耀MagicGUI重新定义AI领导力

[复制链接]
  • TA的每日心情
    奋斗
    2019-11-19 15:09
  • 签到天数: 1 天

    [LV.1]初来乍到

    跳转到指定楼层
    1#
     楼主| 发表于 2025-7-28 13:51 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

    EDA365欢迎您登录!

    您需要 登录 才可以下载或查看,没有帐号?注册

    x
    AI风暴席卷全球的第三个年头,开源大模型始终是行业重点攻坚目标。截止目前,GUI开源大模型已经走过概念验证阶段,逐步向场景调优、端侧部署等生态维度延伸,不仅要拼参数、拼执行力,也要拼场景落地能力,各家大厂的技术竞赛已然进入决胜阶段。
    3 s0 S: H$ I. N$ A4 O3 q. b) l3 Q6 U' a3 D  }

    . n+ ^2 `" ?9 ]6 o# Y: b在此阶段,开源与合作是一个绕不开的焦点,7月26日在上海揭幕的世界人工智能大会(WAIC)上,这也是行业贯穿始终的核心议题。1 [# Z/ P- P, v" ]- b' o5 `
    4 m; q1 W( Y" D+ j; \; s, f; b4 P
    ( O, A- A( `' m! |: H) I
    在此次WAIC人工智能标准化国际合作论坛上,荣耀作为首批单位,携手阿里、百度等百余家行业领军企业共同发布《智能体协议共建共享联合倡议》,进一步推动行业标准化发展和国际合作。同时,荣耀还带来了全新惊喜:MagicGUI大模型正式发布并开源。) [9 k$ }) I' ^* `& E; ^

    $ W- E1 v" q- O事实上,国内的大模型开源早已从星星之火演变成燎原之势,前有DeepSeek-V3、DeepSeek-R1以千亿参数构筑智能基座,后有阿里、字节、荣耀等科技巨头纷纷加码。对比之下,硅谷众大厂似乎正“逆流”而行,Meta的Llama、谷歌的Gemma等虽然也开放了部分使用和修改权限,但并未公开训练数据集、仍在限制开发选项,很难称得上真正的开源。" [9 T1 w3 O2 k$ b
    0 ?4 H2 J* d, |- |7 ?+ [

    % r. ^! L0 C2 A, L. d9 K3 N大模型的竞争来到这个阶段,开源的重要意义正在凸显:不仅事关技术平权和产业创新,更是构建AI商业生态,加速技术扩散以换取长期价值的关键。要抹平中外发展时间差、在产业落地阶段抢得先机,就要合全行业开发者之力,通过数以亿计的微调催生“链式反应”,打破外国巨头的“算力霸权”——开源是必然选择。# I; P& Y7 |" s* Y/ ^" U: X
    / l- c5 G- G  Y4 |; A8 m
    . ]) d! x% d5 p. t" x
    在此背景下,荣耀MagicGUI面向全球软硬件开发者正式开源。这不仅是荣耀的首个开源GUI大模型,也是其“阿尔法战略”的重要里程碑:高达70亿的参数规模,基于荣耀Magic V5常用场景用机操控准确率达到91.5%,较业内同类顶级开源模型高出16.4%,性能足以比肩SOTA。(SOTA是"State of the Art"的缩写,中文可译为“最先进的”,常用于描述某一领域当前技术或模型的最高水平。例如,在人工智能领域,SOTA模型指在特定任务中性能最优的模型,如数学证明、自然语言处理等方向。)/ k( a( @+ D9 M6 L" B( {# C- i

    - x' Z  w: L1 w4 W' ?4 T+ a" b% L5 V- |% j) E, I& m
    详细拆解之下,MagicGUI在GUI数据采集框架、知识数据构建方法、动作空间定义等维度都有一系列开创性成果,比如构建了全新的数据采集与构建框架,优化了数据配比与筛选方案,在此基础上构建了多样且高质量的数据集。但其最具突破性的能力,在于对两大训练阶段——继续预训练和强化微调的迭代创新。( H9 t- u* G; x) `! T& {4 U- s

    , @! C# a' Z* |
    <a href=\"#\" rel=\"nofollow\">
    4 [7 x+ `: o& d+ n& o5 A
    ( N% A  d0 N8 f- b2 N
    首先,在继续预训练阶段,MagicGUI重点改进数据处理、合成数据等环节,目的是夯实基础能力,全方位提升大模型在推理、规划、动作执行上的综合表现。
    9 M' B1 ~, P8 y4 @# k: q
    - a( f" V$ F( s1 l* y$ \比如在数据处理环节中,MagicGUI通过过滤相似、重复数据,搭配启发式规则和开源模型评估,多重筛选、拦截掉低质数据。合成数据环节同样以提高数据质量为目的,一边结合UI元素类别、空间位置、形状等维度合成更全面的UI描述数据集,一边优化开源模型,批量合成多难度层次指令数据。
    : \5 ^4 }2 M: b8 ^9 d; N" O3 ]1 D/ I* y. e
    7 j* g# X! y# Y+ m& R: G
    其次,强化微调训练阶段,MagicGUI采用了极具创新性的采样策略——GRPO双重过滤方案。
    6 }: b3 H5 {/ j
    8 G/ t6 u2 w6 ?* ?7 m$ ^" `* Y所谓双重过滤,即静态过滤与动态过滤的结合:一方面,通过静态过滤剔除生成响应中始终给出完全正确/错误预测的样本,专注于更有挑战性和信息量的样本;另一方面则借助动态过滤模式,不对全部正确/错误的结果进行训练,保证强化微调效果。
    9 V6 m9 r5 L* n6 s
    : G; ]' |& p. [0 g
    5 l) r9 ~$ b  X! z3 a1 f4 {8 ^技术上的突破有没有价值,不能光靠参数说话,落地到应用侧的效果也是重要检验标准。可喜的是,我们已经能看到荣耀MagicGUI借助关键能力突破,落地应用荣耀Magic V5等一系列成果,以及对用户实际生活的帮助。: z" ]& _0 ]0 f6 k

    / j1 a6 A$ c/ v! B2 c% E  R1 X比如通过一语多平台打车功能,用户只需一句话就能在高德、滴滴等主流APP自动完成叫车,此外还可以轻松完成打开APP、修改地址、选择车型等细致的指令。而在这背后,想必少不了MagicGUI单步操作等关键能力的进步。
    2 U: }# k' U: |& O! o8 B" [2 e0 S# `6 Y6 @; E

    % h+ a0 C; `$ b( e, k; m* z$ L/ o
    <a href=\"#\" rel=\"nofollow\">

    * K) B: S. Y( P4 H) o( O  R0 d2 D& F; r1 K4 W: R$ K

    . Y: ?3 w* v5 n1 C1 q不积跬步无以至千里,GUI大模型的研发与创新从来不是一蹴而就的,更像是一场比拼耐力的马拉松。在MagicGUI的发布,承载着荣耀长期、大力度、毫不保留的资源与人才投入。5 W; @. E; I, p: B
    - u' V0 i2 S3 Q1 Q+ N0 G4 |
    5 ?/ s+ s& V9 a% v2 z
    当然,展望未来,相信中国科技企业也不会停下继续探索的步伐。目前GUI开源大模型仍有不少困扰整个行业的难题有待解决,如OOD泛化、安全与隐私保护等。% h) i; M6 {4 A! Z! e8 F

    ! `5 q/ ~+ ^# p3 {5 D. K
    ( G: \2 F$ Z' s' y+ i5 G这些难题既是各大科技巨头的挑战,也是机会。谁能抢先一步取得下一阶段的突破性进展,谁就更有机会抢到技术话语权——而到最终,技术层面上的创新还是会落地产业、应用,给开发者、用户带去实打实的便利与体验优化。7 B7 s8 w3 Q* C; g  F3 D9 l
    3 h" y" s$ T! ?
    『本文转载自网络,版权归原作者所有,如有侵权请联系删除』
    您需要登录后才可以回帖 登录 | 注册

    本版积分规则

    关闭

    推荐内容上一条 /1 下一条

    EDA365公众号

    关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

    GMT+8, 2025-11-1 01:12 , Processed in 0.140625 second(s), 24 queries , Gzip On.

    深圳市墨知创新科技有限公司

    地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

    快速回复 返回顶部 返回列表