找回密码
 注册
关于网站域名变更的通知
查看: 120|回复: 0
打印 上一主题 下一主题

超越GPT-4o及Qwen2.5-VL,百度超轻量模型PP-OCRv5 Blog持续登顶Hugging Face热度第一

[复制链接]

该用户从未签到

跳转到指定楼层
1#
 楼主| 发表于 2025-9-23 16:46 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x
近日,百度在海外官方账号介绍了最新轻量级文字识别模型 PP-OCRv5。该模型仅0.07B参数,以千分之一参数量实现与700亿参数大模型相媲美的OCR精度。在多项 OCR 场景测试中,PP-OCRv5 的表现超越GPT-4o、Qwen2.5-VL-72B等通用视觉大模型。最新信息显示,飞桨团队发布的技术Blog已连续一周登顶Hugging Face博客热度榜首,受到开发者社区的广泛关注。
+ T$ {) M/ C: G. u1 A6 u
3 G5 d3 y% E8 V  L! R; Q/ C8 K/ E! S4 e1 K
# e8 f! L  r5 m& s0 q) j
<a href=\"#\" rel=\"nofollow\">) x% h1 V1 I# R6 K

" B3 n% ]3 F6 V" v8 i据了解,2025年5月,飞桨团队推出PaddleOCR 3.0版本,文字识别方案PP-OCRv5与通用文档解析方案PP-StructureV3,以及原生支持文心大模型4.5的智能文档理解方案PP-ChatOCRv4共同构成其三大特色能力。自2020年开源以来,PaddleOCR累计下载量突破900万,被超过5.9k开源项目直接或间接使用,是GitHub 社区中唯一一个 Star数超过50k的中国OCR项目。
" n% \( B3 x1 ^2 f
  |4 V7 e0 R5 ]/ h/ A

$ l3 J  }% S2 p7 Z<a href=\"#\" rel=\"nofollow\">9 Y. B  G& T6 u( t' @
8 a7 R& v5 ]1 X5 {  v
9月18日晚,Paddle OCR项目登上了GitHub全球总榜 trending榜, 位于python榜第5,总榜第13。/ X, c" k+ z  ^8 }" ^$ Z
: z# j) K0 s1 n7 C( ~6 S& F" g) I  }
" t/ y! e' `4 J; A1 U' ?
4 s2 U8 f/ [$ L7 }4 s+ ]1 N) c$ ?
<a href=\"#\" rel=\"nofollow\">
* E0 E0 w% V! I5 I) s6 `
5 r& `% k8 J: T0 Y" GBlog指出,在OCR场景中,通用视觉大模型(VLM)在精确文本定位和边框精度上仍面临挑战,同时容易带来高计算开销和“幻觉”输出。相较于VLM,PP-OCRv5采用了模块化双阶段检测与识别方案,能够实现轻量高效推理与更精准的文本边界框输出。  N8 U0 B2 D+ l: s) M6 t

8 L6 k8 m. H5 J& L7 e0 _* W3 ^
5 @  w5 s$ ~6 \( ^! @6 C* vBenchmark数据显示,PP-OCRv5在 Printed Chinese、Printed English、Handwritten English 等核心任务上与百亿级大模型 Qwen2.5-VL-72B 精度持平甚至更优;在Handwritten Chinese、Chinese Pinyin等复杂场景中,仍稳居前列,表现出强泛化能力。
# q; |2 I! _+ S% R& V9 A
/ T! S3 [  {# v, k+ h. M3 e& q" s
: ]5 `3 N( b8 h+ o6 N
" c' _* D/ M0 k1 I: @) S
<a href=\"#\" rel=\"nofollow\">
2 b' _. D5 o/ C& ]$ F% o. `9 o9 l8 D) t1 i
作为百度飞桨团队推出的全场景文字识别模型,PP-OCRv5是业界首个单模型支持5 种文字类型的超轻量级(<100M)开源模型,且支持复杂手写体识别,可广泛应用于教育行业的试卷作业批改、医疗行业的病历数字化、法律行业的合同笔录数字化等多场景业务需求。
6 ?1 E% U4 w% n) h2 x
9 H$ {! [& x  ~8 L- v$ i6 L+ h『本文转载自网络,版权归原作者所有,如有侵权请联系删除』
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-9-27 02:44 , Processed in 0.125000 second(s), 24 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表