EDA365欢迎您登录!
您需要 登录 才可以下载或查看,没有帐号?注册
x
本帖最后由 EDA365_PCB 于 2024-1-22 17:45 编辑 " F" c; `2 x5 Y! p: N0 Z
p6 o4 Y D9 I# n7 Y5 j% ~
I2C七宗罪之第六罪——枯燥的协议
# l/ ^) T' z: b; `) UEDA365原创 作者:John % W! C9 y& U( G" [% k* U) N
/ _2 {- G- f/ G/ L% c7 ]" E; n% F6 F
6 \0 n. L3 b. |+ D3 Q! H, b6 t' B! v2 p% M" Q8 I8 R- O, Q" h0 G
* c; Q* K6 n% v9 C7 t1 _3 b6 u$ O0 k, y7 T" J
越到后面的几宗罪,难度越来越大,请读者要认真仔细的思考,确保学为己用。4 z5 U. `1 H- g+ O+ U1 \
- u" O" f: I" f% `) N
8 @0 q C! u! t4 p3 ], y先来讲个有趣的故事,我们在大学里喜欢去图书馆自习的时候抢位置,特别是喜欢抢靠近漂亮女生旁边的位置,可以一边上自习一边欣赏美女,^_^ m6 U8 }- t2 @1 [( t0 h' h/ w7 g. R" d" f
4 _2 l* c9 J' b9 C: V: q5 t# {0 \" I, A3 B; X* @
, I( t4 I2 Z9 P! z o
当你要临时离开一会儿的时候,方法也比较简单,就是放一本书在椅子上,很多时候当你回来的时候却发现你的书被人拿开了,椅子上坐着的另外一个帅哥和旁边的那位美女在攀谈,恨的牙痒痒啊。0 ]# Z- b l% P5 M8 T* f9 @; b" P
8 X; { D- r1 X& F- ]& w
, e! i4 P. f( [# H你能做的就是等那位帅哥和美女聊完走人,你再回到那个座位上,可是你却沮丧的发现,刚刚旁边那位美女也走了,换了另外一位男的,唉,人生最悲惨的事情不过如此。* w. I" l6 ?- c, V. K% y5 D H% v
+ O% R9 l% l% z3 X& X [! }1 r5 z( Y, A8 O下面给出一张图,大家来看看是否存在问题。这张图是用I2C协议分析仪抓出来的,乍一看也没啥问题,该有的都有,特别是最后在Stop之前的NAK也是有的,但真的是OK的吗?9 r* s, r$ x+ Q0 F6 W+ i+ v& f# Q
我们再来看一张图。" O- v/ E4 m7 {$ b2 H$ B0 \
" }; e' A+ D' T2 `& y. h+ G
对比这两张图,我们得出:这是一个读数据的操作。8 u$ t4 w$ e' {2 Q
2 o0 Q' w* _, L5 C$ h, @( [/ _/ J+ K' ~' J, R# U8 r
要找到第一张图的问题其实不难,我们只要仔细核对就可以了。
6 ?! Z% s: N2 f/ {6 G5 ^6 X4 G: i) [% [& g3 F6 j- Q6 ?* M$ N# P: L9 K7 u' m) I# r/ F9 i+ ?
下面是核对出来的结果,我们发现在第二个Start之前,多了一个Stop。 这样一看,这个错误还是挺明显的。4 z! N/ u3 Z5 S+ u4 U$ _( J
/ t# v8 R7 G- u5 D- L* [; c; {- s9 s1 m: G H3 Z- e3 X: ~* A) _7 D* Z. t: Y6 v
说说总是很容易,软件工程师在代码里构建这个时序的时候,很自然会认为,前面第一笔的写操作(把Word address写入Slave的指针)已经结束,后面的一笔,读操作开始之前就应该Stop掉。
为了清洗的说明,我们列一个顺序如下:4 K& j' t: P$ v n B" y. D; M# P+ r
/ x3 x! O, S6 Q
& _. w4 N' V3 g* U1.Master把要读的数据(或者寄存器)的Address先写入Slave,这里要注意理解好,这里Word Address相当于是一笔数据;
! p, h; S' u; V2 l# J2.此时要注意整个读操作刚刚进行了一半,千万不能加Stop;
0 X2 l) f5 i Z. I' M' }3.Master在收到前面写操作的ACK后,发一个Start;; |0 i- l- \0 W4 \" X( q- s% }# X4 U, C9 `, J
4.Master再发一次Device Address,然后开始接收读的数据;/ M7 M) T; t& \, w7 j' p
# F; n2 @2 H# h' R# h5.Master收到数据发一个NAK, 然后再发一个Stop结束整笔操作。# M* j) Y& t. b# j) b
. c0 t y' z7 E7 E a" k
有人问,既然我们在第二个Start前多加了一个Stop,也没有见系统报错,一切正常啊,有时候访问还是成功的,这到底是为什么啊?- y5 G8 L8 t5 q1 ?5 m5 Q
$ U9 L; s+ ]% F, Z2 ^" |0 V
2 }5 k' _& {* W; q* p: e* T这里有个原因很重要:因为读操作最后是有Master发出的NAK + Stop来结束掉的,而NAK是SDA-HIGH,所以即便有时候操作不正常,只要不操作SDA(SDA默认的电平时HIGH),也能得到NAK误导对方。
% G$ C/ ?6 s- Y: l X
4 y0 w/ E$ I0 o) ^8 |- N我们继续来说一下,如果第二Start前面多了一个Stop会产生什么样的现象?* Y6 o5 y9 ^6 D( ]- v
" t. H3 g, Z: i& b9 G4 I5 s# J$ A3 b' s) L o: |; l: k
这是发生在ONU光猫上的Issue,现象是:从光模块SFP读回来的数据值总是不对,反复试验发现偶尔也能读对,但是写操作都是准确的。& P" X/ |" | e9 X; }7 g# g" j8 o" E1 r
& a# M4 m' H0 _1 Z U这里一定会有人问,你读操作不正常,怎么知道写的是对的啊? 好问题, 我们通过设置环回和打开/关闭光模块等写寄存器操作,反复确认我们写寄存器的操作是准确的。
* R, z7 I' |% B( ^$ ^- T3 Z; }" G0 ?9 D9 B3 i8 y; Y4 X$ w# Q8 Q( X9 l% J
我们来看光模块的I2C读写标准SFF-8431里面的图,可以看到一次读操作和前面叙述的一样,分为两个部分,中间用一个START隔开。% H; e0 o! S$ D4 I8 e/ k6 K
1.Master写device address =0XA2和写命令6 Q- R) h9 f( U+ i- Z# n3 _# A q
2.Master发出word address 0X6E
1 l5 o9 t3 \1 t3.Master插入第二个Start. b$ E9 H' K! C' J3 q5 F: [8 L& K
' Y, x+ {8 f$ _% Y( r% c4.Master再次发出device address =0XA2和读命令6 K7 f# k0 D$ U! I# {' n
1 L, ?/ e* _) E% ^5.Master接收光模块的数据0X82
! I, u8 q' U6 f! q/ o) d0 Z6.Master发NAK8 u8 E1 j7 Z' f2 B- x( u/ L8 m% t2 a3 H0 f& @2 d& L! j
7.Master发Stop结束本次操作
1 h( A5 Y6 U& b* ~6 W注意:图中黑色部分是我们在Vendor的平台上用准确的方式读写抓到的波形。. e- C; U# T" P
9 S( L& E8 y* d" m7 z9 `
: Q+ I. P6 ^8 }+ N0 h8 A2 Q& {如果按照上面所说的,我们在中间加了一个Stop会产生什么样的现象呢?
% O, m1 a: j5 j+ a- D: c, `5 n
3 G) Y* c7 C. X' ]+ z为啥读数据会不正确,但是I2C总线并没有出错信息吖? 前面我们已经林林总总的叙述了一些,下面给出最终的描述。+ Y- n) P4 S* A; C: t: N
5 N N6 g G6 k( ^; o& q6 S
看下面这张图,是我们和Samtec的FAE在出问题的板子上一起抓到的波形图,很明显我们看到多了一个Stop,下面我们来进行分析:8 D0 \/ J4 H/ S"
1.Master写device address =0XA2和写命令
" d( M0 V- s$ H D y2.Master发出word address 0X6E$ B/ h9 Z" Q4 w- Q/ U! D. X
+ ~+ i" ~- W R3.Master多插入了一个Stop+ ^9 p6 ^% \! [& i: y8 B& S0 v) w W5 d2 |6 K
4.Master插入第二个Start9 V6 T5 a% d" p
注意:下面被插入了一笔完整的写数据的操作。. H; o8 l% M# K# \2 n7 g
! a( u& {6 _0 o
9 b8 M. l* K: a: [! `5 a# C5.Master又发出device address =0XA2和写命令
1 D: a5 ^1 ^4 u V d, d( j7 l6.Master发出word address 0X7F- }" i i e4 b+ P0 @4 e/ j3 T( I8 d9 s, f
7.Master发出写的数据0X80
7 S+ s# {( f* o, M' K注意:开始接着上面未完成的读操作继续
$ _! z3 C+ k- f! c3 [3 ?4 ?: ] U, q9 C: x$ f
( i+ S1 }$ G+ }- M3 } U' o- f8.Master又多插入了一个Stop
- W! z$ _4 x3 e9.Master又插入第二个Start* E' \$ G( @* |2 n' [: f
- l( s+ ^2 Z& m" w3 N( Q10.Master再次发出device address =0XA2和读命令9 L; O% k! B- |+ g: u/ i, x3 l) S) }, E
11.Master接收光模块的数据,我们看到读到的数据是全0,为什么呢?& L6 S5 l1 m/ O4 n) F- P5 y. K' [; Z. q4 v8 R! a
12.Master发NAK7 F, c" ?2 K7 v& G' U. s
; @- n. Z8 p1 \' p" P7 N5 Y13.Master发Stop结束本次操作& s+ T# W: k* ]. d% d$ e
: `9 ^) P( O c* v+ j7 \" P' c! i- x: V0 M* Z1 c
相信很多人已经晕了,这到底是咋回事啊?- B' Y: O6 }4 G; M; l, s1 v# Y0 ~, q" C* ]
: i/ j( D- ]0 L* S# a2 D8 b, ]$ u9 b2 z# G0 n
原来:一笔读操作,由于中间多了一个Stop,所以系统软件进程误以为前面读操作完成了,所以横空插进来一个写的操作,并且这里的写操作准确的完成了。- E9 w; X# u4 `: D4 V" S% W9 g
8 _% |3 ]) d5 l! E& a! u; I. E. M; k- M/ j9 F
在写操作完成了,我们看到Master试图继续完成刚刚被中断掉的读操作,其实这也可以啊,大不了分两次,只要最终数据能准确读出来也行,可我们此时得到的数据却不是刚刚的0X82了,而是0X00,这又是为什么呢?
我们来结合这张图描述一下发生错误的过程:
; o5 u- e: R/ G* N0 `* j [* K+ Y: c& i
1.Master开始读操作的第一步把0X6E写入Device;
. D- [9 J: c4 l6 C$ `2.此时被插入另外一个写操作;- j9 u2 ~# a, R/ x+ ~7 V$ o x1 O- f* p
3.写操作顺利完成并且把Pointer写成了0X7F(注意已经不是原来的0X6E);# S& x' U* t- {: T1 }8 l5 x( ~ `# N F( R) z t
4.Master继续刚才被中断的写操作;. T& H) r$ K6 V. B- }' g- u- p* x$ e' a; l2 k6 r* P8 ?7 f3 _
5.注意此时Pointer的值是0X7F,所以读到的值是0X7F这个地址的值。
% ^4 j7 O0 X/ Z& G8 P; ? c1 ]9 Z/ V. f1 g, f- P
" ] ~3 _$ {$ n% ~+ K2 }2 {这里就清楚了:一次完整的I2C读操作访问,如果中间加了不应该有的Stop,就会被其它进程强占,从而插入另外的写操作,导致访问memory或者寄存器的地址指针被覆盖,Master然后接着完成刚刚被中断的操作,也不能正确读写到要访问的值。, P; `0 _2 B* h& }7 O/ S
g4 E, H* n. A( n$ d2 ?, K# Q; I: c. }- K2 i
这里分享几件有趣的事:
8 Y! ]( L4 ]" F* ?% [& p9 V2 z1.由于只是读有问题,写操作是好的,所以产品的功能是OK的,在市场卖了那么多,都没有人发现这个问题,也蛮搞笑的;' r' Y+ P2 I9 w8 v, q
2.I2C的读操作一直NAK操作是SDA=HIGH, 由于SDA默认就是High(前面讲过Open drain和上拉),所以即便设备没有做什么? 也会让等待NAK的设备误认为NAK已经产生了;
2 Z8 ?0 I7 m" F* j- Q3.系统软件有时候是会和硬件打架的,所以相互合作才能找到问题的根源,否则相互推责任只会让解决问题很困难;
; U4 N9 S. q0 L! |5 l4.发现问题并且解决问题,写个文章很简单,但是调试的过程却是痛苦的,特别是I2C这种接口,一共2根线,很多人比较轻视,这是不可取的。 2 h# P) x4 L9 w
注:本文为EDA365电子论坛原创文章,未经允许,不得转载。' \. H) I+ L3 h) C0 z! C. s
|