找回密码
 注册
关于网站域名变更的通知
查看: 454|回复: 1
打印 上一主题 下一主题

Linux内核设计与实现之可移植性

[复制链接]

该用户从未签到

跳转到指定楼层
1#
发表于 2021-3-17 18:34 | 只看该作者 回帖奖励 |倒序浏览 |阅读模式

EDA365欢迎您登录!

您需要 登录 才可以下载或查看,没有帐号?注册

x

: T; U! U, Q3 C! C6 {& o! V+ z$ Clinux内核的移植性非常好, 目前的内核也支持非常多的体系结构(有20多个).
3 e' U+ _0 E+ E+ k4 U2 i4 i0 t
2 _6 m) x" R5 G* v/ n2 |但是刚开始时, linux也只支持 intel i386 架构, 从 v1.2版开始支持 Digital Alpha, Intel x86, MIPS和SPARC(虽然支持的还不是很完善).
0 r0 ]' m( t8 `; H. W& P/ h2 ^$ ~4 B) R1 K
从 v2.0版本开始加入了对 Motorala 68K和PowerPC的官方支持, v2.2版本开始新增了 ARMS, IBM S390和UltraSPARC的支持.
2 C) a& U. p: g: g2 ]/ W7 _
7 I2 p7 c# }- J/ t& zv2.4版本支持的体系结构数达到了15个, v2.6版本支持的体系结构数目提高到了21个.
8 \! J/ m" b0 f+ }* Z  [- ?9 G3 N" l/ \6 q( m0 m# b
目前的我使用的系统是 Fedora20, 支持的体系结构有31个之多.(源码树中 arch目录下有支持的体系结构, 每种体系结构一个文件夹)
* Y9 j0 W9 T6 f7 N, V  x- i9 {
6 ^4 m3 _  E$ f! ^% w
4 M9 x$ O# M5 Q7 s: ]9 ?, e- Q. G* X0 R/ D( o0 n/ k3 k
考虑到内核支持如此之多的架构, 在内核开发的时候就需要考虑编码的可移植性.
) V' Y, z# z- H8 H+ q7 l
1 H  d& c) H& j, S* \提高可移植性最重要的就是要搞明白不同体系结构之间究竟是什么对移植代码的影响比较大.' Q1 P. g% t$ S. V5 y. x0 Z
( u) E: B6 ]: m4 X! Y4 Q8 P7 l# |/ R
主要内容:
% e- O; C% w* J7 a  d1 `* t3 z7 N: W0 d6 V2 j9 g1 A. g1 t1 d3 U- l
字长
6 I# R. `! N" A( S% t& A, K& c+ A数据类型
/ E: Y5 R3 X2 }4 I1 _数据对齐' J8 q1 D4 P/ ?
字节顺序% V+ y0 v7 }  _! Y/ l- p( J& ^
时间
$ J& y% V" J) j, S0 n; x; N; p! u+ c页长度
- I) d, W2 C' A; d3 F: ]处理器顺序
' M5 i+ a( E# ~SMP, 内核抢占, 高端内存
) R' O2 H9 q7 R6 s; e2 [# F总结' g  ~3 o9 o7 ?5 w7 s  j

( s$ q0 b+ M3 c' x7 ^- T( L8 N8 h& ]
$ C- s3 j8 g( t- K% Y  O1. 字长. m9 a2 I" ^8 x% ?
这里的字是指处理器能够一次完成处理的数据. 字长即使处理器能够一次完成处理的数据的最大长度.1 i$ M% ]+ Y7 \$ ]0 N( D: ^
6 b7 E1 t4 {5 A& x- h1 z
目前的处理器主要有32位和64为2种, 注意这里的32位和64位并不是指操作系统的版本, 而是指处理器的能力.
* y8 b' z8 L2 s, e9 X# c
: I+ ]) Q  }0 `: B, X一般来说, 32位的处理器只能安装32位的操作系统, 而64位的处理器可以安装32位的操作系统, 也可以安装64位的操作系统.- M$ p- {$ h9 i% g

3 T( g1 s+ h4 |
# _3 z  ?9 T/ u' e- x& C$ m- ]6 _
对于一种体系结构来说, 处理器通用寄存器(general-purpose registers, GPR)的大小和它的字长是相同的.2 P' I! w$ X0 `+ n! r0 y
$ d% {# \1 _% V, P
C语言定义的long类型总是对等于机器的字长, 而int型有时会比字长小.7 I  j3 A; N. W. z) _  D3 r7 g: Q

9 ]' G( n4 e* s  P32位的体系结构中, int型和long型都是32位的2 {) |! u8 P- b
64位的体系结构中, int型是32位的, long型是64位的.
! o2 |9 L: K6 \( H/ \ 1 [2 O( a) W6 D7 I" L. ?

0 P4 p1 O6 f& P1 e内核编码中涉及到字长的部分时, 牢记以下准则:
& e, y" N1 P4 w- [# T! x
' U/ u( u; }0 y6 K' p7 y. |ANSI C标准规定, 一个char的长度一定是一个字节(8位)
9 ]/ N/ I  G$ @0 q4 Xlinux当前所支持的体系结构中, int型都是32位的) r' f, o, k( d/ D* X& B
linux当前所支持的体系结构中, short型都是16位的
0 \/ W+ v* d+ [  t, v; k- `& Tlinux当前所支持的体系结构中, 指针和long型的长度不定, 在32位和64位中变化% W8 l  h7 B1 O8 v4 n$ a
不能假设 sizeof(int) == sizeof(long): ^0 l! K  f! ?4 b9 }" s6 d; }
类似的, 不能假定 指针的长度和int型相同.% q' b' D' J$ d

& x" W) ~/ ~+ Q  I  B8 g. I
$ N! K% Z- m) p* b1 C6 R5 l% H8 w此外, 操作系统有个简单的助记符来描述此系统中数据类型的大小.+ i' j: [0 I* |4 C% a; C/ M
, n+ T! f* @- m
LLP64 :: 64位的Windows, long类型和指针都是64位
3 M" m3 }* B$ f* g6 U6 RLP64 :: 64位的Linux, long类型和指针都是64位
* \% Y- G0 |* p5 x; g) e0 X, @+ kILP32 :: 32位的Linux, int类型, long类型和指针都是32位+ ]' S: N8 e5 M: v" S6 i
ILP64 :: int类型, long类型和指针都是64位(非Linux)4 N; [  g) g! i9 ^7 e4 L; i

- x1 a+ ^9 k* F% f: S8 ?. S/ Y# f5 J% l
2. 数据类型
: y# A! n: r1 @* N5 A编写可移植性代码时, 内核中的数据类型有以下3点需要注意:
; H, @3 ]0 n, E6 k. E" z+ o4 f2 L& P" @' {0 I  ]( ^4 \% K
( L2 u( G' @# q1 Q9 }

4 ~4 G. D1 O3 \9 O2.1 不透明类型
+ c* w' D' i! E+ M) C; Clinux内核中定义了很多不透明类型, 它们是在C语言标准类型上的一个封装, 比如 pid_t, uid_t, gid_t 等等.
7 |) \0 r' c( @+ r) C& |* w) V8 U5 s) C5 Z8 e# H
例如, pid_t的定义可以在源码中找到:
) `$ A6 ^0 n. O( T' P# D0 |
% j4 L8 d' ]$ A7 Vtypedef __kernel_pid_t        pid_t;  /* include/linux/types.h */; w4 E, v' l/ ~# c

" Q4 C# w1 C5 `+ ^, n* Dtypedef int        __kernel_pid_t;    /* arch/asm/include/asm/posix_types.h */' a4 o  D/ G* N: k) ^
2 c& G1 L4 |) H: y8 W( Z

  s' v* O1 e1 k$ ]3 _3 R% L; P使用这些不透明类型时, 以下原则需要注意:
4 ~  e6 Y* m& D- R- e- o) {( }7 w4 y
不要假设该类型的长度(那怕通过源码看到了它的C语言类型), 这些类型在不同体系结构中可能长度会变, 内核开发者也有可能修改它们
% q: E& R1 p, J$ {不要将这些不透明类型转换为C标准类型来使用6 i6 K' F4 g( t, A# P8 G  k# W8 U
编程时保证不透明类型实际存储空间或者格式发生变化时代码不受影响
) z; Q6 p. H' l9 O( \' s5 `5 N. \- b   }. U" S& x% N5 f$ W. y
- O1 X% g6 N0 {  |7 M
2.2 长度确定的类型& t( b( u* O! x# m6 ^+ u0 k( n/ {
除了不透明类型, linux内核中还定义了一系列长度明确的数据类型, 参见 include/asm-generic/int-l64.h 或者 include/asm-generic/int-ll64.h
& _7 e  ^5 c! o, p/ }" z1 m9 S% V$ ?1 X
复制代码2 i$ }! `5 |) Y
typedef signed char s8;
0 h2 N3 ~% ]/ }% \) Atypedef unsigned char u8;
: D- Z; d0 Z/ K* t" p8 W4 C8 [7 u0 |7 o. L% K6 k
typedef signed short s16;
$ t* P$ G  |6 \( w; T: p8 |7 u1 etypedef unsigned short u16;
/ ~/ b9 J0 J- b$ F+ o; R- l2 x2 i5 x
typedef signed int s32;
  I. E: x9 G4 R3 htypedef unsigned int u32;
' r0 ^5 v. G! c- I: z, }/ \# v9 v% k: b. r
typedef signed long s64;: f7 a6 X. ]0 B- e. m. e
typedef unsigned long u64;
. k9 d) l7 Y; Q) R复制代码
1 d. w  F" F+ B" c+ r# N9 S ( D1 R$ a$ l; @  y3 z" f

( {7 V+ [$ K! {* X+ l: B上面这些类型只能在内核空间使用, 用户空间无法使用. 用户空间有对应的变量类型, 名称前多了2个下划线:
4 u4 G6 t2 K( l, ^. B5 u; O0 A* R' Y$ {4 N
复制代码0 Z4 r' F! I1 G5 F# \3 Q4 Y0 ^1 o' n
typedef __signed__ char __s8;
' I  p, K+ C* t( \1 L" ?1 e: }: _$ ctypedef unsigned char __u8;; q8 T0 f( z. J/ D7 \$ f

# f" ^2 ?# @0 K  }# Vtypedef __signed__ short __s16;) `$ ]3 `. x. w: I5 ?5 F( P! e
typedef unsigned short __u16;
: y- Z4 y/ i; t$ T
0 z5 ]5 t* c9 B. G9 L+ z+ Jtypedef __signed__ int __s32;$ ?5 a5 v; ]- E; ]% G  c0 J/ M  `
typedef unsigned int __u32;8 y0 e5 Y9 q  Y; B# e5 t( q0 P- P1 ~
- G9 s0 q% V/ ~; E' Q0 I1 ~' r
typedef __signed__ long __s64;
, v) H4 e7 C1 L8 S+ m4 O) w: h* qtypedef unsigned long __u64;3 N# Y8 v0 k- M) L
复制代码2 f7 h- J7 o- ^! T2 B. g

  l+ `1 G9 M6 O6 o5 G% y5 F
' X5 R. g/ G* g: e# [% |1 F2.3 char类型$ o* `# l2 V6 x1 O2 f' z% b% c
之所以把char类型单独拿出来说明, 是因为char类型在不同的体系结构中, 有时默认是带符号的, 有时是不带符号的.
: X7 D/ b& g# {! A1 K# d! i) q. P" C* Z+ ~. u0 a
比如, 最简单的例子:: L# o, N& J0 w! h# B

# l2 M1 ?- i& c, C9 F/*/ M' L- ]. C% C5 `) q
* 某些体系结构中, char类型默认是带符号的, 那么下面 i 的值就为 -1% I' V* s% C( n2 j0 N3 A! v% u/ V& f
* 某些体系结构中, char类型默认是不带符号的, 那么下面 i 的值就为 255, 与预期可能有差别!!!6 c; H$ X5 `" {) K. `
*/
  S8 _1 z8 ?1 o! u4 t. achar i = -1;+ f: ^+ S( Y# a$ |; `' n2 y

' |0 q9 t0 z8 x; ~. w% y  T9 s$ u3 w$ u8 h" o, s
避免上述问题的方法就是, 给char类型赋值时, 明确是否带符号, 如下:
+ T* V* @7 p7 E+ f8 i8 Y, v: T; n
- \, A. `( F) d' v. O$ F" K% @! Isigned char i = -1;  /* 明确 signed, i 的值在哪种体系结构中都是 -1 */$ X0 c/ N: Y: l# e4 J
unsigned char i = 255;  /* 明确 unsigned, i 的值在哪种体系结构中都是 255 */
7 a+ R) Q8 R: o" n
1 Z/ [! A+ k) b! w4 O$ Y+ T6 q
6 Z& L" @9 z% |! z: M6 i# K& p$ |4 j3. 数据对齐
4 f4 ^1 v8 Y4 x: X" C' U数据对齐也是增强可移植性的一个重要方面(有的体系结构对数据对齐要求非常严格, 载入未对齐的数据可导致性能下降, 甚至错误).
3 o' x; T( G' x4 S- w# Z4 h( b) H  F% [' f  ?7 \8 q, h, ~& h
数据对齐的意思就是: 数据的内存地址可以被 4 整除" G* J7 Z; ~# y  k1 S

5 S/ n7 P9 B4 @. B  U6 K1 ~ 9 J! |( h: q  T1 a+ C# `

! F) ]/ d* H, g1. 通过指针转换类型时, 不要转换长度不一样的类型, 比如下面的代码有可能出错
( {' N/ k2 t0 V5 S$ g: e( V+ o3 S
/ p6 Y! w  U3 V" y7 d$ U复制代码, H* s& d- g, b* M- d% F' D0 L5 M
/*( v" p6 N0 x( ]
* 下面的代码将一个变量从 char 类型转换为 unsigned long 类型,
! \: g* T/ n- g) U: B * char 类型只占 1个字节, 它的地址不一定能被4整除, 转换为 4个字节或者8个字节的 usigned long之后,
$ m) o# U7 E  M' l; \ * 导致 unsigned long 出现数据不对齐的现象.: ~: B9 Y, }/ c. C; c3 d$ w+ B5 @
*/
7 H! }5 ?% U$ wchar wolf[] = "Like a wolf";
; }9 s2 C+ V6 {" O6 @char *p = &wolf[1];" {7 ?7 v- ?1 a- Y& q
unsigned long p1 = *(unsigned long*) p;7 r: e: J) ^5 |6 f
复制代码
' Y; p8 o$ D; b9 w7 A 1 G1 h8 e. n1 B. E
5 y% F8 }% n( F+ S6 |5 @! {
2. 对于数组, 安装基本数据类型进行对齐就行.(数组元素的存放在内存中是连续的, 第一个对齐了, 后面的都自动对齐了)
$ k1 X4 W, u* Y/ _3 m2 H0 H/ h" p) K( t7 d
3. 对于联合体, 长度最大的数据对齐就可以了
  N5 G4 `: }1 L9 u4 v$ N6 B- ^
' n; a) h* {% t4. 对于结构体, 保证结构体中每个元素能够正确对齐即可
2 F2 ~6 v' n+ _! W
1 H6 j$ e7 M, I7 A9 Q6 X如果结构体中的元素没有对齐, 编译器会自动填充结构体, 保证它是对齐的. 比如下面的代码, 预计应该输出12, 实际却输出了24
$ p+ a$ z. L3 z' j- v# A/ H3 P8 s" M0 ]
我的代码运行环境: Fedora20 x86_64
  f5 z8 i% k/ u" s7 S; ]; I. t) m( c: p- G" P$ ?
复制代码
% y  J' D2 \$ f4 @( }/******************************************************************************
) F1 Q% b! _; E9 V * @File    : struct_align.c
: Q3 e0 i# a# m; _9 X9 N2 W * @author  : wangyubin* w- J' R8 C7 w; _* |& G  ?: @
* @date    : 2014-01-09
" z( M/ D1 e; q+ `& w * 1 P1 ^$ z" U" ]
* @brief   :
  s& `$ w. Z) D * history  : init0 K0 J, T0 i: ~& c) A$ T
******************************************************************************/: s- C$ ?# @: ~; E. U4 B+ f% W' m

! R2 w+ I  H, W6 p- e* Z. G1 ]#include <stdio.h>
1 e7 F: ]1 N# G4 X5 {: n
2 S0 B0 t) l" \/ u" J- C! v: @9 x; Hstruct animal_struct
: k6 {$ A0 Z1 s4 K+ F( W{
3 O4 m3 P4 w5 Y3 |1 ^$ I( e: R    char dog;                   /* 1个字节 */
0 k( C) [: M" {$ j" f9 Z    unsigned long cat;          /* 8个字节 */4 g4 b4 D' i' W* B3 o
    unsigned short pig;         /* 2个字节 */8 o; n( h0 G" w
    char fox;                   /* 1个字节 */
# U) y5 d  w' A- a" ]8 g};5 K! i: c" f/ W# T
$ F7 p3 E, O% t
int main(int argc, char *argv[])
7 n$ r. y7 O  `3 Q  e{& j  b0 V, U; i& ~, d8 {$ H& Z6 f
    /* 在我的64bit 系统中是按8位对齐, 下面的代码输出 24 */
! u0 t$ _4 f. O: |% j  @    printf ("sizeof(animal_struct)=%d\n", sizeof(struct animal_struct));
+ }9 u$ ]4 T. r  F" f! _0 z" W    return 0;
. O6 U  p/ y5 {0 Q}/ F: A$ E& i2 j  ?( o2 W% K: i+ q
复制代码
2 t9 v3 M( `: I( Z  ~1 F测试方法:) {3 Q4 N( G2 N- {) q4 u$ H8 l
, J3 s8 R) E3 h& N6 J
gcc -o test struct_align.c
$ d! [1 b; m; r$ C./test   # 输出24, K; R( r- s* }
6 A. Z% F6 f3 ?$ _

1 h2 G2 i  V& |$ V" R# R4 @7 W结构体应该被填充成如下形式:' Z7 Q  {" q" S. T* I! p
% p9 k5 a# U1 g1 J$ C, j+ i& s
复制代码
* m0 l. ^0 }5 j: ~struct animal_struct
5 x" C4 i6 [( T2 w2 D, z: y9 J{
7 X, x) I" b6 c( X! A, ^    char dog;                   /* 1个字节 */. s( f2 a. A5 L. Y' ^  M6 `
    /* 此处填充了7个字节 */' |! F. d9 L/ _7 _7 k6 r
    unsigned long cat;          /* 8个字节 */, w9 f, k2 O1 P! A
    unsigned short pig;         /* 2个字节 */
7 w; P& F3 }/ ~9 |  p    char fox;                   /* 1个字节 */% M- H  `* R2 a3 A' p
    /* 此处填充了5个字节 */   
) ?  P/ |4 P0 A; h" X" y1 Z};
* L; _& Z  I/ A3 W! v; U复制代码
5 u6 Z6 O0 j- O, t: S" e/ L , ^7 ]! m- p$ g, N! b
7 [# f% Y# v, [- P( _; w4 G5 Q) z
通过调整结构体中元素顺序, 可以减少填充的字节数, 比如上述结构体如果定义成如下顺序:
! ?, q' ]# n6 N" N' ?. n4 r- o0 F. p  z# V3 n1 Q; }: _9 P9 D7 |
复制代码- D  @  n* n1 h1 G- c+ E) I
struct animal_struct
4 O; u0 T  ~% R+ P5 W3 r% W{
  D2 W# b. a2 |4 l. }7 k    unsigned long cat;          /* 8个字节 */
+ ^3 c/ ^) c" A# Y/ M    unsigned short pig;         /* 2个字节 */
- {, h) b, _: A  q    char dog;                   /* 1个字节 */
* o/ a9 ]7 t) k2 B, e    char fox;                   /* 1个字节 */
' w* o& E+ d- [, J3 g};
7 K. t! e+ x5 S2 e! e. a复制代码  R6 h: j. R1 q3 g
那么为了保证8位对齐, 只需在后面补充 4位即可:
$ U4 B# [6 M: p5 G% G) r" G
+ v) x& L5 H5 Y: Z6 U; \复制代码
7 r/ ]# Y( _5 `: I1 [struct animal_struct
( {# f5 t2 i: P7 l* p{, T; y9 Z6 K$ G4 ]6 B6 }& x
    unsigned long cat;          /* 8个字节 */
. |, a. r' a  b% E    unsigned short pig;         /* 2个字节 */
5 {5 `5 r6 ~/ j) T    char dog;                   /* 1个字节 */" q3 ]' i0 [  g$ w. ^4 h# M0 J
    char fox;                   /* 1个字节 */$ o/ `8 O( L1 a, [% j4 R; j7 p/ @
    /* 此处填充了4个字节 */   / i; S  `4 o2 n# u/ s" Y( Q
};
6 m; Y/ X8 u3 Y+ _! X$ @. V复制代码4 Y0 X0 L) `' W' T4 h( q9 s+ v

6 y) q0 G8 q5 z3 v: V. T/ m
# n2 O/ w8 U3 Q% x+ q0 s5 U, {3 t+ J调整后的代码会输出 16, 不是之前的24
! V7 \4 o9 G) ]! x* ]. r3 U* w& {  T. ^/ Q1 @  g# U1 ?8 x
复制代码
8 K! t, _* o; ]1 O% e. t#include <stdio.h>
1 Y: P; O4 u; d  |1 l0 k! B; r
; x4 H* x1 C+ Q! U$ R% @. jstruct animal_struct
: G# I  b* g$ g{
! ]0 p2 H9 i7 u5 U0 {% P    unsigned long cat;          /* 8个字节 */
- U  Y. s# w$ d8 j4 e    unsigned short pig;         /* 2个字节 */
% M, \% b  y( ]' ]    char dog;                   /* 1个字节 */
. @. v9 ]) A3 z8 R' s- \    char fox;                   /* 1个字节 */
/ L* k- r' \3 n) a};+ e0 a! t! ^* ?) ?$ S, ?& z

9 S% ?% X& @$ N$ t) j" l; Aint main(int argc, char *argv[])
( W% Y' |5 n- ]1 M7 ]- M( }$ L4 f{7 r* J* ~6 w: \1 _! W3 s5 @  o1 a# d
    /* 在我的64bit 系统中是按8位对齐, 下面的代码输出 16 */; z1 a6 I' y! ]- A; {" ^' F
    printf ("sizeof(animal_struct)=%d\n", sizeof(struct animal_struct));3 x4 T) E1 n0 s5 a9 A
    return 0;/ N1 R/ ]  z. A5 I  a+ Q6 |: u( ]4 P3 E
}
2 s/ D' m! ~% m' Y$ i复制代码% D# F$ K* S9 y3 I3 S$ ?
测试方法:
, U: e6 z( b" |. T
& a7 S( d, C, `  f6 _gcc -o test struct_align.c
7 [1 }1 I0 H4 a/ Y6 d% O& @./test  # 输出16+ _! V* z6 v2 ], J

# v0 _/ t5 n4 J( K5 X9 D  t
" L9 |6 v) j) M注意: 虽然调整结构体中元素的顺序可以减少填充的字节, 从而降低内存的消耗.
, ?7 E+ ?  w% T# T
7 a$ }! T/ o( Y  }但是对于内核中已有的那些结构, 千万不能随便调整其元素顺序, 因为内核中很多现存的方法都是通过元素在结构体中位置偏移来获取元素的.% {" _2 O% N1 ?- j$ b/ q$ Z- f
" J" H0 c1 i" d/ I- H3 T: T

* u+ l2 k5 K- ?1 h, A! A, s9 i% u% E& b
4. 字节顺序
0 M$ y! e9 H5 ]3 c字节顺序其实只有2种:7 X/ [+ F2 Y5 }: K* p
" Q/ w+ b+ X! H: v# w: T
低位优先 :: little-endian 数据由低位地址->高位地址存放. l! n" ?. F1 C# [
高位优先 :: big-endian 数据由高位地址->低位地址存放
3 G, }: u" d6 N- ?: ~. L) ]; g 2 I2 z/ l0 K- C& j5 ]
/ K3 R! r1 Z" _6 g& C
比如占有四个字节的整数的二进制表示如下:
' m- m$ F, l7 E% l6 |9 Q  m( k' \' k0 Z# ?8 b
00000001 00000002 00000003 000000040 q* C2 p) ~+ T  e  K* S
6 Y- @: d  A; N$ f9 e

7 {+ b2 C/ k) M) O内存地址方向:   高位  <--------------------> 低位! E9 e$ ?( `+ m9 ~9 s. n% j8 @

, e! L2 o6 {2 ^) E2 E* tlittle-endian 表示如下: : M' F% N+ e. y, I) E  e% l' Z

, C/ t4 g1 ]. T+ X$ ]0 t" }0 p7 P; ]0 U00000001 00000002 00000003 00000004
( C$ L- J1 |9 C. o6 w2 g# ?big-endian 表示如下:# S0 M4 Q7 f+ A/ s* }

7 J6 `( v  b1 ^1 P' p3 R00000004 00000003 00000002 00000001* J" d# `6 p( @1 A. m- ?2 o

* h# H1 t6 J$ f9 f5 [. a6 s# R+ Q7 j; q  j5 V- U1 @  S7 W
判断一个体系结构是 big-endian 还是 little-endian 非常简单.
2 {5 t$ _6 I6 @! Q0 p- o  P0 I/ U( x; [% j0 U% F
复制代码, x: }: B+ b% |6 \+ M
int x = 1;  /* 二进制 00000000 00000000 00000000 00000001 */
7 w3 w# }' v' p, R
( j" D& o0 _6 W: f" J% W/*
! y8 m* _$ o+ C5 g9 n1 b1 c. o * 内存地址方向:   高位  <--------------------> 低位% @! g& a5 D" e1 [6 [0 {$ L* g! ~
* little-endian 表示: 00000000 00000000 00000000 000000010 E- I4 b, K* l* j8 Q& w, i
* big-endian 表示:    00000001 00000000 00000000 000000004 v1 H9 r% `$ B! _9 ^- T( N
*/
1 z* r1 B' C8 K( vif (*(char *) &x == 1)   /* 这句话把int型转为char型, 相当于只取了int型的最低8bit */. h) a3 ^# u) S( T+ X: t0 Q
    /* little-endian */
% s8 @9 |6 g2 l+ Z: P  Welse: v% o& W" o, Y& u
    /* big-endian */
2 N6 H2 ~: H2 U9 o5 p复制代码
2 n& e3 c' M' V7 x" ?9 c! b! ` . \# K/ J, {( {3 x4 R8 p

3 G% m% L% I* ]$ w5. 时间
$ G! y5 `# T7 Z% j内核中使用到时间相关概念时, 为了提高可移植性, 不要使用时间中断的发生频率(也就是每秒产生的jiffies), 而应该使用 HZ 来正确使用时间.
6 \1 v7 f" G3 g
7 o1 `# a% ^, G7 ]/ Q关于 jiffies 和 HZ 的概念, 可以参考之前的博客: 《Linux内核设计与实现》读书笔记(十一)- 定时器和时间管理" s* f( }: Q" t+ |4 w2 L9 a
$ ]1 U  ?0 \9 A! O9 a
  L" ^. _. p! w6 f

3 D: i$ Y( \" d6. 页长度
$ c( [6 B- \! b5 e: K当处理用页管理的内存时, 不要既定页的长度为 4KB, 在不同的体系结构中长度会不一样.6 [: S" h8 W7 ?

- J5 p. D& A4 x9 q1 d( H而应该使用 PAGE_SIZE 以字节数来表示页长度, 使用 PAGE_SHIFT 表示从最右端屏蔽了多少位能够得到该地址对应的页的页号.% j1 _; b- w/ }+ {  Z

! r- `7 o2 S$ [. E2 c; `PAGE_SIZE 和 PAGE_SHIFT 都是宏, 定义在 include/asm-generic/page.h 中
4 h/ h9 m3 f: }' s1 \# K* R4 ~! k" H  ]: w% x6 Q: _
5 ^2 R" s& B4 |) I
' M" N8 j$ l: U1 i
下表是一些体系结构中页长度:( M: p' @) k2 p" q: H) ~1 J) }. D5 \
/ F4 s+ Q' b& w9 F$ T
体系结构
; |; X5 r+ Z+ M$ @# X5 z' y
- T  u5 J* }- {2 XPAGE_SHIFT
( N* f: Y/ K7 y" E: m- i' z8 r; L: ^$ t+ u$ D: N
PAGE_SIZE- U- _- }, z: S/ C3 S  T
1 \, @" U5 x( d/ H: ]1 ^$ F
alpha        13        8KB
, h' X, q& O8 U% D" ?arm        12, 14, 15        4KB, 16KB, 32KB
& z5 _0 F; ?6 Z4 V% Cavr        12        4KB
: n& d% }1 Y/ O, g3 mcris        13        8KB' ~- e4 a+ F2 t% X7 T- j& O
blackfin        12        16KB
) J6 F6 v9 W% q% z' g( e4 ch8300        14        4KB* ]# |5 h! V+ H
         12        4KB, 8KB, 16KB, 32KB
3 A7 `, e6 M! p/ r- ~m32r        12, 13, 14, 16        4KB
' j& R5 l" s5 E& U( Em68k        12        4KB, 8KB4 @. {3 f+ y6 D- Y2 B$ _, Z
m68knommu        12, 13        4KB! c3 q6 n" P: w* n: f; ?
mips        12        4KB
: x; [" L5 K$ U/ j3 Q  Pmin10300        12        4KB
% Y* \# u- M5 f8 R9 c0 Oparisc        12        4KB
( M* U& D5 g/ f3 z$ Fpowerpc        12        4KB
9 o# a5 W/ m3 F' Y% w4 Ss390        12        4KB
1 T8 P9 w8 J0 ksh        12        4KB
* T& ^/ {7 U( z/ q: m  e- Ysparc        12, 13        4KB, 8KB& \% H5 I! v3 p( e
um        12        4KB
+ u1 r- T& Z& j6 @7 O: gx86        12        4KB5 Q% K2 C0 U2 n# L* o8 n! e
xtensa        12        4KB
) K+ `& ]0 T" d8 H
- }& r2 ^$ ?4 B$ l+ @# k6 \+ O; p+ o" Y$ P
7. 处理器顺序
% C2 x) s, k9 T% ?4 v) V8 q( D/ A. H还有最后一个和可移植性相关的注意点就是处理器对代码的执行顺序, 在有些体系结构中, 处理器并不是严格按照代码编写的顺序执行的,9 M: W, [) `& E% E  S2 S+ B% U
8 F( F$ D2 ~2 ?0 v
可能为了优化性能或者其他原因, 处理器执行指令的顺序与编写的代码的顺序稍有出入.
) q/ |- \( k0 ^& z0 U# c- ~6 y: @/ [, V; x) O1 O

- O7 ^+ i; N5 q6 `& t! W
) j3 ?6 U. _: s- T- e如果我们的某段代码需要严格的执行顺序, 需要在代码中使用 rmb() wmb() 等内存屏障来确保处理器的执行顺序.
+ I! w+ ~" H- j$ I. \7 [
0 Q( d5 m$ H+ W$ L% u关于rmb和wmb可以参考之前的博客: 《Linux内核设计与实现》读书笔记(十)- 内核同步方法  第 11 小节$ \9 @# o( d' M9 s5 W" N

# v* Q  y7 n- [- x) s7 O# d
' y2 W! P3 l# ?  V% O
! O8 d* d) R- E$ H+ h$ y8. SMP, 内核抢占, 高端内存
" k9 q7 ^" D8 \. USMP, 内核抢占和高端内存本身虽然和可移植性没有太大的关系, 但它们都是内核中重要的配置选项,
/ w& o& X/ Z$ E3 y2 Q: c2 ?7 v4 ~9 z9 ]0 G4 y6 }  E
如果编码时能够考虑到这些的话, 那么即使内核修改SMP等这些配置选项, 我们的代码仍然可以安全可靠的运行.: `1 K0 J: X/ j$ c0 s, I- w
# u9 I& o# u) E/ }/ l6 P2 m
所以, 在编写内核代码时最好加上如下假设:
/ Y! ^, h# Q0 }7 S, j, o+ G6 R, d# X  _7 |* h1 ^
假设代码会在SMP系统上运行, 要正确选择和使用锁6 o+ E6 M' Z5 ?1 m- G% ?
假设代码会在支持内核抢占的情况下运行, 要正确使用锁和内核抢占语句
4 B' N9 ]) L- ?% M! |% k. Z假设代码会运行在使用高端内存(非永久映射内存)的系统上, 必要时使用 kmap()
" I5 b1 l: h* a6 g+ U9 O5 F& K # I, D' \& c4 v# f; j$ m
8 n4 Q; S$ P9 ^- K, p7 c
9. 总结4 f7 d' y2 b: w2 I, P7 U" Z
编写简洁, 可移植性的代码还需要通过实践来积累经验, 上面的准则可以作为代码是否满足可移植性的一些检测条件.3 l9 F, [, }3 {% u9 J
( [0 k# K% H! u4 O; p* r
书中还提到的2点注意事项, 我觉得不仅是编写内核代码, 编写任何代码时, 都应该注意:; l* m+ N& y3 m* M6 L

7 A& B: @: I7 |9 S) e$ \3 N编码尽量选取最大公因子 :: 假定任何事情都有可能发生, 任何潜在的约束也都存在1 ^2 d) D0 ?( c; ~4 Y8 j3 D
编码尽量选取最小公约数 :: 不要假定给定的内核特性是可用的, 仅仅需要最小的体系结构功能; ~9 B+ k$ P6 f9 y: k

该用户从未签到

2#
发表于 2021-3-17 18:39 | 只看该作者
Linux内核设计与实现之可移植性
您需要登录后才可以回帖 登录 | 注册

本版积分规则

关闭

推荐内容上一条 /1 下一条

EDA365公众号

关于我们|手机版|EDA365电子论坛网 ( 粤ICP备18020198号-1 )

GMT+8, 2025-11-24 16:11 , Processed in 0.187500 second(s), 24 queries , Gzip On.

深圳市墨知创新科技有限公司

地址:深圳市南山区科技生态园2栋A座805 电话:19926409050

快速回复 返回顶部 返回列表