C语言新增stdint.h头文件的讨论,什么是“快”类型,什么是“小”类型?
发表于: 2019-11-05 08:27:52 | 已被阅读: 33 | 分类于: 杂谈
观察力敏锐的读者应该发现了,int_fast16_t 和 int_fast32_t 其实是一样的,以上图黄框为例,它们都表示 int 类型,这是怎么回事呢?int 类型怎么能同时表示 16 位宽和 32 位宽的整数类型呢?
int 类型当然不能同时表示两种位宽的整数类型,事实上,int_fastxx_t 类型并不是准确的 xx 位宽类型,它表示不低于 xx 位宽的类型,因此,只要 int 的位宽大于或者等于 32 位,它就能同时表示 int_fast16_t 和 int_fast32_t 类型。
有读者看到这里可能会有疑问,如果 int 的位宽等于 32,那么使用它来表示 16 位宽的 int_fast16_t 整数类型,不是造成资源浪费了吗?
其实读者应将注意力放在“fast”一词上。CPU 从内存取数据一般是逐字取的,这里的“字”并不是字节的意思,在 32 位主机上,字长常常是 4 个字节,也即 CPU 单次取出数据的最小单位是 4 个字节。
字长也可以理解为 CPU 读取数据的“步长”。
也就是说,CPU 读取数据的“步长”是字长(下文以4字节为例),也就是说假设这次读取了地址 0~3 的数据,接下来若是希望读取相邻的数据,最接近的地址也得是地址 4~7。其实从这里可以看出,CPU 每次读取数据的起始地址都是字长的整数倍。
这也是“数据对齐”的原因——为了CPU读取数据的效率。
如果需要读取的数据只有一个字节(char 型),那么显然,无论该字节放在哪里,它总是在某个字长段的范围内的(例如地址 0~3,地址 4~7 内),此时 CPU 一次就能读取完毕。
如果需要读取的数据有两个字节(16bits),情况就不同了——它的地址可能是 3~4,而 CPU 读取数据的“步长”是 4 个字节,若要读取该值,CPU 只能先读取 0~3 字节的数据,再读取 4~7 字节的数据,最后还需要组合拼凑,才能得到该值。这样的一系列操作显然非常低效。
所以 stdint.h 将“快”类型定义为字长的整数倍的意图就一目了然了,无非就是牺牲一些“空间”换取“时间”。当然了,读者在使用“快类型”时需要注意:int_fast16_t 并不一定恰好是 16 位宽,它只是不少于 16 位宽的类型。
C语言中的“小”类型
前面提到,int_fastxx_t 类型牺牲了“空间”换取“时间”,如果在某个C语言项目中,“空间”效率并不是特别重要,而“空间”效率却非常重要,那么 int_fastxx_t 类型显然就不合适了。此时可以使用 stdint.h 中定义的 “small type”,也即“小类型”。 int_leastxx_t 系列的数据类型基本上保证了其恰好是 xx 位宽,避免了空间浪费,但是按照前文的分析,“小类型”付出的代价是损失了一部分时间效率。
小结
本文主要讨论了C语言新增头文件“stdint.h”中定义的几种整数类型,并在此基础上讨论了“时间”效率和“空间”效率的矛盾。事实上,"stdint.h" 头文件中还定义了其他一些好用的宏,比如整数指针,各个数据类型的最大值和最小值等等,留给读者自己查看了。
// 详解下各种类型 https://stackoverflow.com/questions/9239558/what-is-the-difference-between-intxx-t-and-int-fastxx-t https://stackoverflow.com/questions/tagged/c?tab=votes&page=124&pagesize=15