为什么要避免使用malloc()和free()函数？

文章目录

为什么要避免使用malloc()和free()函数？

		发表于: 2019-06-15 18:29:28 | 已被阅读: 641 | 分类于: 杂谈

想在C语言程序员之间开始一个激烈的，或者说有争议的讨论很简单，只需要问：“使用动态内存分配安全吗？”

在C语言程序开发中，动态内存分配允许程序在运行时向系统申请内存使用，只不过在使用完毕后，需要显式的释放之，这就要求程序员对动态分配的内存了然于胸。

在非常重视安全（safety-critical）的嵌入式C语言程序开发中，动态内存分配广泛被认为是禁忌。使用C语言的 malloc() 和 free() 库函数可能会带来灾难性的副作用，例如内存泄漏或者碎片。此外，malloc() 常常会表现出极其不可预测的特性，这使其成为在多核系统上进行多线程C语言程序开发的瓶颈。

事实上，由于 malloc() 存在安全风险，美国军方按照 DO-178B 标准，在 safety-critical 的嵌入式航空电子设备代码中

禁止动态内存分配

。

嵌入式行业的C语言程序员似乎对这个话题有着发自内心的反应。在最近的一次互联网技术小组讨论中，当提到问题：“在嵌入式C语言程序设计种是否使用动态内存分配？”时，77 条回复称“使用动态内存分配是对系统容错性的最大危害之一”，还有 5 条回复称“如果希望系统正常运行时间能够达到‘5个9’（即99.999%），答案就是‘永远不会’使用动态内存分配”。

甚至有相关部门在招聘嵌入式C语言程序员时，会问求职者是否会使用动态内存分配，如果他们使用，就不会被雇用了。

为了通过相关的工作面试，也为了提升C语言代码安全，更好的办法是自定义一套内存分配器，一般分为两种：基于栈的分配器，以及基于本地线程的分配器。写出更安全稳定的C语言代码，就不该再使用标准库提供的 malloc() 和 free() 函数了。

“相当好”还不够好

为什么美国军方认为C语言标准库函数提供的动态内存分配管理函数 malloc() 和 free() 是个糟糕的选择呢？这其实要从 malloc() 和 free() 的设计上考虑，通常，它们是基于列表分配器算法的，该算法将内存池组织到单个链表中的连续位置，分配器管理该链表，每次分配实际上就是寻找空闲位置。这种分配器在各种情况下都能

相当好

的分配和释放内存，但是在极端的 safety-critical 系统中，“相当好”还不够好。

基于栈的内存管理器

在C语言程序开发中，某些应用程序可能只需要申请一些短期对象，很快就会使用完并释放。基于栈（此“栈”不同于函数的调用栈）的内存分配器此时就能大派用场了，该分配器每次分配都返回栈指针当前位置的地址，并按照需求推进指针，如下图：

当该内存被使用完毕，需要被释放时，只需要将栈指针往后返回即可。这样一来，处理内存分配的开销就减少了，因为没有需要管理的指针链表了，也没有需要跟踪的分配内存大小，以及空闲内存位置。另外，由于C语言程序不再跟踪特定的分配内存，所以这种内存分配器也更加安全：不匹配的内存释放不会导致内存泄漏。

对于C语言标准库提供的内存分配器来说，当内存以随机顺序释放时，列表分配器通常需要向它的链中添加指针和内存长度（这称为碎片）。当程序继续运行时，列表分配器的开销会增加，因为需要管理的元数据数量增加了，寻找合适的空闲内存位置也会更加耗时。而基于堆栈的内存分配器分配的所有内存块都将返回到堆中，碎片化就被避免了。

多核处理器多线程编程的挑战

当在多核处理器平台进行多线程编程时，默认由互斥体做同步控制的 malloc() 和 free() 函数就比较难用了。因为他们可能会导致锁冲突，操作系统要解决这些冲突，只能通过损耗性能的上下文切换。

针对此情况，C语言程序员可以自定义本地线程内存分配器，通过为每个线程分配特定的内存池来避免冲突。每个线程的内存分配是在不干扰其他线程的情况下进行的，从而提高了系统性能和程序的可预测性。

当本地线程分配器耗尽内存时，如果系统安全和允许，其他分配器可以再为它分配一个新的内存块。本地线程内存分配器可使用一个列表管理属于自己线程的内存，因此由同一个线程分配和释放的内存不需要协调，不会发生锁冲突导致的性能损耗。

简而言之，不使用 malloc() 和 free() 管理内存，使用更具预测性，更安全的自定义内存分配器，可以避免 safety-critical 代码出现内存安全问题。

通过第三方应用程序分配内存

使用自定义内存分配器还有一个好处，就是可以通过集成它们的第三方应用程序使用。IMDS（In-Memory Database System，内存数据库系统）就是一个例子，它们是专门设计用来管理 RAM 中应用程序对象的。下图是使用 malloc() 和 free() 的一个例子：

下图则是使用 mcobject 的 extremedb 的相同过程，这是一个整合了自定义分配器的IMD，包括基于堆栈和本地线程的内存分配器。在上图的开头，C语言程序定义一个结构，声明一个指向该结构实例的指针，并通过malloc() 为其分配内存。

如果使用 malloc()/free() 的C语言程序是多线程的，并且线程将共享传感器对象，那么程序员必须实现并发控制。再来看看 IMD，程序开始获取了句柄，调用 sensor_new() 将声明一些专用于 IMD 的内存池，用于新的 sensor 对象。

在军事/航空航天应用中，传感器对象可以表示任何东西，可以是跟踪导弹目标的光学传感器，也可以是用于化学战防御的生物传感器，还可以是用于帮助飞机导航的运动传感器等。

sensor_new() 返回数据库对象的句柄，通过该句柄可以写入和/或读取对象的值。相反，C语言程序直接处理结构的字段，从而在多线程应用程序中创建并发访问控制的需求。

当C语言程序使用完sensor结构后，free() 将内存返回到堆。当带有 IMDS 的代码完成时，数据库中的空间被放弃，事务结束，用于传感器对象的内存返回到专用内存池。

IMD的内存可能不足，但这将生成一条“数据库已满”的错误消息，应用程序可以处理该错误消息。相反，由malloc（）和free（）引起的内存碎片和泄漏会破坏整个系统的稳定性，程序无法处理这种错误，操作系统只能对其做崩溃处理。

另外，IMDS 还提供了一种“幕后”工作机制，以更高的效率和灵活性来分配和释放内存，避免使用多个底层分配器类型，从而避免了 malloc()/free() 固有的风险。

事实上，进入安全关键领域的C语言软件工程师需要知道，需求和风险高于消费者或业务应用程序开发。编写避免动态内存分配的代码，而使用一个或多个自定义内存管理器虽然不太方便，但它增加了C语言程序的安全性和稳定性，这是安全关键系统工程师应该接受的一个折衷方案。