为什么要避免使用malloc()和free()函数?
发表于: 2019-06-15 18:29:28 | 已被阅读: 26 | 分类于: 杂谈
想在C语言程序员之间开始一个激烈的,或者说有争议的讨论很简单,只需要问:“使用动态内存分配安全吗?”
在非常重视安全(safety-critical)的嵌入式C语言程序开发中,动态内存分配广泛被认为是禁忌。使用C语言的 malloc() 和 free() 库函数可能会带来灾难性的副作用,例如内存泄漏或者碎片。此外,malloc() 常常会表现出极其不可预测的特性,这使其成为在多核系统上进行多线程C语言程序开发的瓶颈。
事实上,由于 malloc() 存在安全风险,美国军方按照 DO-178B 标准,在 safety-critical 的嵌入式航空电子设备代码中
嵌入式行业的C语言程序员似乎对这个话题有着发自内心的反应。在最近的一次互联网技术小组讨论中,当提到问题:“在嵌入式C语言程序设计种是否使用动态内存分配?”时,77 条回复称“使用动态内存分配是对系统容错性的最大危害之一”,还有 5 条回复称“如果希望系统正常运行时间能够达到‘5个9’(即99.999%),答案就是‘永远不会’使用动态内存分配”。
甚至有相关部门在招聘嵌入式C语言程序员时,会问求职者是否会使用动态内存分配,如果他们使用,就不会被雇用了。
为了通过相关的工作面试,也为了提升C语言代码安全,更好的办法是自定义一套内存分配器,一般分为两种:基于栈的分配器,以及基于本地线程的分配器。写出更安全稳定的C语言代码,就不该再使用标准库提供的 malloc() 和 free() 函数了。
“相当好”还不够好
为什么美国军方认为C语言标准库函数提供的动态内存分配管理函数 malloc() 和 free() 是个糟糕的选择呢?这其实要从 malloc() 和 free() 的设计上考虑,通常,它们是基于列表分配器算法的,该算法将内存池组织到单个链表中的连续位置,分配器管理该链表,每次分配实际上就是寻找空闲位置。这种分配器在各种情况下都能
基于栈的内存管理器
在C语言程序开发中,某些应用程序可能只需要申请一些短期对象,很快就会使用完并释放。基于栈(此“栈”不同于函数的调用栈)的内存分配器此时就能大派用场了,该分配器每次分配都返回栈指针当前位置的地址,并按照需求推进指针,如下图:
对于C语言标准库提供的内存分配器来说,当内存以随机顺序释放时,列表分配器通常需要向它的链中添加指针和内存长度(这称为碎片)。当程序继续运行时,列表分配器的开销会增加,因为需要管理的元数据数量增加了,寻找合适的空闲内存位置也会更加耗时。而基于堆栈的内存分配器分配的所有内存块都将返回到堆中,碎片化就被避免了。
多核处理器多线程编程的挑战
当在多核处理器平台进行多线程编程时,默认由互斥体做同步控制的 malloc() 和 free() 函数就比较难用了。因为他们可能会导致锁冲突,操作系统要解决这些冲突,只能通过损耗性能的上下文切换。
针对此情况,C语言程序员可以自定义本地线程内存分配器,通过为每个线程分配特定的内存池来避免冲突。每个线程的内存分配是在不干扰其他线程的情况下进行的,从而提高了系统性能和程序的可预测性。
当本地线程分配器耗尽内存时,如果系统安全和允许,其他分配器可以再为它分配一个新的内存块。本地线程内存分配器可使用一个列表管理属于自己线程的内存,因此由同一个线程分配和释放的内存不需要协调,不会发生锁冲突导致的性能损耗。
简而言之,不使用 malloc() 和 free() 管理内存,使用更具预测性,更安全的自定义内存分配器,可以避免 safety-critical 代码出现内存安全问题。
通过第三方应用程序分配内存
使用自定义内存分配器还有一个好处,就是可以通过集成它们的第三方应用程序使用。IMDS(In-Memory Database System,内存数据库系统)就是一个例子,它们是专门设计用来管理 RAM 中应用程序对象的。下图是使用 malloc() 和 free() 的一个例子:
在军事/航空航天应用中,传感器对象可以表示任何东西,可以是跟踪导弹目标的光学传感器,也可以是用于化学战防御的生物传感器,还可以是用于帮助飞机导航的运动传感器等。
sensor_new() 返回数据库对象的句柄,通过该句柄可以写入和/或读取对象的值。相反,C语言程序直接处理结构的字段,从而在多线程应用程序中创建并发访问控制的需求。
当C语言程序使用完sensor结构后,free() 将内存返回到堆。当带有 IMDS 的代码完成时,数据库中的空间被放弃,事务结束,用于传感器对象的内存返回到专用内存池。
IMD的内存可能不足,但这将生成一条“数据库已满”的错误消息,应用程序可以处理该错误消息。相反,由malloc()和free()引起的内存碎片和泄漏会破坏整个系统的稳定性,程序无法处理这种错误,操作系统只能对其做崩溃处理。
另外,IMDS 还提供了一种“幕后”工作机制,以更高的效率和灵活性来分配和释放内存,避免使用多个底层分配器类型,从而避免了 malloc()/free() 固有的风险。
事实上,进入安全关键领域的C语言软件工程师需要知道,需求和风险高于消费者或业务应用程序开发。编写避免动态内存分配的代码,而使用一个或多个自定义内存管理器虽然不太方便,但它增加了C语言程序的安全性和稳定性,这是安全关键系统工程师应该接受的一个折衷方案。