C++高并发内存池设计：对象池、定长与动态内存池的性能分析与实战

2025/4/29 20:24:26 95 0 0 0

1. 为什么需要内存池？

2. 对象池(Object Pool)

2.1 概念

2.2 实现

2.3 优缺点

2.4 适用场景

3. 定长内存池(Fixed-Size Memory Pool)

3.1 概念

3.2 实现

3.3 优缺点

3.4 适用场景

4. 动态内存池(Dynamic Memory Pool)

4.1 概念

4.2 实现

4.3 优缺点

4.4 适用场景

5. 高并发环境下的内存池优化

6. 性能测试与数据分析

7. 总结与建议

在高并发C++应用中，内存管理往往成为性能瓶颈。频繁的new和delete操作不仅耗时，还会导致内存碎片，降低系统整体效率。内存池技术应运而生，它预先分配一块大的内存区域，然后按需从中分配和回收小块内存，从而减少了系统调用和内存碎片，提高了内存管理的效率。本文将深入探讨在高并发场景下C++内存池的设计与实现，重点分析对象池、定长内存池和动态内存池三种常见的内存池类型，并通过实际代码示例和性能测试数据，帮助读者选择最适合自己应用的内存池方案。

1. 为什么需要内存池？

在深入各种内存池实现之前，我们首先要理解为什么要使用内存池。默认的new和delete操作存在以下问题：

性能开销： 每次new和delete都会涉及系统调用，比如malloc和free。系统调用开销远大于简单的内存读写操作。
内存碎片： 频繁的分配和释放不同大小的内存块会导致内存中出现大量碎片，最终导致即使总剩余内存足够，也无法满足大块内存的分配请求。
并发问题： 在多线程环境下，malloc和free需要加锁保护，这会降低并发性能。

内存池通过以下方式解决这些问题：

预先分配： 内存池在初始化时就分配一大块内存，后续的分配和释放都在这块内存内部进行，避免了频繁的系统调用。
减少碎片： 内存池通常采用固定大小的内存块分配，这可以有效减少内存碎片。
并发优化： 针对多线程环境，可以采用无锁或锁优化的数据结构来管理内存池，提高并发性能。

2. 对象池(Object Pool)

2.1 概念

对象池是一种特殊的内存池，它专门用于管理特定类型的对象。对象池预先创建一批对象，并将它们保存在一个池中。当需要使用对象时，从池中获取一个；当对象不再使用时，将其返回池中，而不是销毁。这种方式避免了频繁的对象创建和销毁，提高了性能，尤其是在对象创建开销较大的情况下。

2.2 实现

下面是一个简单的对象池实现示例，使用std::mutex保护多线程访问：

 #include <iostream>
#include <queue>
#include <mutex>
#include <memory>
 
template <typename T>
class ObjectPool {
public:
    ObjectPool(size_t size) {
        for (size_t i = 0; i < size; ++i) {
            pool_.push(std::make_shared<T>());
        }
    }
 
    std::shared_ptr<T> acquire() {
        std::lock_guard<std::mutex> lock(mutex_);
        if (pool_.empty()) {
            // 如果池为空，则创建一个新的对象
            return std::make_shared<T>();
        }
        std::shared_ptr<T> obj = pool_.front();
        pool_.pop();
        return obj;
    }
 
    void release(std::shared_ptr<T> obj) {
        std::lock_guard<std::mutex> lock(mutex_);
        pool_.push(obj);
    }
 
private:
    std::queue<std::shared_ptr<T>> pool_;
    std::mutex mutex_;
};
 
// 示例对象
class MyObject {
public:
    MyObject(int id) : id_(id) {
        std::cout << "MyObject created with id: " << id_ << std::endl;
    }
    ~MyObject() {
        std::cout << "MyObject destroyed with id: " << id_ << std::endl;
    }
 
    int getId() const { return id_; }
 
private:
    int id_;
};
 
int main() {
    ObjectPool<MyObject> pool(10); // 创建一个包含10个MyObject的对象池
 
    std::shared_ptr<MyObject> obj1 = pool.acquire();
    obj1->getId();
 
    pool.release(obj1);
 
    std::shared_ptr<MyObject> obj2 = pool.acquire();
    obj2->getId();
 
    return 0;
}

代码解释：

ObjectPool类模板接受一个类型参数T，表示池中管理的对象类型。
构造函数ObjectPool(size_t size)预先创建size个对象，并将它们放入pool_队列中。这里使用了std::shared_ptr来管理对象的生命周期，避免内存泄漏。
acquire()方法从池中获取一个对象。如果池为空，则创建一个新的对象。
release()方法将对象返回池中。
std::mutex用于保护pool_队列的多线程访问。

2.3 优缺点

优点：

提高性能： 避免了频繁的对象创建和销毁。
减少内存碎片： 对象池中的对象大小固定，减少了内存碎片。

缺点：

内存占用： 对象池会预先分配一定数量的对象，即使这些对象没有被使用，也会占用内存。
适用场景有限： 对象池只适用于管理特定类型的对象。
锁竞争： 使用std::mutex保护多线程访问可能导致锁竞争。

2.4 适用场景

对象创建开销较大： 例如，需要进行复杂的初始化操作或涉及系统调用。
对象频繁创建和销毁： 例如，在游戏开发中，需要频繁创建和销毁游戏对象。
对象类型固定： 对象池只适用于管理特定类型的对象。

3. 定长内存池(Fixed-Size Memory Pool)

3.1 概念

定长内存池是指内存池中的所有内存块大小都相同。它适用于分配固定大小对象的场景。定长内存池的实现通常比较简单，分配和释放速度快，且能有效减少内存碎片。

3.2 实现

下面是一个简单的定长内存池实现示例，使用链表来管理空闲内存块：

 #include <iostream>
#include <cstddef>
#include <new>
 
class FixedSizeAllocator {
public:
    FixedSizeAllocator(size_t blockSize, size_t capacity) : blockSize_(blockSize), capacity_(capacity), memory_(nullptr), freeList_(nullptr) {
        // 计算需要的总内存大小，加上对齐所需的空间
        size_t totalSize = blockSize_ * capacity_;
 
        // 分配原始内存
        memory_ = static_cast<char*>(malloc(totalSize));
        if (!memory_) {
            throw std::bad_alloc();
        }
 
        // 初始化空闲列表
        freeList_ = memory_;
        char* current = memory_;
        for (size_t i = 0; i < capacity_ - 1; ++i) {
            *reinterpret_cast<char**>(current) = current + blockSize_;
            current += blockSize_;
        }
        *reinterpret_cast<char**>(current) = nullptr; // 最后一个块指向nullptr
    }
 
    ~FixedSizeAllocator() {
        free(memory_);
    }
 
    void* allocate() {
        if (!freeList_) {
            return nullptr; // 内存池已满
        }
        void* block = freeList_;
        freeList_ = *reinterpret_cast<char**>(freeList_);
        return block;
    }
 
    void deallocate(void* block) {
        if (!block) return;
        *reinterpret_cast<char**>(block) = freeList_;
        freeList_ = static_cast<char*>(block);
    }
 
private:
    size_t blockSize_;
    size_t capacity_;
    char* memory_;
    char* freeList_;
};
 
// 示例
struct Data {
    int id;
    char name[32];
};
 
int main() {
    FixedSizeAllocator allocator(sizeof(Data), 10); // 分配10个Data大小的内存块
 
    Data* data1 = static_cast<Data*>(allocator.allocate());
    if (data1) {
        data1->id = 1;
        strcpy(data1->name, "Data 1");
        std::cout << "Allocated: id=" << data1->id << ", name=" << data1->name << std::endl;
    }
 
    Data* data2 = static_cast<Data*>(allocator.allocate());
    if (data2) {
        data2->id = 2;
        strcpy(data2->name, "Data 2");
        std::cout << "Allocated: id=" << data2->id << ", name=" << data2->name << std::endl;
    }
 
    allocator.deallocate(data1);
    allocator.deallocate(data2);
 
    return 0;
}

代码解释：

FixedSizeAllocator类接受两个参数：blockSize表示每个内存块的大小，capacity表示内存池的容量。
构造函数FixedSizeAllocator(size_t blockSize, size_t capacity)分配一块大小为blockSize * capacity的内存，并将所有内存块链接成一个链表，freeList_指向链表的头部。
allocate()方法从链表中取出一个空闲内存块，并返回其地址。如果链表为空，则返回nullptr。
deallocate()方法将内存块放回链表中。
使用指针的指针技巧（char**）在内存块内部存储指向下一个空闲块的指针，避免了额外的内存开销。

3.3 优缺点

优点：

分配和释放速度快： 只需要简单的链表操作。
减少内存碎片： 所有内存块大小相同，避免了内存碎片。
实现简单： 代码量少，易于维护。

缺点：

适用场景有限： 只适用于分配固定大小对象的场景。
内存浪费： 如果实际需要的内存块大小小于blockSize，则会造成内存浪费。
线程安全： 上述代码不是线程安全的，需要在多线程环境中使用锁或其他同步机制。

3.4 适用场景

分配固定大小对象： 例如，网络编程中的消息结构体、游戏开发中的游戏对象。
对性能要求较高： 分配和释放操作需要快速完成。
内存碎片敏感： 需要尽量减少内存碎片。

4. 动态内存池(Dynamic Memory Pool)

4.1 概念

动态内存池是指内存池中的内存块大小可以动态调整。它适用于分配大小不确定的对象的场景。动态内存池的实现通常比较复杂，但可以更有效地利用内存。

4.2 实现

实现动态内存池的一种常见方法是使用伙伴系统(Buddy System)。伙伴系统将内存块划分为2的幂次方大小的块，当需要分配内存时，从合适的块中分割出一个；当释放内存时，将相邻的空闲块合并成一个更大的块。下面是一个简单的伙伴系统实现示例：

 #include <iostream>
#include <vector>
#include <cmath>
#include <algorithm>
#include <cassert>
 
class BuddyAllocator {
public:
    BuddyAllocator(size_t totalSize) : totalSize_(totalSize) {
        // 确保总大小是2的幂次方
        size_ = pow(2, ceil(log2(totalSize)));
 
        // 初始化空闲列表，每个元素是一个vector，存储对应大小的空闲块起始地址
        freeLists_.resize(static_cast<size_t>(log2(size_)) + 1);
        freeLists_[static_cast<size_t>(log2(size_))].push_back(0); // 初始时，整个内存块都是空闲的
 
        memory_ = new char[size_];
    }
 
    ~BuddyAllocator() {
        delete[] memory_;
    }
 
    void* allocate(size_t size) {
        // 找到合适的块大小（2的幂次方）
        size_t blockSize = pow(2, ceil(log2(size)));
        size_t blockIndex = static_cast<size_t>(log2(blockSize));
 
        // 查找是否有合适的空闲块
        for (; blockIndex < freeLists_.size(); ++blockIndex) {
            if (!freeLists_[blockIndex].empty()) {
                // 找到空闲块
                size_t address = freeLists_[blockIndex].front();
                freeLists_[blockIndex].erase(freeLists_[blockIndex].begin());
 
                // 分割块，直到达到所需大小
                for (size_t i = blockIndex; i > static_cast<size_t>(log2(blockSize)); --i) {
                    size_t currentSize = pow(2, i);
                    size_t splitAddress = address + currentSize / 2;
                    freeLists_[i - 1].push_back(splitAddress);
                    std::sort(freeLists_[i - 1].begin(), freeLists_[i - 1].end()); // 保持排序，方便合并
                }
 
                return memory_ + address;
            }
        }
 
        // 没有找到合适的空闲块
        return nullptr;
    }
 
    void deallocate(void* ptr, size_t size) {
        if (!ptr) return;
 
        // 计算块大小和地址
        size_t blockSize = pow(2, ceil(log2(size)));
        size_t blockIndex = static_cast<size_t>(log2(blockSize));
        size_t address = static_cast<char*>(ptr) - memory_;
 
        // 合并块
        while (blockIndex < freeLists_.size()) {
            size_t buddyAddress = address ^ static_cast<size_t>(blockSize); // 计算伙伴地址
 
            // 查找伙伴是否空闲
            auto it = std::find(freeLists_[blockIndex].begin(), freeLists_[blockIndex].end(), buddyAddress);
            if (it == freeLists_[blockIndex].end()) {
                // 伙伴不空闲，将当前块加入空闲列表
                freeLists_[blockIndex].push_back(address);
                std::sort(freeLists_[blockIndex].begin(), freeLists_[blockIndex].end());
                return;
            } else {
                // 伙伴空闲，合并块
                freeLists_[blockIndex].erase(it);
                address = std::min(address, buddyAddress); // 取较小的地址作为合并后的地址
                blockSize *= 2;
                blockIndex++;
            }
        }
    }
 
private:
    size_t totalSize_;
    size_t size_;
    char* memory_;
    std::vector<std::vector<size_t>> freeLists_;
};
 
// 示例
int main() {
    BuddyAllocator allocator(1024); // 1KB内存池
 
    void* ptr1 = allocator.allocate(100); // 分配100字节
    void* ptr2 = allocator.allocate(200); // 分配200字节
 
    allocator.deallocate(ptr1, 100); // 释放100字节
    allocator.deallocate(ptr2, 200); // 释放200字节
 
    return 0;
}

代码解释：

BuddyAllocator类接受一个参数totalSize，表示内存池的总大小。
构造函数BuddyAllocator(size_t totalSize)分配一块大小为totalSize的内存，并将所有内存块划分为2的幂次方大小的块，存储在freeLists_中。
allocate(size_t size)方法分配一块大小为size的内存。首先找到合适的块大小（2的幂次方），然后从freeLists_中找到一个空闲块，并分割块，直到达到所需大小。
deallocate(void* ptr, size_t size)方法释放一块大小为size的内存。首先计算块大小和地址，然后合并相邻的空闲块。
freeLists_是一个vector的vector，用于存储空闲块的起始地址。freeLists_[i]存储大小为2ⁱ的空闲块。
伙伴地址的计算使用异或操作：buddyAddress = address ^ blockSize。

4.3 优缺点

优点：

内存利用率高： 可以根据实际需要分配不同大小的内存块。
减少外部碎片： 伙伴系统可以有效地合并空闲块，减少外部碎片。

缺点：

实现复杂： 代码量大，易于出错。
内部碎片： 由于内存块大小必须是2的幂次方，因此可能会造成内部碎片。
性能开销： 分割和合并块需要一定的计算开销。
线程安全： 上述代码不是线程安全的，需要在多线程环境中使用锁或其他同步机制。

4.4 适用场景

分配大小不确定的对象： 例如，字符串、动态数组。
对内存利用率要求较高： 需要尽量减少内存浪费。
可以容忍一定的性能开销： 分割和合并块的开销可以接受。

5. 高并发环境下的内存池优化

在高并发环境下，传统的加锁内存池实现可能会成为性能瓶颈。为了提高并发性能，可以采用以下优化策略：

无锁内存池： 使用原子操作或CAS（Compare and Swap）指令来实现无锁内存池。例如，可以使用无锁队列来管理空闲内存块。
线程局部存储(Thread Local Storage, TLS)： 为每个线程分配一个独立的内存池，避免线程之间的锁竞争。当线程需要分配内存时，首先从自己的内存池中分配；当线程释放内存时，将内存放回自己的内存池。只有当线程自己的内存池空间不足时，才需要从全局内存池中分配。
分级内存池： 将内存池分为多个级别，每个级别管理不同大小的内存块。当需要分配内存时，首先从最小的级别开始查找；如果最小的级别没有空闲块，则从更大的级别查找。这种方式可以减少内存碎片，并提高内存利用率。
批量分配和释放： 一次性分配或释放多个内存块，减少锁的竞争。

6. 性能测试与数据分析

为了比较不同内存池的性能，我们可以进行一些简单的性能测试。例如，我们可以测试在多线程环境下，使用不同内存池分配和释放大量内存块的耗时。以下是一个简单的性能测试示例：

 #include <iostream>
#include <thread>
#include <vector>
#include <chrono>
#include <random>
#include <mutex>
 
// 定义一个简单的结构体
struct TestStruct {
    int id;
    char data[64];
};
 
// 测试函数
template <typename Allocator>
void testAllocator(Allocator& allocator, int numThreads, int numAllocs) {
    std::vector<std::thread> threads;
    std::mutex cout_mutex;
 
    auto start = std::chrono::high_resolution_clock::now();
 
    for (int i = 0; i < numThreads; ++i) {
        threads.emplace_back([&]() {
            std::vector<TestStruct*> allocated;
            for (int j = 0; j < numAllocs; ++j) {
                TestStruct* ptr = static_cast<TestStruct*>(allocator.allocate(sizeof(TestStruct)));
                if (ptr) {
                    allocated.push_back(ptr);
                    ptr->id = j;
                }
            }
 
            // 释放内存
            for (TestStruct* ptr : allocated) {
                allocator.deallocate(ptr, sizeof(TestStruct));
            }
        });
    }
 
    for (auto& thread : threads) {
        thread.join();
    }
 
    auto end = std::chrono::high_resolution_clock::now();
    auto duration = std::chrono::duration_cast<std::chrono::milliseconds>(end - start);
 
    std::lock_guard<std::mutex> lock(cout_mutex);
    std::cout << "Allocator: " << typeid(Allocator).name()
              << ", Threads: " << numThreads
              << ", Allocations: " << numAllocs * numThreads
              << ", Time: " << duration.count() << " ms" << std::endl;
}
 
int main() {
    // 测试参数
    int numThreads = 4;  // 线程数
    int numAllocs = 10000; // 每个线程的分配次数
 
    // 1. 使用new/delete
    class NewDeleteAllocator {
    public:
        void* allocate(size_t size) {
            return new char[size];
        }
        void deallocate(void* ptr, size_t size) {
            delete[] static_cast<char*>(ptr);
        }
    };
    NewDeleteAllocator newDeleteAllocator;
    testAllocator(newDeleteAllocator, numThreads, numAllocs);
 
    // 2. 使用FixedSizeAllocator
    FixedSizeAllocator fixedSizeAllocator(sizeof(TestStruct), numThreads * numAllocs * 2); // 预分配足够的内存
    testAllocator(fixedSizeAllocator, numThreads, numAllocs);
 
    return 0;
}

说明：

上述代码创建了一个简单的结构体TestStruct，并定义了一个测试函数testAllocator，用于测试不同内存池的性能。
testAllocator函数接受一个内存池对象、线程数和每个线程的分配次数作为参数。
在main函数中，分别使用new/delete和FixedSizeAllocator进行测试，并输出测试结果。

性能数据分析：

通过运行上述测试代码，我们可以得到不同内存池的性能数据。一般来说，在多线程环境下，FixedSizeAllocator的性能优于new/delete，因为FixedSizeAllocator避免了频繁的系统调用和锁竞争。但实际性能取决于具体的应用场景和实现方式。建议读者根据自己的实际情况进行性能测试，并选择最适合自己的内存池方案。

7. 总结与建议

本文深入探讨了在高并发场景下C++内存池的设计与实现，重点分析了对象池、定长内存池和动态内存池三种常见的内存池类型，并通过实际代码示例和性能测试数据，帮助读者选择最适合自己应用的内存池方案。以下是一些建议：

选择合适的内存池类型： 根据实际应用场景选择合适的内存池类型。如果需要管理特定类型的对象，且对象创建开销较大，则可以选择对象池；如果需要分配固定大小的对象，且对性能要求较高，则可以选择定长内存池；如果需要分配大小不确定的对象，且对内存利用率要求较高，则可以选择动态内存池。
优化并发性能： 在高并发环境下，需要特别关注内存池的并发性能。可以采用无锁内存池、线程局部存储或分级内存池等优化策略。
进行性能测试： 在实际应用中，需要进行性能测试，以验证内存池的性能是否满足要求。
注意内存泄漏： 在使用内存池时，需要特别注意内存泄漏问题。确保所有分配的内存都得到释放。

希望本文能够帮助读者更好地理解和应用C++内存池技术，从而提高程序的性能和稳定性。

内存管理大师 C++内存池高并发

	#include <iostream>
	#include <queue>
	#include <mutex>
	#include <memory>

	template <typename T>
	class ObjectPool {
	public:
	ObjectPool(size_t size) {
	for (size_t i = 0; i < size; ++i) {
	pool_.push(std::make_shared<T>());
	}
	}

	std::shared_ptr<T> acquire() {
	std::lock_guard<std::mutex> lock(mutex_);
	if (pool_.empty()) {
	// 如果池为空，则创建一个新的对象
	return std::make_shared<T>();
	}
	std::shared_ptr<T> obj = pool_.front();
	pool_.pop();
	return obj;
	}

	void release(std::shared_ptr<T> obj) {
	std::lock_guard<std::mutex> lock(mutex_);
	pool_.push(obj);
	}

	private:
	std::queue<std::shared_ptr<T>> pool_;
	std::mutex mutex_;
	};

	// 示例对象
	class MyObject {
	public:
	MyObject(int id) : id_(id) {
	std::cout << "MyObject created with id: " << id_ << std::endl;
	}
	~MyObject() {
	std::cout << "MyObject destroyed with id: " << id_ << std::endl;
	}

	int getId() const { return id_; }

	private:
	int id_;
	};

	int main() {
	ObjectPool<MyObject> pool(10); // 创建一个包含10个MyObject的对象池

	std::shared_ptr<MyObject> obj1 = pool.acquire();
	obj1->getId();

	pool.release(obj1);

	std::shared_ptr<MyObject> obj2 = pool.acquire();
	obj2->getId();

	return 0;
	}

	#include <iostream>
	#include <cstddef>
	#include <new>

	class FixedSizeAllocator {
	public:
	FixedSizeAllocator(size_t blockSize, size_t capacity) : blockSize_(blockSize), capacity_(capacity), memory_(nullptr), freeList_(nullptr) {
	// 计算需要的总内存大小，加上对齐所需的空间
	size_t totalSize = blockSize_ * capacity_;

	// 分配原始内存
	memory_ = static_cast<char*>(malloc(totalSize));
	if (!memory_) {
	throw std::bad_alloc();
	}

	// 初始化空闲列表
	freeList_ = memory_;
	char* current = memory_;
	for (size_t i = 0; i < capacity_ - 1; ++i) {
	reinterpret_cast<char*>(current) = current + blockSize_;
	current += blockSize_;
	}
	reinterpret_cast<char*>(current) = nullptr; // 最后一个块指向nullptr
	}

	~FixedSizeAllocator() {
	free(memory_);
	}

	void* allocate() {
	if (!freeList_) {
	return nullptr; // 内存池已满
	}
	void* block = freeList_;
	freeList_ = reinterpret_cast<char*>(freeList_);
	return block;
	}

	void deallocate(void* block) {
	if (!block) return;
	reinterpret_cast<char*>(block) = freeList_;
	freeList_ = static_cast<char*>(block);
	}

	private:
	size_t blockSize_;
	size_t capacity_;
	char* memory_;
	char* freeList_;
	};

	// 示例
	struct Data {
	int id;
	char name[32];
	};

	int main() {
	FixedSizeAllocator allocator(sizeof(Data), 10); // 分配10个Data大小的内存块

	Data* data1 = static_cast<Data*>(allocator.allocate());
	if (data1) {
	data1->id = 1;
	strcpy(data1->name, "Data 1");
	std::cout << "Allocated: id=" << data1->id << ", name=" << data1->name << std::endl;
	}

	Data* data2 = static_cast<Data*>(allocator.allocate());
	if (data2) {
	data2->id = 2;
	strcpy(data2->name, "Data 2");
	std::cout << "Allocated: id=" << data2->id << ", name=" << data2->name << std::endl;
	}

	allocator.deallocate(data1);
	allocator.deallocate(data2);

	return 0;
	}

	#include <iostream>
	#include <vector>
	#include <cmath>
	#include <algorithm>
	#include <cassert>

	class BuddyAllocator {
	public:
	BuddyAllocator(size_t totalSize) : totalSize_(totalSize) {
	// 确保总大小是2的幂次方
	size_ = pow(2, ceil(log2(totalSize)));

	// 初始化空闲列表，每个元素是一个vector，存储对应大小的空闲块起始地址
	freeLists_.resize(static_cast<size_t>(log2(size_)) + 1);
	freeLists_[static_cast<size_t>(log2(size_))].push_back(0); // 初始时，整个内存块都是空闲的

	memory_ = new char[size_];
	}

	~BuddyAllocator() {
	delete[] memory_;
	}

	void* allocate(size_t size) {
	// 找到合适的块大小（2的幂次方）
	size_t blockSize = pow(2, ceil(log2(size)));
	size_t blockIndex = static_cast<size_t>(log2(blockSize));

	// 查找是否有合适的空闲块
	for (; blockIndex < freeLists_.size(); ++blockIndex) {
	if (!freeLists_[blockIndex].empty()) {
	// 找到空闲块
	size_t address = freeLists_[blockIndex].front();
	freeLists_[blockIndex].erase(freeLists_[blockIndex].begin());

	// 分割块，直到达到所需大小
	for (size_t i = blockIndex; i > static_cast<size_t>(log2(blockSize)); --i) {
	size_t currentSize = pow(2, i);
	size_t splitAddress = address + currentSize / 2;
	freeLists_[i - 1].push_back(splitAddress);
	std::sort(freeLists_[i - 1].begin(), freeLists_[i - 1].end()); // 保持排序，方便合并
	}

	return memory_ + address;
	}
	}

	// 没有找到合适的空闲块
	return nullptr;
	}

	void deallocate(void* ptr, size_t size) {
	if (!ptr) return;

	// 计算块大小和地址
	size_t blockSize = pow(2, ceil(log2(size)));
	size_t blockIndex = static_cast<size_t>(log2(blockSize));
	size_t address = static_cast<char*>(ptr) - memory_;

	// 合并块
	while (blockIndex < freeLists_.size()) {
	size_t buddyAddress = address ^ static_cast<size_t>(blockSize); // 计算伙伴地址

	// 查找伙伴是否空闲
	auto it = std::find(freeLists_[blockIndex].begin(), freeLists_[blockIndex].end(), buddyAddress);
	if (it == freeLists_[blockIndex].end()) {
	// 伙伴不空闲，将当前块加入空闲列表
	freeLists_[blockIndex].push_back(address);
	std::sort(freeLists_[blockIndex].begin(), freeLists_[blockIndex].end());
	return;
	} else {
	// 伙伴空闲，合并块
	freeLists_[blockIndex].erase(it);
	address = std::min(address, buddyAddress); // 取较小的地址作为合并后的地址
	blockSize *= 2;
	blockIndex++;
	}
	}
	}

	private:
	size_t totalSize_;
	size_t size_;
	char* memory_;
	std::vector<std::vector<size_t>> freeLists_;
	};

	// 示例
	int main() {
	BuddyAllocator allocator(1024); // 1KB内存池

	void* ptr1 = allocator.allocate(100); // 分配100字节
	void* ptr2 = allocator.allocate(200); // 分配200字节

	allocator.deallocate(ptr1, 100); // 释放100字节
	allocator.deallocate(ptr2, 200); // 释放200字节

	return 0;
	}

	#include <iostream>
	#include <thread>
	#include <vector>
	#include <chrono>
	#include <random>
	#include <mutex>

	// 定义一个简单的结构体
	struct TestStruct {
	int id;
	char data[64];
	};

	// 测试函数
	template <typename Allocator>
	void testAllocator(Allocator& allocator, int numThreads, int numAllocs) {
	std::vector<std::thread> threads;
	std::mutex cout_mutex;

	auto start = std::chrono::high_resolution_clock::now();

	for (int i = 0; i < numThreads; ++i) {
	threads.emplace_back([&]() {
	std::vector<TestStruct*> allocated;
	for (int j = 0; j < numAllocs; ++j) {
	TestStruct* ptr = static_cast<TestStruct*>(allocator.allocate(sizeof(TestStruct)));
	if (ptr) {
	allocated.push_back(ptr);
	ptr->id = j;
	}
	}

	// 释放内存
	for (TestStruct* ptr : allocated) {
	allocator.deallocate(ptr, sizeof(TestStruct));
	}
	});
	}

	for (auto& thread : threads) {
	thread.join();
	}

	auto end = std::chrono::high_resolution_clock::now();
	auto duration = std::chrono::duration_cast<std::chrono::milliseconds>(end - start);

	std::lock_guard<std::mutex> lock(cout_mutex);
	std::cout << "Allocator: " << typeid(Allocator).name()
	<< ", Threads: " << numThreads
	<< ", Allocations: " << numAllocs * numThreads
	<< ", Time: " << duration.count() << " ms" << std::endl;
	}

	int main() {
	// 测试参数
	int numThreads = 4; // 线程数
	int numAllocs = 10000; // 每个线程的分配次数

	// 1. 使用new/delete
	class NewDeleteAllocator {
	public:
	void* allocate(size_t size) {
	return new char[size];
	}
	void deallocate(void* ptr, size_t size) {
	delete[] static_cast<char*>(ptr);
	}
	};
	NewDeleteAllocator newDeleteAllocator;
	testAllocator(newDeleteAllocator, numThreads, numAllocs);

	// 2. 使用FixedSizeAllocator
	FixedSizeAllocator fixedSizeAllocator(sizeof(TestStruct), numThreads * numAllocs * 2); // 预分配足够的内存
	testAllocator(fixedSizeAllocator, numThreads, numAllocs);

	return 0;
	}

C++高并发内存池设计：对象池、定长与动态内存池的性能分析与实战

1. 为什么需要内存池？

2. 对象池(Object Pool)

2.1 概念

2.2 实现

2.3 优缺点

2.4 适用场景

3. 定长内存池(Fixed-Size Memory Pool)

3.1 概念

3.2 实现

3.3 优缺点

3.4 适用场景

4. 动态内存池(Dynamic Memory Pool)

4.1 概念

4.2 实现

4.3 优缺点

4.4 适用场景

5. 高并发环境下的内存池优化

6. 性能测试与数据分析

7. 总结与建议

1. 为什么需要内存池？

2. 对象池(Object Pool)

2.1 概念

2.2 实现

2.3 优缺点

2.4 适用场景

3. 定长内存池(Fixed-Size Memory Pool)

3.1 概念

3.2 实现

3.3 优缺点

3.4 适用场景

4. 动态内存池(Dynamic Memory Pool)

4.1 概念

4.2 实现

4.3 优缺点

4.4 适用场景

5. 高并发环境下的内存池优化

6. 性能测试与数据分析

7. 总结与建议

评论点评