Node.js 多线程实战：Worker Threads、SharedArrayBuffer 与 Atomics 优化斐波那契数列计算

2025/3/10 11:09:43 2222 0 0 0

你好！在日常开发中，你是否遇到过一些计算密集型的任务，导致 Node.js 应用出现卡顿、响应慢的情况？别担心，今天咱们就来聊聊如何利用 Node.js 的多线程技术来解决这个问题。我会通过一个计算斐波那契数列的例子，带你一步步了解 Worker Threads、SharedArrayBuffer 和 Atomics 这三个工具，并看看它们是如何提升性能的。

为什么需要多线程？

在深入了解 Node.js 多线程之前，我们先来回顾一下 JavaScript 的单线程特性。JavaScript 的单线程模型意味着在同一时刻，只能执行一个任务。对于 I/O 密集型任务（如网络请求、文件读写），Node.js 通过事件循环和异步操作可以很好地处理。但是，当遇到 CPU 密集型任务（如大量计算、复杂算法）时，单线程就会成为瓶颈，导致整个应用阻塞。

想象一下，如果你的服务器需要处理大量的数学计算，或者进行复杂的图像处理，单线程模型会让用户请求排起长队，严重影响用户体验。这时候，多线程就派上用场了。多线程允许我们同时执行多个任务，充分利用多核 CPU 的计算能力，从而提高应用的吞吐量和响应速度。

Node.js 多线程工具介绍

Node.js 从 v10.5.0 开始引入了 worker_threads 模块，提供了原生的多线程支持。让我们来看看实现多线程的几个关键工具：

1. Worker Threads

Worker Threads 是 Node.js 实现多线程的核心。它允许我们创建新的线程，并在这些线程中执行 JavaScript 代码。每个 Worker 线程都有自己独立的 JavaScript 引擎实例（V8 实例），这意味着它们拥有独立的上下文和内存空间。这与传统的子进程（child_process）不同，子进程之间是完全隔离的，而 Worker 线程之间可以共享内存（通过 SharedArrayBuffer），从而降低了线程间通信的开销。

2. SharedArrayBuffer

SharedArrayBuffer 是一种特殊的数组缓冲区，它可以在多个 Worker 线程之间共享。这意味着一个线程对 SharedArrayBuffer 的修改，对其他线程是可见的。这为线程间高效的数据交换提供了可能。但是，直接操作共享内存可能会导致数据竞争问题，因此我们需要 Atomics 来保证操作的原子性。

3. Atomics

Atomics 对象提供了一组静态方法，用于对 SharedArrayBuffer 进行原子操作。原子操作是指不会被线程调度机制中断的操作，要么完全执行，要么完全不执行。这确保了在多线程环境下，对共享内存的访问是安全可靠的。常用的 Atomics 方法包括：

Atomics.load()：读取共享内存中的值。
Atomics.store()：向共享内存中写入值。
Atomics.add()：将共享内存中的值与给定值相加。
Atomics.sub()：将共享内存中的值与给定值相减。
Atomics.compareExchange()：比较共享内存中的值与预期值，如果相等则替换为新值。
Atomics.wait()：在共享内存的指定位置等待，直到被唤醒。
Atomics.notify()：唤醒在共享内存的指定位置等待的线程。

斐波那契数列计算案例

理论知识讲完了，接下来我们通过一个具体的例子来演示如何使用这些工具。我们将计算斐波那契数列的第 n 项。斐波那契数列是一个经典的递归问题，但递归实现效率较低，容易导致栈溢出。我们将采用迭代的方式，并利用多线程来加速计算。

1. 单线程版本

首先，我们来看一下单线程版本的实现：

// fibonacci.js
function fibonacci(n) {
  if (n <= 1) {
    return n;
  }
  let a = 0;
  let b = 1;
  for (let i = 2; i <= n; i++) {
    const temp = a + b;
    a = b;
    b = temp;
  }
  return b;
}

const n = 40; // 计算第 40 项
const startTime = Date.now();
const result = fibonacci(n);
const endTime = Date.now();

console.log(`斐波那契数列第 ${n} 项：${result}`);
console.log(`单线程耗时：${endTime - startTime} 毫秒`);

运行这段代码，你会看到计算结果和耗时。当 n 较大时，计算时间会明显增加。

2. 多线程版本

接下来，我们使用 Worker Threads 来实现多线程版本。我们将把计算任务分成多个子任务，每个子任务分配给一个 Worker 线程。这里为了演示，我们假设将任务拆分给4个worker。（实际拆分策略取决于你的CPU核心数以及任务的特性）

首先，创建一个 worker.js 文件，用于定义 Worker 线程执行的任务：

// worker.js
const { parentPort, workerData } = require('worker_threads');

function fibonacci(n) {
  if (n <= 1) {
    return n;
  }
  let a = 0;
  let b = 1;
  for (let i = 2; i <= n; i++) {
    const temp = a + b;
    a = b;
    b = temp;
  }
  return b;
}

// 接收主线程传递的数据
const { start, end } = workerData;
const results = [];

// 计算子任务的结果
for (let i = start; i <= end; i++) {
  results.push(fibonacci(i));
}

// 将结果发送给主线程
parentPort.postMessage(results);

然后，创建主线程文件 main.js：

// main.js
const { Worker } = require('worker_threads');

const numWorkers = 4; // 线程数
const n = 40; // 计算第 40 项
const segmentSize = Math.floor(n / numWorkers);

const workers = [];
let results = [];
let completedWorkers = 0;

const startTime = Date.now();

// 创建 Worker 线程
for (let i = 0; i < numWorkers; i++) {
  const start = i * segmentSize + 1;
  const end = i === numWorkers - 1 ? n : (i + 1) * segmentSize;
  const worker = new Worker('./worker.js', {
    workerData: { start, end },
  });

  workers.push(worker);

  // 监听 Worker 线程的消息
  worker.on('message', (partialResults) => {
    results = results.concat(partialResults);
    completedWorkers++;

    // 所有 Worker 线程完成
    if (completedWorkers === numWorkers) {
      const endTime = Date.now();
      // 结果已经按顺序排列，直接取最后一项即可。
      console.log(`斐波那契数列第 ${n} 项：${results[results.length-1]}`);
      console.log(`多线程耗时：${endTime - startTime} 毫秒`);

      // 终止所有 Worker 线程
      workers.forEach(worker => worker.terminate());
    }
  });

  worker.on('error', (err) => {
    console.error('Worker error:', err);
  });

  worker.on('exit', (code) => {
    if (code !== 0) {
      console.error(`Worker stopped with exit code ${code}`);
    }
  });
}

在这个例子中，我们将计算任务分配给 4 个 Worker 线程。每个线程计算一部分结果，然后通过 parentPort.postMessage() 将结果发送回主线程。主线程收集所有子任务的结果，并最终得到斐波那契数列的第 n 项。运行后比较多线程和单线程版本的时间。

3. 使用 SharedArrayBuffer 和 Atomics (进阶)

上面的多线程版本中，Worker 线程之间通过消息传递来交换数据。虽然这种方式比较简单，但在数据量较大时，消息传递的开销可能会成为瓶颈。我们可以使用 SharedArrayBuffer 和 Atomics 来进一步优化。

修改 worker.js：

// worker.js (SharedArrayBuffer 版本)
const { parentPort, workerData } = require('worker_threads');
const { sharedBuffer, start, end } = workerData;
const sharedArray = new Int32Array(sharedBuffer);

function fibonacci(n) {
    if (n <= 1) {
        return n;
    }
    let a = 0;
    let b = 1;
    for (let i = 2; i <= n; i++) {
        const temp = a + b;
        a = b;
        b = temp;
    }
    return b;
}

for (let i = start; i <= end; i++) {
  const result = fibonacci(i);
  Atomics.store(sharedArray, i, result); //原子操作
}

parentPort.postMessage('done');

修改 main.js：

// main.js (SharedArrayBuffer 版本)
const { Worker } = require('worker_threads');

const numWorkers = 4;
const n = 40;
const segmentSize = Math.floor(n / numWorkers);

// 创建 SharedArrayBuffer
const sharedBuffer = new SharedArrayBuffer((n + 1) * Int32Array.BYTES_PER_ELEMENT); //+1 避免越界
const sharedArray = new Int32Array(sharedBuffer);

const workers = [];
let completedWorkers = 0;

const startTime = Date.now();

for (let i = 0; i < numWorkers; i++) {
  const start = i * segmentSize + 1;
  const end = i === numWorkers - 1 ? n : (i + 1) * segmentSize;

  const worker = new Worker('./worker.js', {
    workerData: { sharedBuffer, start, end },
  });
  workers.push(worker);

  worker.on('message', () => {
    completedWorkers++;
    if (completedWorkers === numWorkers) {
      const endTime = Date.now();
      console.log(`斐波那契数列第 ${n} 项：${Atomics.load(sharedArray,n)}`);
      console.log(`多线程 (SharedArrayBuffer) 耗时：${endTime - startTime} 毫秒`);
      workers.forEach(worker => worker.terminate());
    }
  });

   worker.on('error', (err) => {
    console.error('Worker error:', err);
  });

  worker.on('exit', (code) => {
    if (code !== 0) {
      console.error(`Worker stopped with exit code ${code}`);
    }
  });
}

在这个版本中，我们创建了一个 SharedArrayBuffer，并在主线程和 Worker 线程之间共享。Worker 线程计算完结果后，通过 Atomics.store() 将结果写入共享数组的相应位置。主线程通过Atomics.load()读取结果。由于使用了共享内存，避免了消息传递的开销，理论上性能会更好。再次运行，比较时间。

总结与注意事项

通过这个斐波那契数列的例子，相信你已经对 Node.js 多线程有了一定的了解。Worker Threads、SharedArrayBuffer 和 Atomics 为我们提供了强大的工具来处理计算密集型任务，提高应用的性能。

最后，提醒你一些注意事项：

并非所有场景都适合多线程： 多线程主要适用于 CPU 密集型任务。对于 I/O 密集型任务，Node.js 的异步机制已经足够高效。盲目使用多线程反而可能增加开销。
注意线程同步： 当多个线程访问共享资源时，要注意线程同步，避免数据竞争。Atomics 对象提供了一些原子操作，但更复杂的同步需求可能需要使用其他机制（如互斥锁）。
合理分配任务： 将任务合理地分配给多个线程，可以最大程度地利用 CPU 资源。分配策略需要根据具体情况进行调整。
线程创建和销毁的开销： 创建和销毁线程是有开销的，因此在实际应用中，可以考虑使用线程池来复用线程，减少开销。
调试： 多线程程序的调试比单线程程序更复杂。Node.js 提供了一些调试工具，可以帮助你定位问题。

希望这篇文章能帮助你更好地理解和应用 Node.js 多线程技术。如果你有任何问题或者想法，欢迎在评论区留言讨论！

技术小旋风 Node.js 多线程性能优化