Rust与C/C++跨语言内存交互：安全与陷阱

2025/3/12 17:09:30 500 0 0 0

当你踏入跨语言编程的领域，特别是 Rust 和 C/C++ 这种涉及手动和自动内存管理的语言交互时，内存管理就成了你必须直面的“拦路虎”。今天，咱们就来聊聊这个话题，我会尽量用大白话，把这事儿掰开了揉碎了讲清楚。

为什么会有跨语言调用？

在聊具体怎么做之前，咱们先得搞明白，为啥要费劲巴拉地搞跨语言调用？

历史遗留问题：很多老牌项目，核心部分是用 C/C++ 写的，稳定高效，但开发效率不高。现在想用 Rust 加点新功能，或者逐步替换老代码，直接全盘重写？不现实，风险太大。所以，跨语言调用就成了“站在巨人肩膀上”的现实选择。
性能考量：某些对性能要求“变态”的场景，比如游戏引擎、图形处理、底层系统库，C/C++ 依然是“老大哥”。Rust 虽然也很快，但在某些极端情况下，可能还差那么一丢丢。这时候，把最核心的部分用 C/C++ 写，其他部分用 Rust，就能兼顾性能和开发效率。
生态借力：C/C++ 的生态那叫一个“枝繁叶茂”，各种库应有尽有。Rust 虽然发展迅猛，但有些领域还是“小树苗”。想用某个 C/C++ 库？跨语言调用，拿来就用！

Rust 和 C/C++ 内存管理的“爱恨情仇”

要说 Rust 和 C/C++ 的内存管理，那真是“剪不断，理还乱”。

C/C++：手动挡，自由，也容易翻车
C/C++ 把内存管理的“方向盘”完全交给了程序员。你可以自由地申请、释放内存，但稍有不慎，就会“车毁人亡”：
- 内存泄漏：申请了内存，忘了释放，就像“开了水龙头忘了关”，时间长了，内存就“淹”了。
- 悬垂指针：内存已经释放了，还拿着指向它的指针不放，就像“拿着过期的船票登船”，后果不堪设想。
- 重复释放：同一块内存，释放两次，就像“把同一张票撕两次”，直接“系统崩溃”。
- 缓冲区溢出：往“小杯子”里倒“大桶水”，溢出的部分可能会“污染”其他数据。
Rust：自动挡，安全，但有时也“憋屈”
Rust 的内存管理，就像“自动挡汽车”，它通过所有权、借用、生命周期等机制，在编译阶段就帮你把大部分内存错误“扼杀在摇篮里”。
- 所有权：每个值都有一个“主人”（变量），“主人”没了，值也就没了（内存被释放）。
- 借用：可以“借”值来用，但不能“抢”走“所有权”。
- 生命周期：“借”来的东西，不能比“主人”活得还久。
  Rust 的这些机制，保证了绝大多数情况下的内存安全。但有时候，为了实现某些功能，你可能需要“绕过”这些规则，这时候就要用到 unsafe 代码块，这就有点像“切换到手动挡”，需要你格外小心。

跨语言内存交互的“雷区”

当 Rust 和 C/C++ 代码“手拉手”的时候，内存管理的“雷区”就更多了。

内存分配权的归属：谁申请的内存，谁负责释放？这是跨语言内存交互的“灵魂拷问”。
- C/C++ 申请，Rust 释放：这通常不是个好主意。因为 Rust 编译器无法追踪 C/C++ 代码中的内存分配情况，也就无法保证在正确的时间释放内存。除非你对 C/C++ 代码有绝对的控制权，并且能保证内存的正确释放，否则，尽量避免这种做法。
- Rust 申请，C/C++ 释放：这比上一种情况要好一些，但仍然存在风险。你需要确保 C/C++ 代码在释放内存之前，Rust 代码已经不再使用这块内存。否则，就会出现悬垂指针。
- 谁申请，谁释放：这是最安全、最推荐的做法。在 Rust 中，你可以使用 Box、Vec 等类型来管理内存，然后在 C/C++ 中使用相应的函数来释放。或者，你可以在 C/C++ 中申请内存，然后在 Rust 中使用 unsafe 代码块来操作这块内存，并在 unsafe 代码块结束时，调用 C/C++ 的释放函数。
数据类型的一致性：Rust 和 C/C++ 的数据类型，并不是一一对应的。比如，Rust 的 String 类型，在 C/C++ 中并没有直接对应的类型。如果你直接把 String 传递给 C/C++ 函数，就会出现“鸡同鸭讲”的情况。
- 使用原始指针：这是最直接、也最“危险”的方式。你可以把 Rust 的数据类型转换为原始指针，然后传递给 C/C++ 函数。但是，你必须确保 C/C++ 代码不会修改 Rust 的数据结构，否则，就会破坏 Rust 的内存安全保证。
- 使用中间类型：比如，你可以把 Rust 的 String 转换为 C 风格的字符串（*const c_char），然后传递给 C/C++ 函数。在 C/C++ 中，你可以使用 strlen、strcpy 等函数来操作这个字符串。但是，你必须确保 C/C++ 代码不会越界访问，否则，就会出现缓冲区溢出。
- 使用 FFI 库：比如，cbindgen 可以根据 Rust 代码自动生成 C/C++ 头文件，bindgen 可以根据 C/C++ 头文件自动生成 Rust 代码。这些库可以帮你处理数据类型的转换，减少出错的可能性。
异常处理：C++ 有异常，Rust 有 panic。这俩“不是一家人，不进一家门”。
- C++ 异常：如果在 C++ 代码中抛出异常，Rust 代码是无法捕获的。这会导致程序直接崩溃。
- Rust panic：如果在 Rust 代码中发生 panic，C++ 代码也无法捕获。这同样会导致程序崩溃。
- 解决方案：在跨语言调用的边界，尽量避免使用异常和 panic。可以使用返回值来表示错误，比如，Rust 的 Result 类型，C/C++ 的错误码。

实战演练：Rust 与 C/C++ 内存交互的正确姿势

说了这么多，咱们来点实际的。

场景一：Rust 调用 C/C++ 库，传递字符串

假设我们有一个 C/C++ 函数，它接受一个字符串作为参数：

// mylib.h
#ifndef MYLIB_H
#define MYLIB_H

#include <stdio.h>

void print_string(const char *str);

#endif

// mylib.c
#include "mylib.h"

void print_string(const char *str) {
 printf("C/C++ says: %s\n", str);
}

现在，我们想在 Rust 中调用这个函数。

// main.rs
use std::ffi::CString;
use std::os::raw::c_char;

#[link(name = "mylib")]
extern "C" {
 fn print_string(str: *const c_char);
}

fn main() {
 let rust_str = "Hello from Rust!";

 // 将 Rust 字符串转换为 C 风格字符串
 let c_str = CString::new(rust_str).unwrap();

 // 将 C 风格字符串的指针传递给 C/C++ 函数
 unsafe {
 print_string(c_str.as_ptr());
 }
}

在这个例子中，我们使用了 std::ffi::CString 类型来将 Rust 字符串转换为 C 风格字符串。CString 会在堆上分配一块内存，并将 Rust 字符串复制到这块内存中。然后，我们使用 as_ptr() 方法获取这块内存的指针，并将其传递给 C/C++ 函数。由于 CString 实现了 Drop trait，所以当 CString 生命周期结束时，这块内存会自动被释放。

场景二：C/C++ 调用 Rust 库，返回动态分配的内存

假设我们有一个 Rust 函数，它创建一个字符串，并返回它的指针：

// lib.rs
use std::ffi::CString;
use std::os::raw::c_char;

#[no_mangle]
pub extern "C" fn create_string() -> *mut c_char {
 let rust_str = "Hello from Rust!".to_string();
 let c_str = CString::new(rust_str).unwrap();
 c_str.into_raw()
}

#[no_mangle]
pub extern "C" fn free_string(str: *mut c_char) {
 if str.is_null() {
 return;
 }
 unsafe {
 CString::from_raw(str);
 }
}

在 C/C++ 中，我们可以这样调用这个函数：

// main.c
#include <stdio.h>
#include <stdlib.h>

char* create_string();
void free_string(char* str);

int main() {
 char* str = create_string();
 printf("C/C++ says: %s\n", str);
 free_string(str);
 return 0;
}

在这个例子中, into_raw 会转移CString的所有权到C中，因此我们需要手动写一个free_string函数来避免内存泄露。

总结

Rust 和 C/C++ 的跨语言内存交互，是一项“技术活”，也是一项“细心活”。你需要对两种语言的内存管理机制都有深入的理解，才能避免“踩坑”。

记住这几点：

明确内存分配的责任：谁申请，谁释放。
谨慎处理数据类型：使用原始指针、中间类型或 FFI 库。
避免异常和 panic：使用返回值来表示错误。
多测试，多验证：确保你的代码在各种情况下都能正常工作。

希望这篇文章能帮到你。如果你还有其他问题，欢迎留言讨论。

铁头程序猿 Rust C/C++FFI

Rust与C/C++跨语言内存交互：安全与陷阱

为什么会有跨语言调用？

Rust 和 C/C++ 内存管理的“爱恨情仇”

跨语言内存交互的“雷区”

实战演练：Rust 与 C/C++ 内存交互的正确姿势

总结

评论点评