C++20 Ranges库深度剖析：从原理到自定义实现

2025/4/30 19:43:57 101 0 0 0

为什么要深入 Ranges 库？

Ranges 库的核心概念

Range 的内部结构

View 的内部结构

Algorithm 的内部结构

算法复杂度分析

自定义 Range 和 View

自定义 Range

自定义 View

总结

C++20 引入的 Ranges 库，无疑是现代 C++ 的一个重要里程碑。它提供了一种全新的、更简洁、更高效的方式来处理数据集合。但你是否真正了解 Ranges 库背后的运作机制？如何才能最大限度地利用它，甚至根据自己的需求进行定制？本文将带你深入 Ranges 库的底层实现，探索 range, view 和 algorithm 的内部结构，分析算法复杂度，并最终教你如何自定义 range 和 view。准备好了吗？让我们开始这段探索之旅！

为什么要深入 Ranges 库？

对于一名追求卓越的 C++ 开发者来说，仅仅停留在使用层面是远远不够的。理解 Ranges 库的底层原理，能让你：

写出更高效的代码：了解不同 view 的性能特性，选择最适合的 view，避免不必要的性能损耗。
更好地调试代码：当遇到 Ranges 库相关的 bug 时，能够更快速地定位问题，并找到解决方案。
扩展 Ranges 库的功能：根据自己的需求，自定义 range 和 view，让 Ranges 库更好地服务于你的项目。
提升你的 C++ 水平：深入学习 Ranges 库，能让你对 C++ 的模板元编程、类型推导等高级特性有更深刻的理解。

Ranges 库的核心概念

在深入底层实现之前，我们先来回顾一下 Ranges 库的几个核心概念：

Range：一个 range 代表一个可以迭代的元素序列。它可以是容器（如 std::vector, std::list），也可以是容器的一部分，甚至是一个由算法动态生成的序列。
View：一个 view 是一个轻量级的 range，它提供了一种观察 range 的方式，而不需要复制 range 中的数据。view 可以对 range 进行过滤、转换、组合等操作。
Algorithm： Ranges 库提供了一系列算法，可以对 range 进行各种操作，如排序、查找、转换等。这些算法与传统的 STL 算法类似，但它们可以直接操作 range，而不需要使用迭代器。

Range 的内部结构

Range 本质上是一个概念，它要求类型满足一定的条件。这些条件主要体现在以下几个方面：

begin() 和 end() 成员函数或自由函数： Range 必须提供 begin() 和 end() 函数，用于返回指向序列起始和结束位置的迭代器。这些函数可以是成员函数，也可以是自由函数，通过 ADL (Argument Dependent Lookup) 查找。
迭代器类型： Range 的 begin() 函数返回的迭代器类型必须满足一定的迭代器概念，如 InputIterator, OutputIterator, ForwardIterator, BidirectionalIterator, RandomAccessIterator 等。不同的迭代器概念支持不同的操作，如读取、写入、前进、后退、随机访问等。
哨兵 (Sentinel)： Range 的 end() 函数可以返回一个迭代器，也可以返回一个哨兵。哨兵是一个可以与迭代器进行比较的对象，用于判断是否到达序列的末尾。使用哨兵可以提高灵活性，例如，可以用于表示一个无限序列。

C++20 中引入了 std::ranges::range 概念，可以用于检查一个类型是否满足 range 的要求：

 #include <iostream>
#include <vector>
#include <ranges>
 
template <typename T>
concept MyRange = std::ranges::range<T>;
 
int main() {
    std::vector<int> v = {1, 2, 3, 4, 5};
    std::cout << MyRange<decltype(v)> << std::endl; // 输出 1，表示 std::vector 满足 range 的要求
    int arr[] = {1, 2, 3, 4, 5};
    std::cout << MyRange<decltype(arr)> << std::endl; // 输出 1，表示数组也满足 range 的要求
    return 0;
}

View 的内部结构

View 是 Ranges 库中最核心的概念之一。它提供了一种惰性求值 (lazy evaluation) 的机制，可以对 range 进行各种转换，而不需要立即执行。这意味着，只有在真正需要访问 view 中的元素时，才会进行计算。

View 通常由一个或多个 range 和一些转换函数组成。例如，std::views::filter view 接收一个 range 和一个谓词 (predicate) 函数，用于过滤 range 中的元素。std::views::transform view 接收一个 range 和一个转换函数，用于将 range 中的元素转换为另一种类型。

View 的实现通常涉及以下几个关键技术：

迭代器适配器 (Iterator Adapter)： View 通常会使用迭代器适配器来修改底层 range 的迭代器行为。例如，std::views::filter view 会创建一个新的迭代器，该迭代器只返回满足谓词条件的元素。std::views::transform view 会创建一个新的迭代器，该迭代器返回转换后的元素。
惰性求值 (Lazy Evaluation)： View 的转换操作通常是惰性求值的。这意味着，只有在真正需要访问 view 中的元素时，才会执行转换操作。这可以避免不必要的计算，提高性能。
缓存 (Cache)：为了避免重复计算，View 可能会缓存一些计算结果。例如，std::views::drop view 会缓存已经跳过的元素数量。std::views::take view 会缓存已经获取的元素数量。

让我们以 std::views::filter 为例，来深入了解 view 的内部结构：

 #include <iostream>
#include <vector>
#include <ranges>
 
int main() {
    std::vector<int> v = {1, 2, 3, 4, 5, 6, 7, 8, 9, 10};
 
    // 创建一个 view，只保留偶数
    auto even_view = std::views::filter(v, [](int x) { return x % 2 == 0; });
 
    // 打印 view 中的元素
    for (int x : even_view) {
        std::cout << x << " "; // 输出 2 4 6 8 10
    }
    std::cout << std::endl;
 
    return 0;
}

在这个例子中，even_view 是一个 std::views::filter view，它接收一个 std::vector<int> 类型的 range v 和一个 lambda 表达式 [](int x) { return x % 2 == 0; } 作为谓词。even_view 内部会创建一个迭代器适配器，该适配器会跳过 v 中所有不满足谓词条件的元素，只返回偶数。只有在循环遍历 even_view 时，才会真正执行过滤操作。

Algorithm 的内部结构

Ranges 库提供了一系列算法，可以对 range 进行各种操作。这些算法与传统的 STL 算法类似，但它们可以直接操作 range，而不需要使用迭代器。这使得代码更加简洁易读。

Ranges 库的算法通常使用以下几种技术：

Concepts： Ranges 库使用 concepts 来约束算法的参数类型。例如，std::ranges::sort 算法要求 range 的迭代器类型满足 std::random_access_iterator 概念。这可以确保算法只能用于支持随机访问的 range。
迭代器操作： Ranges 库的算法通常使用迭代器来遍历 range 中的元素。它们会根据 range 的迭代器类型选择最合适的迭代器操作。例如，如果 range 的迭代器类型是 std::random_access_iterator，则算法可以使用下标运算符 [] 来随机访问元素。如果 range 的迭代器类型是 std::forward_iterator，则算法只能使用 ++ 运算符来顺序访问元素。
算法优化： Ranges 库的算法通常会进行各种优化，以提高性能。例如，std::ranges::sort 算法会根据 range 的大小选择不同的排序算法。对于小 range，它会使用插入排序。对于大 range，它会使用快速排序或归并排序。

让我们以 std::ranges::sort 为例，来深入了解算法的内部结构：

 #include <iostream>
#include <vector>
#include <ranges>
#include <algorithm>
 
int main() {
    std::vector<int> v = {5, 2, 8, 1, 9, 4, 7, 3, 6};
 
    // 对 range 进行排序
    std::ranges::sort(v);
 
    // 打印排序后的元素
    for (int x : v) {
        std::cout << x << " "; // 输出 1 2 3 4 5 6 7 8 9
    }
    std::cout << std::endl;
 
    return 0;
}

在这个例子中，std::ranges::sort 算法直接对 std::vector<int> 类型的 range v 进行排序。std::ranges::sort 内部会检查 v 的迭代器类型是否满足 std::random_access_iterator 概念。如果满足，则它会根据 v 的大小选择合适的排序算法。如果 v 比较小，则它会使用插入排序。如果 v 比较大，则它会使用快速排序或归并排序。

算法复杂度分析

理解 Ranges 库的算法复杂度对于编写高效的代码至关重要。不同的算法具有不同的时间复杂度和空间复杂度。选择最适合的算法可以显著提高程序的性能。

以下是一些常用的 Ranges 库算法的复杂度分析：

std::ranges::sort：时间复杂度为 O(N log N)，空间复杂度为 O(log N) (快速排序) 或 O(N) (归并排序)。
std::ranges::find：时间复杂度为 O(N)，空间复杂度为 O(1)。
std::ranges::copy：时间复杂度为 O(N)，空间复杂度为 O(1)。
std::ranges::transform：时间复杂度为 O(N)，空间复杂度为 O(1)。
std::ranges::filter：时间复杂度为 O(N)，空间复杂度为 O(1)。

需要注意的是，view 的复杂度取决于其内部的转换操作。例如，std::views::filter view 的复杂度为 O(N)，因为它需要遍历整个 range 来找到满足条件的元素。std::views::transform view 的复杂度也为 O(N)，因为它需要对 range 中的每个元素进行转换。

在选择算法和 view 时，需要权衡其时间复杂度和空间复杂度，选择最适合的方案。

自定义 Range 和 View

Ranges 库的强大之处在于其可扩展性。你可以根据自己的需求，自定义 range 和 view，以满足特定的应用场景。

自定义 Range

要自定义 range，你需要创建一个类，该类满足 std::ranges::range 概念的要求。这意味着，该类需要提供 begin() 和 end() 成员函数或自由函数，并且这些函数返回的迭代器类型需要满足一定的迭代器概念。

例如，我们可以自定义一个 IntegerRange 类，该类表示一个整数序列：

 #include <iostream>
#include <ranges>
 
class IntegerRange {
public:
    IntegerRange(int start, int end) : start_(start), end_(end) {}
 
    class Iterator {
    public:
        Iterator(int value) : value_(value) {}
 
        int operator*() const { return value_; }
 
        Iterator& operator++() {
            ++value_;
            return *this;
        }
 
        bool operator!=(const Iterator& other) const {
            return value_ != other.value_;
        }
 
    private:
        int value_;
    };
 
    Iterator begin() const { return Iterator(start_); }
    Iterator end() const { return Iterator(end_); }
 
private:
    int start_;
    int end_;
};
 
int main() {
    IntegerRange range(1, 10);
 
    for (int x : range) {
        std::cout << x << " "; // 输出 1 2 3 4 5 6 7 8 9
    }
    std::cout << std::endl;
 
    return 0;
}

在这个例子中，IntegerRange 类表示一个从 start_ 到 end_ 的整数序列。它提供了一个 Iterator 类，用于遍历该序列。IntegerRange 类的 begin() 函数返回一个指向序列起始位置的 Iterator 对象，end() 函数返回一个指向序列结束位置的 Iterator 对象。Iterator 类实现了 operator*(), operator++() 和 operator!=() 运算符，用于读取、递增和比较迭代器。

自定义 View

要自定义 view，你需要创建一个类，该类满足 std::ranges::view 概念的要求。这意味着，该类需要提供 begin() 和 end() 成员函数或自由函数，并且这些函数返回的迭代器类型需要满足一定的迭代器概念。此外，该类还需要实现 view 的转换逻辑。

例如，我们可以自定义一个 SquareView 类，该类将 range 中的每个元素平方：

 #include <iostream>
#include <ranges>
#include <vector>
 
template <std::ranges::range Range>
class SquareView : public std::ranges::view_interface<SquareView<Range>> {
public:
    SquareView(Range&& range) : range_(std::forward<Range>(range)) {}
 
    auto begin() {
        return SquareIterator(std::ranges::begin(range_));
    }
 
    auto end() {
        return SquareIterator(std::ranges::end(range_));
    }
 
private:
    Range range_;
 
    class SquareIterator {
    public:
        SquareIterator(auto it) : current_(it) {}
 
        auto operator*() const {
            auto value = *current_;
            return value * value;
        }
 
        SquareIterator& operator++() {
            ++current_;
            return *this;
        }
 
        bool operator!=(const SquareIterator& other) const {
            return current_ != other.current_;
        }
 
    private:
        auto current_;
    };
};
 
template <std::ranges::range Range>
SquareView(Range&&) -> SquareView<Range>;
 
int main() {
    std::vector<int> v = {1, 2, 3, 4, 5};
 
    // 创建一个 view，将每个元素平方
    auto square_view = SquareView(v);
 
    // 打印 view 中的元素
    for (int x : square_view) {
        std::cout << x << " "; // 输出 1 4 9 16 25
    }
    std::cout << std::endl;
 
    return 0;
}

在这个例子中，SquareView 类接收一个 range 作为参数，并提供了一个 SquareIterator 类，用于遍历 range 中的元素，并将每个元素平方。SquareView 类的 begin() 函数返回一个指向 range 起始位置的 SquareIterator 对象，end() 函数返回一个指向 range 结束位置的 SquareIterator 对象。SquareIterator 类实现了 operator*(), operator++() 和 operator!=() 运算符，用于读取、递增和比较迭代器，并在 operator*() 中将元素平方。

总结

C++20 Ranges 库是一个功能强大的工具，可以简化数据集合的处理。通过深入了解 Ranges 库的底层实现，你可以更好地利用它，写出更高效、更易读的代码。希望本文能够帮助你更好地理解 Ranges 库，并在你的项目中发挥它的强大作用。

记住，掌握任何技术都需要不断地学习和实践。尝试使用 Ranges 库解决实际问题，并不断探索其更高级的用法。祝你学习愉快！

深入探索者 C++20 Ranges库底层原理

	#include <iostream>
	#include <vector>
	#include <ranges>

	template <typename T>
	concept MyRange = std::ranges::range<T>;

	int main() {
	std::vector<int> v = {1, 2, 3, 4, 5};
	std::cout << MyRange<decltype(v)> << std::endl; // 输出 1，表示 std::vector 满足 range 的要求
	int arr[] = {1, 2, 3, 4, 5};
	std::cout << MyRange<decltype(arr)> << std::endl; // 输出 1，表示数组也满足 range 的要求
	return 0;
	}

	#include <iostream>
	#include <ranges>

	class IntegerRange {
	public:
	IntegerRange(int start, int end) : start_(start), end_(end) {}

	class Iterator {
	public:
	Iterator(int value) : value_(value) {}

	int operator*() const { return value_; }

	Iterator& operator++() {
	++value_;
	return *this;
	}

	bool operator!=(const Iterator& other) const {
	return value_ != other.value_;
	}

	private:
	int value_;
	};

	Iterator begin() const { return Iterator(start_); }
	Iterator end() const { return Iterator(end_); }

	private:
	int start_;
	int end_;
	};

	int main() {
	IntegerRange range(1, 10);

	for (int x : range) {
	std::cout << x << " "; // 输出 1 2 3 4 5 6 7 8 9
	}
	std::cout << std::endl;

	return 0;
	}

C++20 Ranges库深度剖析：从原理到自定义实现

为什么要深入 Ranges 库？

Ranges 库的核心概念

Range 的内部结构

View 的内部结构

Algorithm 的内部结构

算法复杂度分析

自定义 Range 和 View

自定义 Range

自定义 View

总结

为什么要深入 Ranges 库？

Ranges 库的核心概念

Range 的内部结构

View 的内部结构

Algorithm 的内部结构

算法复杂度分析

自定义 Range 和 View

自定义 Range

自定义 View

总结

评论点评