2.8.1 泛型 Generics
泛型 Generics
实际上,泛型就是一种多态。泛型主要目的是为程序员提供编程的便利,减少代码的臃肿,同时可以极大地丰富语言本身的表达能力,为程序员提供了一个合适的炮管。
1 |
|
将之前的代码改成上面这样,就是 Rust 泛型的初印象,这段代码虽然很简洁,但是并不能编译通过,我们会在后面进行详细讲解,现在只要对泛型有个大概的印象即可。
1. 泛型详解
上面代码的 T
就是泛型参数,实际上在
Rust 中,泛型参数的名称你可以任意起,但是出于惯例,我们都用
T
(T
是 type
的首字母)来作为首选,这个名称越短越好,除非需要表达含义,否则一个字母是最完美的。
使用泛型参数,有一个先决条件,必需在使用前对其进行声明:
1 |
|
该泛型函数的作用是从列表中找出最大的值,其中列表中的元素类型为
T。首先 largest<T>
对泛型参数 T
进行了声明,然后才在函数参数中进行使用该泛型参数
list: &[T]
(还记得 &[T]
类型吧?这是数组切片)。
总之,我们可以这样理解这个函数定义:函数 largest
有泛型类型 T
,它有个参数 list
,其类型是元素为
T
的数组切片,最后,该函数返回值的类型也是
T
。
下面是一个错误的泛型函数的实现:
1 |
|
运行后报错:
1 |
|
因为 T
可以是任何类型,但不是所有的类型都能进行比较,因此上面的错误中,编译器建议我们给
T
添加一个类型限制:使用 std::cmp::PartialOrd
特征(Trait)对 T
进行限制,特征在下一节会详细介绍,现在你只要理解,该特征的目的就是让类型实现可比较的功能。
还记得我们一开始的 add
泛型函数吗?如果你运行它,会得到以下的报错:
1 |
|
同样的,不是所有 T
类型都能进行相加操作,因此我们需要用
std::ops::Add<Output = T>
对 T
进行限制:
1 |
|
进行如上修改后,就可以正常运行。
1.1 显式地指定泛型的类型参数
有时候,编译器无法推断你想要的泛型参数:
1 |
|
如果运行以上代码,会得到报错:
1 |
|
报错里说得很清楚,编译器不知道 T
到底应该是什么类型。不过好心的编译器已经帮我们列出了满足条件的类型,然后告诉我们解决方法:显式指定类型:create_and_print::<T>()
。
于是,我们修改代码:
1 |
|
Tips:
这个函数声明指定了泛型参数 T
必须实现
From<i32>
和 Display
两个
trait。这意味着 T
类型可以从 i32
类型转换而来,并且可以被格式化输出
1.2 结构体中使用泛型
结构体中的字段类型也可以用泛型来定义,下面代码定义了一个坐标点
Point
,它可以存放任何类型的坐标值:
1 |
|
这里有两点需要特别的注意:
- 提前声明,跟泛型函数定义类似,首先我们在使用泛型参数之前必需要进行声明
Point<T>
,接着就可以在结构体的字段类型中使用T
来替代具体的类型 - x 和 y 是相同的类型
如果想让 x
和 y
既能类型相同,又能类型不同,就需要使用不同的泛型参数:
1 |
|
切记,所有的泛型参数都要提前声明:Point<T,U>
!
但是如果你的结构体变成这鬼样:struct Woo<T,U,V,W,X>
,那么你需要考虑拆分这个结构体,减少泛型参数的个数和代码复杂度。
1.3 枚举中使用泛型
提到枚举类型,Option
永远是第一个应该被想起来的,在之前的章节中,它也多次出现:
1 |
|
Option<T>
是一个拥有泛型 T
的枚举类型,它第一个成员是 Some(T)
,存放了一个类型为
T
的值。得益于泛型的引入,我们可以在任何一个需要返回值的函数中,去使用
Option<T>
枚举类型来做为返回值,用于返回一个任意类型的值
Some(T)
,或者没有值 None
。
对于枚举而言,卧龙凤雏永远是绕不过去的存在:如果是
Option
是卧龙,那么 Result
就一定是凤雏,得两者可得天下:
1 |
|
这个枚举和 Option
一样,主要用于函数返回值,与
Option
用于值的存在与否不同,Result
关注的主要是值的正确性。
如果函数正常运行,则最后返回一个 Ok(T)
,T
是函数具体的返回值类型,如果函数异常运行,则返回一个
Err(E)
,E
是错误类型。例如打开一个文件:如果成功打开文件,则返回
Ok(std::fs::File)
,因此 T
对应的是
std::fs::File
类型;而当打开文件时出现问题时,返回
Err(std::io::Error)
,E
对应的就是
std::io::Error
类型。
2. 方法中使用泛型
上一章中,我们讲到什么是方法以及如何在结构体和枚举上定义方法。方法上也可以使用泛型:
1 |
|
使用泛型参数前,依然需要提前声明:impl<T>
,只有提前声明了,我们才能在Point<T>
中使用它,这样
Rust 就知道 Point
的尖括号中的类型是泛型而不是具体类型。需要注意的是,这里的
Point<T>
不再是泛型声明,而是一个完整的结构体类型,因为我们定义的结构体就是
Point<T>
而不再是 Point
。
除了结构体中的泛型参数,我们还能在该结构体的方法中定义额外的泛型参数,就跟泛型函数一样:
1 |
|
这个例子中,T,U
是定义在结构体 Point
上的泛型参数,V,W
是单独定义在方法 mixup
上的泛型参数,它们并不冲突,说白了,你可以理解为,一个是结构体泛型,一个是函数泛型。
2.1 为具体的泛型类型实现方法
对于 Point<T>
类型,你不仅能定义基于
T
的方法,还能针对特定的具体类型,进行方法定义:
1 |
|
这段代码意味着 Point<f32>
类型会有一个方法
distance_from_origin
,而其他 T
不是
f32
类型的
Point<T>
实例则没有定义此方法。这个方法计算点实例与坐标(0.0, 0.0)
之间的距离,并使用了只能用于浮点型的数学运算符。
这样我们就能针对特定的泛型类型实现某个特定的方法,对于其它泛型类型则没有定义该方法。
3. const 泛型(Rust 1.51 版本引入的重要特性)
在之前的泛型中,可以抽象为一句话:针对类型实现的泛型,所有的泛型都是为了抽象不同的类型,那有没有针对值的泛型?可能很多同学感觉很难理解,值怎么使用泛型?不急,我们先从数组讲起。
在数组那节,有提到过很重要的一点:[i32; 2]
和 [i32; 3]
是不同的数组类型,比如下面的代码:
1 |
|
运行后报错:
1 |
|
结合代码和报错,可以很清楚的看出,[i32; 3]
和
[i32; 2]
确实是两个完全不同的类型,因此无法用同一个函数调用。
首先,让我们修改代码,让 display_array
能打印任意长度的
i32
数组:
1 |
|
很简单,只要使用数组切片,然后传入 arr
的不可变引用即可。
接着,将 i32
改成所有类型的数组:
1 |
|
也不难,唯一要注意的是需要对 T
加一个限制
std::fmt::Debug
,该限制表明 T
可以用在
println!("{:?}", arr)
中,因为 {:?}
形式的格式化输出需要 arr
实现该特征。
通过引用,我们可以很轻松的解决处理任何类型数组的问题,但是如果在某些场景下引用不适宜用或者干脆不能用呢?你们知道为什么以前 Rust 的一些数组库,在使用的时候都限定长度不超过 32 吗?因为它们会为每个长度都单独实现一个函数,简直。。。毫无人性。难道没有什么办法可以解决这个问题吗?
好在,现在咱们有了 const 泛型,也就是针对值的泛型,正好可以用于处理数组长度的问题:
1 |
|
如上所示,我们定义了一个类型为 [T; N]
的数组,其中
T
是一个基于类型的泛型参数,这个和之前讲的泛型没有区别,而重点在于
N
这个泛型参数,它是一个基于值的泛型参数!因为它用来替代的是数组的长度。
N
就是 const 泛型,定义的语法是
const N: usize
,表示 const 泛型 N
,它基于的值类型是 usize
。
在泛型参数之前,Rust 完全不适合复杂矩阵的运算,自从有了 const 泛型,一切即将改变。
3.1 const 泛型表达式
假设我们某段代码需要在内存很小的平台上工作,因此需要限制函数参数占用的内存大小,此时就可以使用 const 泛型表达式来实现:
1 |
|
3.2 const fn
在讨论完 const
泛型后,不得不提及另一个与之密切相关且强大的特性:const fn
,即常量函数。const fn
允许我们在编译期对函数进行求值,从而实现更高效、更灵活的代码设计。
为什么需要 const fn
通常情况下,函数是在运行时被调用和执行的。然而,在某些场景下,我们希望在编译期就计算出一些值,以提高运行时的性能或满足某些编译期的约束条件。例如,定义数组的长度、计算常量值等。
有了
const fn
,我们可以在编译期执行这些函数,从而将计算结果直接嵌入到生成的代码中。这不仅以高了运行时的性能,还使代码更加简洁和安全。
const fn 的基本用法
要定义一个常量函数,只需要在函数声明前加上 const
关键字。例如:
1 |
|
const fn 的限制
虽然 const fn
提供了很多便利,但是由于其在编译期执行,以确保函数能在编译期被安全地求值,因此有一些限制,例如,不可将随机数生成器写成
const fn
。
无论在编译时还是运行时调用
const fn
,它们的结果总是相同,即使多次调用也是如此。唯一的例外是,如果你在极端情况下进行复杂的浮点操作,你可能会得到(非常轻微的)不同结果。因此,不建议使
数组长度 (arr.len())
和 Enum判别式
依赖于浮点计算。
结合 const fn 与 const 泛型
将 const fn
与 const 泛型
结合,可以实现更加灵活和高效的代码设计。例如,创建一个固定大小的缓冲区结构,其中缓冲区大小由编译期计算确定:
1 |
|
在这个例子中,compute_buffer_size
是一个常量函数,它根据传入的 factor
计算缓冲区的大小。在
main
函数中,我们使用 compute_buffer_size(4)
来计算缓冲区大小为 4096 字节,并将其作为泛型参数传递给
Buffer
结构体。这样,缓冲区的大小在编译期就被确定下来,避免了运行时的计算开销。
4. 泛型的性能
在 Rust 中泛型是零成本的抽象,意味着你在使用泛型时,完全不用担心性能上的问题。
但是任何选择都是权衡得失的,既然我们获得了性能上的巨大优势,那么又失去了什么呢?Rust 是在编译期为泛型对应的多个类型,生成各自的代码,因此损失了编译速度和增大了最终生成文件的大小。
具体来说:
Rust 通过在编译时进行泛型代码的 单态化(monomorphization)来保证效率。单态化是一个通过填充编译时使用的具体类型,将通用代码转换为特定代码的过程。
编译器所做的工作正好与我们创建泛型函数的步骤相反,编译器寻找所有泛型代码被调用的位置并针对具体类型生成代码。
让我们看看一个使用标准库中 Option
枚举的例子:
1 |
|
当 Rust 编译这些代码的时候,它会进行单态化。编译器会读取传递给
Option<T>
的值并发现有两种
Option<T>
:一种对应 i32
另一种对应
f64
。为此,它会将泛型定义 Option<T>
展开为 Option_i32
和
Option_f64
,接着将泛型定义替换为这两个具体的定义。
编译器生成的单态化版本的代码看起来像这样:
1 |
|
我们可以使用泛型来编写不重复的代码,而 Rust 将会为每一个实例编译其特定类型的代码。这意味着在使用泛型时没有运行时开销;当代码运行,它的执行效率就跟好像手写每个具体定义的重复代码一样。这个单态化过程正是 Rust 泛型在运行时极其高效的原因。