Rust运算符重载

运算符重载是一种允许程序员定义或改变运算符行为的特性,许多编程语言都支持运算符重载,特别是在面向对象编程和泛型编程中,比如C++、C#、Kotlin、Swift等语言,这些语言还支持同名的函数重载。

Rust支持运算符的重载,但是不支持函数重载,因为Rust提供了更强大的编译期范型的支持,函数重载这种容易出现歧义的语法特性就被rust抛弃了。

Rust通过实现标准库中提供的trait进行运算符重载,标准库trait列表如下:

运算符重载

算数运算符和位运算符

在 Rust 中,表达式 a + b 实际上是 a.add(b) 的简写,调用 std::ops::Add 的方法,Rust 标准库数值类型都实现了这个 Trait。所有如果我们要实现类型之间的算数运算,只需要为这个类型实现相应的 Trait 即可。

假设我们需要为 num 中的 Complex<T> 实现 + 运算符:

1
2
3
4
5
6
pub struct Complex<T> {
/// Real portion of the complex number
pub re: T,
/// Imaginary portion of the complex number
pub im: T,
}

我们之前说过可以为一类类型添加方法,这样的话不至于为 Complex<i32>Complex<u64> 都添加 + 运算符:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
#![allow(dead_code)]

use std::ops::Add;

#[derive(PartialEq, Eq, Clone, Copy, Debug)]
pub struct Complex<T> {
/// Real portion of the complex number
pub re: T,
/// Imaginary portion of the complex number
pub im: T,
}

impl<T> Add for Complex<T>
where
T: Add<Output = T>,
{
type Output = Self;
fn add(self, rhs: Self) -> Self {
Complex {
re: self.re + rhs.re,
im: self.im + rhs.im,
}
}
}

虽然 Rust 不赞成支持混合类型的操作,但我们可以实现,这里要求 L 必须能和 R 实现加法操作:

1
2
3
4
5
6
7
8
9
10
11
12
impl<L, R> Add<Complex<R>> for Complex<L>
where
L: Add<R>,
{
type Output = Complex<L::Output>;
fn add(self, rhs: Complex<R>) -> Self::Output {
Complex {
re: self.re + rhs.re,
im: self.im + rhs.im,
}
}
}

一元操作符

Rust 有两个一元操作符 -!,Rust 的所有带符号数字类型都实现了 std::ops::Neg,用于一元负数运算符 -。整数类型和 bool 实现 std::ops::Not,用于一元补码运算符 !! 可以用于 bool 值也可以用于整数的按位取反。

std::ops::Negstd::ops::Not 的定义如下:

1
2
3
4
5
6
7
8
9
trait Neg {
type Output;
fn neg(self) -> Self::Output;
}

trait Not {
type Output;
fn not(self) -> Self::Output;
}

我们来实现对复数 Complex<T>- 运算:

1
2
3
4
5
6
7
8
9
10
11
12
13
use std::ops::Neg;
impl<T> Neg for Complex<T>
where
T: Neg<Output = T>,
{
type Output = Complex<T>;
fn neg(self) -> Complex<T> {
Complex {
re: -self.re,
im: -self.im,
}
}
}

复合赋值运算符

复合赋值表达式类似于 x += yx &= y:它接受两个操作数,对它们执行一些操作,如加法或按位与,并将结果存储回左操作数。在 Rust 中,复合赋值表达式的值始终是 (),而不是存储的值。

许多语言都有这样的运算符,通常将它们定义为 x = x + yx = x & y 等表达式的简写。

x += y 是方法调用 x.add_assign(y) 的简写,其中 add_assignstd::ops::AddAssign 的唯一方法:

1
2
3
pub trait AddAssign<Rhs = Self> {
fn add_assign(&mut self, rhs: Rhs);
}

Rust 的所有数字类型都实现了算术复合赋值运算符,Rust 的整数类型和 bool 实现了按位复合赋值运算符。我们来看一个对 Complex<T> 的假发复合赋值运算符:

1
2
3
4
5
6
7
8
9
10
use std::ops::AddAssign;
impl<T> AddAssign for Complex<T>
where
T: AddAssign<T>,
{
fn add_assign(&mut self, rhs: Complex<T>) {
self.re += rhs.re;
self.im += rhs.im;
}
}

复合赋值运算符的内置 Trait 完全不同于相应二元运算符的内置 Trait。实现 std::ops::Add 不会自动实现 std::ops::AddAssign。如果你想让 Rust 允许你的类型作为 += 运算符的左操作数,你必须自己实现 AddAssign

相等比较

Rust 的相等运算符 ==!= 是调用 std::cmp::PartialEqeqne 方法,这个 trait 的定义如下:

1
2
3
4
5
6
7
8
9
trait PartialEq<Rhs = Self>
where
Rhs: ?Sized,
{
fn eq(&self, other: &Rhs) -> bool;
fn ne(&self, other: &Rhs) -> bool {
!self.eq(other)
}
}

因为 ne 有个默认实现,我们只需要实现 eq 方法,这里有个为 Complex<T> 的实现:

1
2
3
4
5
impl<T: PartialEq> PartialEq for Complex<T> {
fn eq(&self, other: &Complex<T>) -> bool {
self.re == other.re && self.im == other.im
}
}

PartialEq 的实现几乎总是如出一辙,每次都显示写出来显得很无聊,所以 Rust 经常会为我们自动派生这个 Trait 的实现:

1
2
3
4
#[derive(Clone, Copy, Debug, PartialEq)]
struct Complex<T> {
...
}

为什么 PartialEq? 叫做部分相等,因为从数学定义上来说,等价关系应该满足三个要求,对于任何值 x 和 y:

  • 如果 x == y 那么 y == x;
  • 如果 x == y,y == x 那么 x == z;
  • x == x 永远成立;

虽然最后一个足够简单,但最后一个正是出问题的地方。Rust 的 f32 和 f64 是 IEEE 标准浮点值,像 0.0 / 0.0 以及其他没有适当值的表达式必须产生 NaN,而且 NaN 不等于任何值包括自身:

1
2
3
4
5
6
7
8
assert!(f64::is_nan(0.0 / 0.0));
assert_eq!(0.0 / 0.0 == 0.0 / 0.0, false);
assert_eq!(0.0 / 0.0 != 0.0 / 0.0, true);

assert_eq!(0.0 / 0.0 < 0.0 / 0.0, false);
assert_eq!(0.0 / 0.0 > 0.0 / 0.0, false);
assert_eq!(0.0 / 0.0 <= 0.0 / 0.0, false);
assert_eq!(0.0 / 0.0 >= 0.0 / 0.0, false);

因此,虽然 Rust 的 == 运算符满足等价关系的前两个要求,但在 IEEE 浮点值上使用时显然不满足第三个要求,这称为部分等价关系。

如果你希望通用代码需要完全等价关系,则可以改为使用 std::cmp::Eq 作为边界,它表示完全等价关系:如果类型实现 Eq,则 x == x 对于该类型的每个值 x 都必须为真。在实践中,几乎所有实现 PartialEq 的类型也应该实现 Eq; f32 和 f64 是标准库中唯一属于 PartialEq 但不是 Eq 的类型。

标准库定义 Eq 是 PartialEq 的扩展,但是没有添加方法:

1
trait Eq: PartialEq<Self> {}

如果你的类型实现了 PartialEq 也希望是 Eq,那么必须显示实现 Eq,即使不用实现任何新的函数:

1
impl<T: Eq> Eq for Complex<T> {}

更简单的是我们可以使用派生 Eq 来实现:

1
2
3
4
#[derive(Clone, Copy, Debug, Eq, PartialEq)]
struct Complex<T> {
...
}

泛型类型的派生实现可能取决于类型参数,使用派生属性,Complex<i32> 将实现 Eq,因为 i32 可以,但是 Complex<f32> 只会实现 PartialEq,因为 f32 没有实现 Eq。当自己实现 std::cmp::PartialEq 时,Rust 无法检查你的 eq 和 ne 是完全相等还是部分相等。

有序比较

Rust 在 PartialOrd 中定义了 < > <= >= 的逻辑:

1
2
3
4
5
6
7
8
9
10
11
pub trait PartialOrd<Rhs = Self>: PartialEq<Rhs> 
where
Rhs: ?Sized,
{
fn partial_cmp(&self, other: &Rhs) -> Option<Ordering>;

fn lt(&self, other: &Rhs) -> bool { ... }
fn le(&self, other: &Rhs) -> bool { ... }
fn gt(&self, other: &Rhs) -> bool { ... }
fn ge(&self, other: &Rhs) -> bool { ... }
}

这个 Trait 中唯一需要实现的是 partial_cmp 方法,根据它的返回结果,就确定了比较结果:

1
2
3
4
5
enum Ordering {
Less, // self < other
Equal, // self == other
Greater, // self > other
}

但是如果 partial_cmp 返回 None,这意味着 self 和 other 相对于彼此是无序的:既不大于另一个,也不相等,在 Rust 中,只有 NaN 之间的比较才会有这样的结果。

像其他二元运算符一样,比较左右两种类型的值,左值必须实现 PartialOrd。 像 x < yx >= y 这样的表达式是下面一些方法的简写:

运算符重载

如果想始终确定两个值得大小关系,那么就需要使用更严格的 std::cmp::Ord

这里的 cmp 方法总是返回 Odering,说明两个值总是有顺序的,几乎所有实现 PartialOrd 的类型也实现了 Ord,除了 f32 和 f64。

Index 和 IndexMut

索引运算符 [] 也是可以重载的,例如,a[i] 实际上是 *a.index(i),如果这个表达式赋值给可变引用那家么实际上调用的是 *a.index_mut(i),这俩方法分别代表的是 std::ops::Indexstd::ops::IndexMut,它们的实际定义如下:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
pub trait Index<Idx> 
where
Idx: ?Sized,
{
type Output: ?Sized;
fn index(&self, index: Idx) -> &Self::Output;
}

pub trait IndexMut<Idx>: Index<Idx>
where
Idx: ?Sized,
{
fn index_mut(&mut self, index: Idx) -> &mut Self::Output;
}

可以使用单个 usize 来索引切片,引用单个元素,因为切片实现 Index<usize>。但也可以可以使用像 a[i..j] 这样的表达式来引用子切片,因为它们也实现了 Index<Range<usize>>,这个表达式是简写为了:

1
*a.index(std::ops::Range { start: i, end: j })

std::collections::HashMapstd::collections::BTreeMap 都实现了 Index<&str>

所以我们可以这样使用:

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
fn main() {
use std::collections::HashMap;
let mut m = HashMap::new();
m.insert("十", 10);
m.insert("百", 100);
m.insert("千", 1000);
m.insert("万", 1_0000);
m.insert("億", 1_0000_0000);
assert_eq!(m["十"], 10);
assert_eq!(m["千"], 1000);

// 等价于
use std::ops::Index;
assert_eq!(*m.index("十"), 10);
assert_eq!(*m.index("千"), 1000);
}

从定义可以看出 IndexMut 扩展了 Index 并且增加了 index_mut 方法。当索引表达式出现在必要的上下文中时,Rust 会自动选择 index_mut。例如,假设我们编写以下代码:

1
2
3
4
5
6
7
8
9
10
let mut desserts =
vec!["Howalon".to_string(), "Soan papdi".to_string()];
desserts[0].push_str(" (fictional)");
desserts[1].push_str(" (real)");

// 等价于

use std::ops::IndexMut;
(*desserts.index_mut(0)).push_str(" (fictional)");
(*desserts.index_mut(1)).push_str(" (real)");

IndexMut的一个限制是,根据设计,它必须返回对某个值的可变引用。这就是为什么你不能使用像 m["十"] = 10; 这样的表达式的原因。因为向 HashMap 中插入一个值:该表需要首先为 “十” 创建一个 entry,并使用一些默认值,然后返回一个可变引用,但并非所有类型都具有简单的默认值,而且这里创建一个默认值并且立马丢掉,然后使用新值覆盖。

其他运算符

并非所有的运算符都可以重载,例如,用于错误检测的 ?,逻辑运算符 &&||,范围运算符 ....=,借用运算符 & 和赋值运算符 = 不能被重载。

解引用运算符 * 和字段 (方法) 运算符 . 是可以通过 std::ops::Derefstd::ops::DerefMut 重载的。

Rust 不支持重载函数调用运算符 f(x),而是当你需要一个可调用的值时,用闭包来实现。

这里着重讲一下解引用。在 Rust 中通过实现 DerefDerefMut Trait来重载。解引用运算符允许你通过指针类型(如 Box、Rc、Arc)访问其所指向的值。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
use std::ops::Deref;

struct MyBox<T>(T);

impl<T> MyBox<T> {
fn new(x: T) -> MyBox<T> {
MyBox(x)
}
}

impl<T> Deref for MyBox<T> {
type Target = T;

fn deref(&self) -> &T {
&self.0
}
}

impl<T> DerefMut for MyBox<T> {
fn deref_mut(&mut self) -> &mut T {
&mut self.0
}
}

fn main() {
let x = MyBox::new(5);
println!("x: {}", *x); // 使用解引用运算符

// 使用 DerefMut 特性来修改值
*x = 10;
println!("x: {}", *x);
}

本作品采用 知识共享署名 4.0 国际许可协议 进行许可。

转载时请注明原文链接:https://blog.hufeifei.cn/2024/07/Rust/rust-operator-overloading/

鼓励一下
支付宝微信