Cangjie 中的值类型与引用类型

发布于:2025-05-31 ⋅ 阅读:(26) ⋅ 点赞:(0)
1. 值类型和引用类型
1.1 值的存储方式

所有变量在底层实现中,都会关联一个具体的“值”,这个值可能存储在 内存地址 或 寄存器 中。

  • 寄存器用于优化常用变量的访问速度。
  • 只有局部、小、频繁使用的变量才更可能被分配到寄存器中。
  • 实际行为由编译器根据上下文和优化策略决定。

对于值变量而言,这个关联的值本身就是数据的直接表示。例如,一个 Int64 类型的变量 let x = 5 ,其关联的值 5 直接存储在变量的内存空间中,而非指向其他位置。

对于引用变量而言,其关联的值是一个对对象的引用,该引用通常表现为对象在堆内存中的地址。变量本身并不包含对象的实际数据,而是通过这个引用间接访问对象的内容。

在 Cangjie 语言中,class 和 Array / ArrayList / HashMap 等 collection 类型 属于引用类型,struct 和 Int64 / String 等 基础类型 属于值类型。

1.2 let 在值类型与引用类型中的行为差异

引用类型 和 值类型 这种分类,直接影响了变量声明(varlet)与方法调用的规则。

“let 与 var,分别对应不可变和可变属性,可变性决定了变量被初始化后其值还能否改变,仓颉变量也由此分为不可变变量和可变变量两类。”

  • 值类型特性:struct 实例的变量在声明为 let 时是完全不可变的,包括其内部的字段;若需修改 struct 实例的状态,则需使用 var 声明变量,var d = Data()

  • 引用类型特性:引用类型实例的变量是引用(类似指针),let 声明仅禁止重新赋值引用本身,但允许通过引用修改对象内部状态。

let struct 与 let class 类似于 C++ 中常量指针常量(const T * const)和指针常量(T * const)的区别 —— 前者指向、指向的内容均不可变,后者指向不可变、指向的内容可变。

这也是为什么即使将 ArrayList 声明为 let,依然可以向其中添加元素,因为 let 仅阻止对该引用本身的重新赋值,而不影响通过该引用修改对象内部状态;

同样地,let it = list.iterator() 可以在遍历时通过 while (let Some(val) <- it.next()) 不断获取下一个元素,是因为迭代器对象的状态变更属于其内部行为,并不受引用本身不可变性的限制。

2. 复制和传参的机制
2.1 复制行为解析

值类型变量的赋值或传参会触发深拷贝,即完整复制变量的相关数据,原始实例与副本状态隔离;

引用类型变量的复制或传参会复制引用(而非对象本身)。

Cangjie 值类型(struct)和引用类型(class)的复制均不会触发构造函数:

  • struct 在赋值或传参时,直接复制内存数据,不会调用构造函数、重新初始化成员变量。

在这里插入图片描述

let d2= d1 的行为并不会调用 init(D: Data) 构造函数。因为 Cangjie 中结构体(struct)是值类型,赋值操作会直接复制内存中的数据,而不是通过构造函数进行初始化。
·
如果 Cangjie 在赋值时真的使用了自定义的拷贝构造函数(如 init(D: Data)),则会导致无限递归的问题:因为拷贝构造函数本身在初始化新对象时又会触发一次赋值,进而再次调用拷贝构造函数,形成循环。
·
因此,这种“反向验证”说明 Cangjie 在底层对值类型的赋值操作采用的是直接内存复制的方式,而不是依赖用户定义的构造函数。

  • class 的实例通过引用来共享数据,赋值或传参仅复制引用地址,无需构造新对象。
2.2 值类型中嵌套引用类型

当值类型(如 struct)中包含引用类型(如 ArrayList / class )时,复制值类型会导致以下行为:

  • 值类型字段:直接复制数据。修改副本的值类型字段,不影响原始实例。
  • 引用类型字段:复制引用地址。副本的引用类型字段与原始实例共享同一对象。

r1.x = 1 :因为 x 是值类型,赋值后修改的是 r2.x ,不影响 r1.x 。
r1.list: 1 2 3 :因为 list 是引用类型,r1.list 和 r2.list 指向同一个 ArrayList,所以 r2 对 list 的修改也影响到 r1 。