C#是静态类型的语言,变量一旦声明就无法重新声明或者存储其他类型的数据,除非进行类型转换。本章的主要任务就是学习类型转换的知识。类型转换有显式的,也有隐式的。所谓显式,就是我们必须明确地告知编译器,我们要把变量从源类型转换成什么类型;而隐式的则不需要,编译器会自动帮我们进行转换。知道装箱和拆箱吗?我们将在本文中学习装箱和拆箱的知识。
1 隐式类型转换
什么是隐式转换呢? 如果编译器认为从类型1(下称T1)到类型2(下称T2)的转换不会产生不良后果,那么T1到T2的转换就是由编译器自动完成的,这就是隐式转换。我们举个例子,如代码清单5-1所示。
代码清单5-1 隐式类型转换
namespace ProgrammingCSharp4
{
class TypeConvert
{
private void DoSomething()
{
int intValue = 10;
long longValue = intValue;
}
}
}
第8行执行的是int
型到long
型的转换,long
型对应的是System.Int64
,int
型对应的是System.Int32
,显然long
型的取值范围要比int
型大,因此这种转换是安全的,编译器允许了此次转换。为了了解类型转换的实质,我们可以通过查看上述代码编译后生成的CIL代码,如代码清单5-2所示。
代码清单5-2 CIL代码
.method private hidebysig instance void DoSomething() cil managed
{
// Code size 8 (0x8)
.maxstack 1
.locals init([0] int32 intValue, [1] int64 longValue)
IL_0000: nop
IL_0001: ldc.i4.s 10
IL_0003: stloc.0
IL_0004: ldloc.0
IL_0005: conv.i8
IL_0006: stloc.1
IL_0007: ret
} // end of method TypeConvert:DoSomething
为了突出重点,我们先忽略其他不相关内容,只关注与类型转换相关的CIL指令。
第7行:类型为
i4
(即int32
)的数据10,入栈;第8行:出栈,赋予变量
[0]
,即intValue
;第9行:变量0数据入栈;
第10行:将栈顶中的数据转换为
i8
类型(即int64
,也就是long
类型);第11行:出栈,赋予变量
[1]
,即longValue
;
其中,最重要的是第11行,编译器生成了类型转换的CIL指令:
conv.<to type>
<to type>
就是要转换到的目标类型。
可见,查看CIL代码有助于我们了解编译器所做的实际操作,有助于我们更加深刻地理解C#这门语言,以及.NET CLR的一些工作机制。在本书的其他章节,我们还会通过CIL代码来进行学习。由于CIL的知识超出了本文的范围,需要进一步了解CIL的读者,可以自行查阅其他资料。
大家现在应该对隐式类型转换有了初步的了解,接下来将进一步学习数值类型的隐式转换,以及引用类型中的隐式转换。
1.1 数值类型
C#语言支持的数值类型的隐式转换如下所示:
sbyte
到short
、int
、long
、float
、double
或decimal
;byte
到short
、ushort
、int
、uint
、long
、ulong
、float
、double
或decimal
;short
到int
、long
、float
、double
或decimal
;ushort
到int
、uint
、long
、ulong
、float
、double
或decimal
;int
到long
、float
、double
或decimal
;uint
到long
、ulong
,float
、double
或decimal
;long
到float
、double
或decimal
;ulong
到float
、double
或decimal
;char
到ushort
、int
、uint
、long
、ulong
、float
、double
或decimal
;float
到double
。
上述的隐式转换是安全的,不会造成任何精度或者数量级的损失。需要说明的是,C#不支持任何其他类型到char
类型的隐式转换。
有两种特殊的隐式转换需要说明,之所以说它们特殊,是因为它们会带来精度损失,但没有数量级损失,它们是:
从
int
、uint
、long
或者ulong
到float
的转换;long
或者ulong
到double
的转换。
我们还是以一段代码为例,演示从int
到float
的类型转换,以此演示精度损失的情况,如代码清单5-3所示。
代码清单5-3 精度损失示例
using System;
namespace ProgrammingCSharp4
{
class TypeConvert
{
static void Main(string[] args)
{
TypeConvert typeConvert = new TypeConvert();
typeConvert.DoSomething();
}
public void DoSomething()
{
int max = int.MaxValue;
float floatValue = max;
Console.WriteLine(max);
Console.WriteLine(floatValue);
}
}
}
上述代码打印了int
类型支持的最大有效值(MaxValue
),然后将它赋予了一个float
类型的变量floatValue
,编译器执行了隐式转换。运行结果是:
2147483647
2.147484E+09
这里2.147484E+09
表示科学计数法,相当于2.147484 × 10^9
,也就是2,147,484,000
。
可以看出,转换后的数值比原值的有效位减少了,因为原值是2,147,483,647
(有效位:10),转换后的值是2,147,484,000
(有效位:7),很显然,类型转换造成了精度损失,但数量级并没有损失。至于另外一种情况——从long
或ulong
到double
的转换,请大家自行验证。
我们在学习程序设计时一定要重视实验(注意不是“试验”,而是实地验证),将书本或者课题上讲的内容、知识点进行实际验证。这可以加深我们对知识的理解,同时也能积累解决问题的方式和方法。
下一节我们将讲述引用类型的隐式转换。
1.2 引用类型
符合以下情况之一者,编译器可以自动实施隐式类型转换,并且不需要运行时类型检查:
任意引用类型到
object
类型的转换;派生类型到基类型的转换;
派生类型到其实现的接口类型的转换;
派生接口类型到基接口类型的转换;
数组类型到
System.Array
类型的转换;委托类型到
System.Delegate
类型的转换;null
类型到所有引用类型的转换。
对于引用类型来说,无论是隐式还是显式的类型转换,改变的仅仅是引用的类型,至于该引用指向的对象的类型以及对象的值都是保持不变的。如图5-1所示,它实际改变的是变量1的类型,而引用的对象“对象1”则保持类型和值不变。
1.3 装箱
之所以再次讨论装箱,是因为装箱也属于类型转换的知识范畴。我们先来看一段示例代码,如代码清单5-4所示。
代码清单5-4 装箱
namespace ProgrammingCSharp4
{
class Boxing
{
public void DoSomething()
{
int x = 10;
object obj = x;
}
}
}
第7行声明了一个int
型变量x
,并初始化为10。接着第8行声明了一个object
类型obj
,并使用x
为其初始化,这里既是装箱,也是本文讲的类型转换,其本质还是类型转换,即将int
型“装箱”为object
类型,这个装箱的过程即是隐式的类型转换。
我们仍然通过查看上述代码编译生成的CIL代码来观察装箱的具体过程,CIL代码如代码清单5-5所示。
代码清单5-5 DoSomething()函数的CIL代码
.method public hidebysig instance void DoSomething() cil managed
{
// Code size 12 (0xc)
.maxstack 1
.locals init (
[0] int32 x,
[1] object obj
)
IL_0000: nop
IL_0001: ldc.i4.s 10
IL_0003: stloc.0
IL_0004: ldloc.0
IL_0005: box [mscorlib]System.Int32
IL_000a: stloc.1
IL_000b: ret
} // end of method Boxing:DoSomething
这里只关注与装箱相关的代码,对CIL有兴趣的读者可以自行查找相关资料进行学习。
代码清单5-5的第13行是重点,box
指令指示把栈中的int
型(值类型)变量装箱为引用类型(object
)。经过装箱这一过程后,原来的值类型的变量就不存在了,取而代之的就是装箱后的引用类型的变量。
另外,枚举类型经过装箱以后成为System.Enum
类型,因为System.Enum
类是枚举类型的基类。而结构类型和枚举类型装箱后则为System.ValueType
类型,原因一样,因为System.ValueType
类型是所有结构类型和枚举类型的基类。
在本节的最后,我们对装箱的类型转换做个总结,如下:
值类型可隐式转换到
object
类型或System.ValueType
类型;非
Nullable
值类型可隐式转换到它实现的接口;枚举类型可隐式转换到
System.Enum
类型。
2. 显式类型转换
显式类型转换又叫做显式强制类型转换、强制类型转换,因为不能自动进行转换(和隐式类型转换相比而言),因而需要显式地告知编译器需要类型转换。隐式类型转换往往是由窄向宽的转换,而显式类型转换恰恰相反,是由宽向窄的类型转换。以数值类型为例,从一个取值范围更大的类型向较小的类型转换时,由于可能导致精度损失或引发异常,因此编译器不会自动进行隐式转换,除非明确告知。因此,显式转换也称为收缩转换。
那么,该如何告诉编译器我们确定要做这种显式的转换呢?很简单,只需要在变量前使用一对小括号()
运算符,小括号中是目标类型。如果未定义相应的()
运算符,则强制转换会失败。以后我们还将学到,还可以使用as
运算符进行类型转换,如代码清单5-6所示。
代码清单5-6 long类型到int类型的转换
using System;
namespace ProgrammingCSharp4
{
class TypeConvert
{
public void DoSomething()
{
long longValue = 10;
int intValue = (int)longValue;
}
}
}
编译上述代码,编译器会产生如下编译错误:
无法将类型“long”隐式转换为“int”。存在一个显式转换(是否缺少强制转换?)
分析一下为什么会产生这样的错误,在代码的第10行,我们试图将取值范围更大的long
类型隐式地转换为int
类型。前面讲过,这可能会造成信息丢失,因此编译器将之作为一个错误,并拒绝进行转换。如果确实要进行转换,就需要显式类型转换了,即使用()
运算符或者as
运算符。知道了错误的原因,那么只需对第10行做如下修改即可解决问题:
int intValue = (int)longValue;
这里的()
运算符(int)
明确告知编译器需要将long
转换为int
。至此,问题解决。
其实,所有的隐式类型转换都可以显式地进行类型转换。因此,可以说隐式类型转换都是隐藏了()
运算符的显式类型转换。例如:
int intValue = 10;
long longValue = (long)intValue; // 等价于 long longValue = intValue;
接下来,将分别研究数值类型、引用类型的显式类型转换,以及拆箱转换和显式类型转换的关系。
2.1 数值类型
在下列情况下,由于不存在自动的隐式转换,因此必须明确地进行显式类型转换:
sbyte
到byte
、ushort
、uint
、ulong
、char
byte
到sbyte
、char
short
到sbyte
、byte
、ushort
、uint
、ulong
、char
ushort
到sbyte
、byte
、short
、char
int
到sbyte
、byte
、short
、ushort
、uint
、ulong
、char
uint
到sbyte
、byte
、short
、ushort
、int
、char
long
到sbyte
、byte
、short
、ushort
、int
、uint
、ulong
、char
ulong
到sbyte
、byte
、short
、ushort
、int
、uint
、long
、char
char
到sbyte
、byte
、short
float
到sbyte
、byte
、short
、ushort
、int
、uint
、long
、ulong
、char
、decimal
double
到sbyte
、byte
、short
、ushort
、int
、uint
、long
、ulong
、char
、float
、decimal
decimal
到sbyte
、byte
、short
、ushort
、int
、uint
、long
、ulong
、char
、float
、double
我们知道,隐式类型转换可以看作省略了()
运算符的显式类型转换,因此对于数值类型间的转换来说,总是使用()
运算符也没问题。
但是,显式的数值类型转换有可能造成信息丢失或者导致系统抛出异常,这也是系统为什么对于这种类型转换要求人工干预并且特别确认的原因。
2.2 溢出检查
当一种整型转换到另一种整型,这个过程取决于溢出检查上下文。checked
关键字用于对整型算术运算和转换显式启用溢出检查,而unchecked
关键字则用于取消整型算术运算和转换的溢出检查。
启用溢出检查
操作数的值在目标类型的取值范围内,则转换成功,否则将抛出一个System.OverflowException
异常,如代码清单5-7所示。
代码清单5-7 使用checked上下文
using System;
namespace ProgrammingCSharp4
{
class TypeConvert
{
static void Main(string[] args)
{
TypeConvert typeConvert = new TypeConvert();
typeConvert.DoSomething();
}
public void DoSomething()
{
// MyInt的值为2147483647.
try
{
int MyInt = int.MaxValue;
byte MyByte = checked((byte)MyInt);
}
catch (OverflowException)
{
throw;
}
}
}
}
在上述代码中,第18行中的int
型变量MyInt
的值为2,147,483,647
,在第19行将MyInt
强制转换为byte
类型后,由于byte
型的取值范围为0~255
,因为这里使用了checked
关键字启用了溢出检查,因此这里因为byte
型无法容纳远大于其容量的数值而抛出System.OverflowException
异常。
取消溢出检查
由于在转换过程将不检查数据是否超过目标类型的取值范围,意味着类型转换永远都会成功。如果源类型的取值范围大于目标类型,那么超过的部分将被截掉;如果源类型的取值范围小于目标类型,那么转换后将使用符号或者零填充至与目标类型的大小相等;如果等于则直接转换至目标类型,如代码清单5-8所示。
代码清单5-8 使用unchecked上下文
namespace ProgrammingCSharp4
{
class TypeConvert
{
static void Main(string[] args)
{
TypeConvert typeConvert = new TypeConvert();
typeConvert.DoSomething();
}
public void DoSomething()
{
// MyInt的值为2147483647.
try
{
int MyInt = int.MaxValue;
byte MyByte = (byte)MyInt;
}
catch (OverflowException)
{
throw;
}
}
}
}
第17行并没有启用溢出检查,因此并没有抛出System.OverflowException
异常,但转换的值也是有问题的。限于byte
类型的取值范围,这里赋值后MyByte
的值将为255
,与原始值可以说大相径庭。第19行还可以使用unchecked
关键字改写:
byte MyByte = unchecked((byte)MyInt);
2.3 引用类型
引用类型不同于值类型,它由两部分组成:栈中的变量和堆中的对象。对于引用类型的显式类型转换来说,转换的是栈中变量的类型,而该变量指向的位于堆中的对象则类型和数据都不受影响。一般来说,从基类向派生类的转换需要显式转换,因为基类“宽”而派生类“窄”,故而必须进行显式类型转换。
符合下列情况之一的,需要进行显式类型转换:
object
类型到任何引用类型的转换(任何引用类型都是object
类型的子类);基类到派生类的转换;
类到其实现的接口的转换;
非密封类到其没有实现接口的转换;
接口到另一个不是其基接口的转换;
System.Array
类型到数组类型的转换;System.Delegate
类型到委托类型的转换。
显式类型转换的结果是否成功只有在运行时才能知道,转换失败则会抛出System.InvalidCastException
异常。
2.4 拆箱
与装箱相反,从引用类型到值类型的转换称为拆箱。符合以下条件之一的进行拆箱操作:
从
object
类型或System.ValueType
到值类型的转换;从接口类型到值类型(实现了该接口)的转换;
从
System.Enum
类型到枚举类型的转换。
在执行拆箱操作前,编译器会首先检查引用类型是否是某个值类型或枚举类型的“装箱”版本,如果是就将其值拷贝出来,还原为值类型的变量。
3. as和is运算符
我们知道,隐式转换是安全的,而显式转换往往是不安全的,有可能造成精度损失,甚至会抛出异常。但类型转换又是不可避免的,例如对于某些集合类型,常常会用到System.Object
类型的变量(使用泛型可以避免这种情况),对于非泛型集合,在将数据放入集合时将发生“向上转型”,即当前类型信息丢失,数据的类型成了object
类型;而当需要把数据从集合取出时,因为需要恢复数据的本来类型,因此也就需要执行“向下转型”到它本来的类型。因此,如何更安全地进行类型转换就是一个值得探讨的问题了。幸好,C#已经为我们提供了解决方案,我们有两种选择:
使用
as
运算符进行类型转换;先使用
is
运算符判断类型是否可以转换,再使用()
运算符进行显式类型转换。
那么,我们先来介绍一下as
和is
运算符:
as
运算符用于在两个引用类型之间进行转换,如果转换失败则返回null
,并不抛出异常,因此转换是否成功可以通过结果是否为null
进行判断,并且只能在运行时才能判断。
代码示例
using System;
namespace ProgrammingCSharp4
{
class Class1 { }
class Class2 { }
class TypeConvert
{
static void Main(string[] args)
{
object[] objArray = new object[6];
objArray[0] = new Class1();
objArray[1] = new Class2();
objArray[2] = "hello";
objArray[3] = 123;
objArray[4] = 123.4;
objArray[5] = null;
for (int i = 0; i < objArray.Length; ++i)
{
string s = objArray[i] as string;
Console.Write("{0}:", i);
if (s != null)
{
Console.WriteLine("是string类型,其值为:'" + s + "'");
}
else
{
Console.WriteLine("不是string类型");
}
}
}
}
}
这段代码用到了前面讲过的知识:数组、Console
对象、命名空间、类;也有如for
循环、if
判断等。
编译运行上述代码,输出结果为:
0:不是string类型
1:不是string类型
2:是string类型,其值为:'hello'
3:不是string类型
4:不是string类型
5:不是string类型
特别要注意的是,as
运算符有一定的适用范围,它只适用于引用类型或可以为null
的类型,而无法执行其他转换,如值类型的转换以及用户自定义的类型转换,这类转换应使用强制转换表达式来执行。
is
运算符用于检查对象是否与给定类型兼容,并不执行真正的转换。如果判断的对象引用为null
,则返回false
。由于仅仅判断是否兼容,因此它并不会抛出异常。用法如下:
if (obj is MyObject)
{
// 其他操作...
}
上述代码可以确定obj
变量是否是MyObject
类型的实例,或者是MyObject
类的派生类。
同样,也要注意is
的适用范围,它只适用于引用类型转换、装箱转换和拆箱转换。而不支持其他的类型转换,如值类型的转换。
现在,我们已经了解了as
和is
运算符,在实际工作中建议尽量使用as
运算符,而少使用()
运算符显式转换。理由如下:
无论是
as
还是is
运算符,都比直接使用()
运算符强制转换更安全;不会抛出异常,免除了使用
try...catch
进行异常捕获的必要和系统开销,只需要判断是否为null
;使用
as
比使用is
性能上更好,这一点可以通过代码清单5-9来说明。
代码清单5-9 as和is运算符的性能对比
using System;
using System.Diagnostics;
namespace ProgrammingCSharp4
{
class Class1 { }
class AsIsSample
{
private Class1 c1 = new Class1();
public static void Main()
{
AsIsSample aiSample = new AsIsSample();
Stopwatch timer = new Stopwatch();
timer.Start();
for (int i = 0; i < 10000; i++)
{
aiSample.DoSomething1();
}
timer.Stop();
decimal micro = timer.Elapsed.Ticks / 10m;
Console.WriteLine("执行DoSomething1() 10000次的时间:{0:F1} 微秒.", micro);
timer = new Stopwatch();
timer.Start();
for (int i = 0; i < 10000; i++)
{
aiSample.DoSomething2();
}
timer.Stop();
micro = timer.Elapsed.Ticks / 10m;
Console.WriteLine("执行DoSomething2() 10000次的时间:{0:F1} 微秒.", micro);
}
public void DoSomething1()
{
object c2 = c1;
if (c2 is Class1)
{
Class1 c = (Class1)c2;
}
}
public void DoSomething2()
{
object c2 = c1;
Class1 c = c2 as Class1;
if (c != null)
{
// 其他操作...
}
}
}
}
输出为:
执行DoSomething1() 10000次的时间:288.9 微秒.
执行DoSomething2() 10000次的时间:258.6 微秒.
从第37行开始,声明并定义了两个方法:DoSomething1
和DoSomething2
,其中分别使用is
和as
运算符进行类型转换。在第18行和第28行对每个方法分别连续调用10,000次,通过使用BCL中的Stopwatch
对象对两者的调用时间进行统计。从结果可以看出,DoSomething2()
的性能比DoSomething1()
要好。至于原因,可以通过查看DoSomething1
和DoSomething2
两个方法的CIL代码来一探究竟。方法DoSomething1
的CIL代码如代码清单5-10所示。
代码清单5-10 方法DoSomething1的CIL代码
.method public hidebysig instance void DoSomething1() cil managed
{
// Code size 34 (0x22)
.maxstack 2
.locals init ([0] object c2, [1] class ProgrammingCSharp4.Class1 c, [2] bool CS$4$0000)
IL_0000: nop
IL_0001: ldarg.0
IL_0002: ldfld class ProgrammingCSharp4.Class1 ProgrammingCSharp4.AsIsSample::c1
IL_0007: stloc.0
IL_0008: ldloc.0
IL_0009: isinst ProgrammingCSharp4.Class1
IL_000e: ldnull
IL_000f: cgt.un
IL_0011: ldc.i4.0
IL_0012: ceq
IL_0014: stloc.2
IL_0015: ldloc.2
IL_0016: brtrue.s IL_0021
IL_0018: nop
IL_0019: ldloc.0
IL_001a: castclass ProgrammingCSharp4.Class1
IL_001f: stloc.1
IL_0020: nop
IL_0021: ret
} // end of method ProgrammingCSharp4.AsIsSample::DoSomething1
代码清单5-10的第13行首先测试了是否能转换到Class1
类型,如果可以则进行转换;第23行再次测试能否转换到Class1
类型,如果测试成功则进行转换。
方法DoSomething2
的CIL代码如代码清单5-11所示。
代码清单5-11 方法DoSomething2的CIL代码
.method public hidebysig instance void DoSomething2() cil managed
{
// Code size 26 (0x1a)
.maxstack 2
.locals init ([0] object c2, [1] class ProgrammingCSharp4.Class1 c, [2] bool CS$4$0000)
nop
ldarg.0
ldfld class ProgrammingCSharp4.Class1 ProgrammingCSharp4.AsIsSample::c1
stloc.0
ldloc.0
isinst ProgrammingCSharp4.Class1
stloc.1
ldloc.1
ldnull
ceq
stloc.2
ldloc.2
brtrue.s IL_0019
nop
nop
ret
} // end of method ProgrammingCSharp4.AsIsSample::DoSomething2
代码清单5-11的第11行同样测试了能否转换到Class1
类型,如果可以则进行转换。
由此可见,前者进行了两次测试和检查,而后者只进行了一次测试,这是造成两者之间性能差异的原因。
现在我们总结下,什么场合该使用is
,什么场合该使用as
:如果测试对象的目的是确定它是否属于所需类型,并且如果测试结果为真,就要立即进行转换,这种情况下使用as
操作符的效率更高;但有时仅仅只是测试,并不想立即转换,也可能根本就不会转换,只是在对象实现了接口时,要将它加到一个列表中,这时is
操作符就是一种更好的选择。