1 为什么需要泛型
Java5之前,是没有泛型的。通过两段代码我们就可以知道为何我们需要泛型
public int addInt(int a, int b) {
return a + b;
}
public double addDouble(double a, double b) {
return a + b;
}
实际开发中,经常有数值类型求和的需求,例如实现int类型的加法, 有时候还需要实现long类型的求和, 如果还需要Float类型的求和,需要重新在重载一个输入是Float类型的add方法。
再举个例子:
public class NoGenericsTest {
public static void main(String[] args) {
List list = new ArrayList();
list.add("Hello");
list.add(123);
list.add(45.67);
for (int i = 0; i < list.size(); i++) {
String item = (String) list.get(i); //1
System.out.println(item);
}
}
}
上面的代码执行,将会出现如下的错误:
定义了一个List类型的集合,先向其中加入了两个字符串类型的值,随后加入一个Integer类型的值。这是完全允许的,因为此时list默认的类型为Object类型。在之后的循环中,由于忘记了之前在list中也加入了Integer类型的值或其他编码原因,很容易出现类似于//1中的错误。因为编译阶段正常,而运行时会出现“java.lang.ClassCastException”异常。因此,导致此类错误编码过程中不易发现。
在如上的编码过程中,我们发现主要存在两个问题:
1.当我们将一个对象放入集合中,集合不会记住此对象的类型,当再次从集合中取出此对象时,改对象的编译类型变成了Object类型,但其运行时类型任然为其本身类型。
2.因此,//1处取出集合元素时需要人为的强制类型转化到具体的目标类型,且很容易出现“java.lang.ClassCastException”异常。
所以泛型的好处就是:
- 适用于多种数据类型执行相同的代码
- 泛型中的类型在使用时指定,不需要强制类型转换
2 泛型类和泛型接口
泛型,即“参数化类型”。一提到参数,最熟悉的就是定义方法时有形参,然后调用此方法时传递实参。那么参数化类型怎么理解呢?
顾名思义,就是将类型由原来的具体的类型参数化,类似于方法中的变量参数,此时类型也定义成参数形式(可以称之为类型形参),然后在使用/调用时传入具体的类型(类型实参)。
泛型的本质是为了参数化类型(在不创建新的类型的情况下,通过泛型指定的不同类型来控制形参具体限制的类型)。也就是说在泛型使用过程中,操作的数据类型被指定为一个参数,这种参数类型可以用在类、接口和方法中,分别被称为泛型类、泛型接口、泛型方法。
引入一个类型变量T(其他大写字母都可以,不过常用的就是T,E,K,V等等),并且用<>括起来,并放在类名的后面。泛型类是允许有多个类型变量的.
2.1 泛型类
public class NormalGeneric<T> {
private T value;
public NormalGeneric(T value) {
this.value = value;
}
public T getValue() {
return value;
}
public void setValue(T value) {
this.value = value;
}
@Override
public String toString() {
return "NormalGeneric{" +
"value=" + value +
'}';
}
}
package com.coy.generics;
public class NormalGeneric2<T,K> {
private T data;
private K result;
public NormalGeneric2(T t, K k) {
this.data = t;
this.result = k;
}
public T getData() {
return data;
}
public void setData(T data) {
this.data = data;
}
public K getResult() {
return result;
}
public void setResult(K result) {
this.result = result;
}
}
泛型接口与泛型类的定义基本相同:
2.2 泛型接口
public interface Generator<T> {
public T next();
}
而实现泛型接口的类,有两种实现方法:
1. 未传入泛型实参时:
public class ImplGenerator<T> implements Generator<T>{
@Override
public T next() {
return null;
}
}
在new出类的实例时,需要指定具体类型:
public static void main(String[] args) {
ImplGenerator<String> implGenerator = new ImplGenerator<>();
}
2. 传入泛型实参
public class ImplGenerator2 implements Generator<String>{
@Override
public String next() {
return "OK";
}
}
在new出类的实例时,和普通的类没区别。
2.3 泛型方法
public class GenericMethod {
public <T> T genericMethod(T... t) {
// 这里可以对 T 类型的参数进行处理
return t[t.length/ 2]; // 返回中间的元素作为示例
}
public void test(int x, int y) {
// 这是一个普通方法,不是泛型方法
System.out.println("普通方法: " + (x + y));
}
public static void main(String[] args) {
GenericMethod gm = new GenericMethod();
// 调用普通方法
gm.test(12, 34);
// 调用泛型方法
String result = gm.genericMethod("Hello", "World", "Generics");
System.out.println(result); // 输出: World
Integer intResult = gm.genericMethod(1, 2, 3, 4, 5);
System.out.println(intResult); // 输出: 3
}
}
泛型方法,是在调用方法的时候指明泛型的具体类型 ,泛型方法可以在任何地方和任何场景中使用,包括普通类和泛型类。注意泛型类中定义的普通方法和泛型方法的区别。
普通方法:
public class GenericNormalMethod<T> {
/**
* 普通泛型方法
* 虽然在方法中使用了泛型,但是这并不是一个泛型方法。
* 这只是类中一个普通的成员方法,只不过他的返回值是在声明泛型类已经声明过的泛型
* 所以在这个方法中才可以继续使用 т 这个泛型。
*
* @param t 泛型参数
* @return 返回泛型参数
*
*/
public T normalMethod(T t) {
return t;
}
}
泛型方法:
public class GenericGenericMethod {
/**
* 这才是一个真正的泛型方法。
* 首先在public与返回值之间的<T>必不可少,这表明这是一个泛型方法,并且声明了一个泛型
* 这个τ可以出现在这个泛型方法的任意位置,
* 泛型的数量也可以为任意多个
* 如:public <T, V> T show(T t, V v) {}
*
* @param t
* @return
* @param <T>
*/
public <T> T show(T t) {
return t;
}
public <T, V> T show(T t, V v) {
return t;
}
}
3 限定类型变量
有时候,我们需要对类型变量加以约束,比如计算两个变量的最小,最大值。
public static <T> T min(T a, T b) {
if (a instanceof Comparable && b instanceof Comparable) {
Comparable<T> compA = (Comparable<T>) a;
Comparable<T> compB = (Comparable<T>) b;
return compA.compareTo(compB) < 0 ? a : b;
}
throw new IllegalArgumentException("Arguments must be comparable");
}
请问,如何确保传入的两个变量一定有compareTo方法?那么解决这个问题的方案就是将T限制为实现了接口Comparable的类
public static <T extends Comparable> T min(T a, T b) {
if (a.compareTo(b) < 0) {
return a;
} else {
return b;
}
}
T extends Comparable中
T表示应该绑定类型的子类型,Comparable表示绑定类型,子类型和绑定类型可以是类也可以是接口。
如果这个时候,我们试图传入一个没有实现接口Comparable的类的实例,将会发生编译错误。
public static <T extends Comparable> T min(T a, T b) {
if (a.compareTo(b) < 0) {
return a;
} else {
return b;
}
}
public static <T extends Comparable & Serializable> T max(T a, T b) {
if (a.compareTo(b) > 0) {
return a;
} else {
return b;
}
}
static class Test{}
public static void main(String[] args) {
GenericGenericMethod.min("abc", "xyz"); // 输出: abc
Integer minInt = GenericGenericMethod.min(3, 5);
System.out.println(minInt); // 输出: 3
Integer maxInt = GenericGenericMethod.max(3, 5);
System.out.println(maxInt); // 输出: 5
Test test1 = new Test();
Test test2 = new Test();
Test minTest = GenericGenericMethod.min(test1, test2); // 报错
System.out.println(minTest); // 输出: com.coy.generics.GenericGenericMethod$Test@<hashcode>
}
同时extends左右都允许有多个,如 <T,V extends Comparable & Serializable>
注意:限定的类型中(Comparable & Serializable),只允许有一个是class类型,而且如果有class类型,这个class的类必须是限定列表的第一个,因为Java中类是单继承。这种类的限定既可以用在泛型方法上也可以用在泛型类上。
4 泛型中的约束和局限性
现在我们有泛型类
public class Restrict<T> {
}
4.1 不能用基本类型实例化类型参数
Restrict<double> restrict = new Restrict<>(); // 错误
Restrict<Double> restrictDouble = new Restrict<>(); // 正确
Java 的泛型只支持引用类型,不支持基本类型(如 int、double 等)。这是因为泛型的实现基于类型擦除,编译后泛型类型参数会被替换为 Object 或限定类型,而基本类型不能作为 Object 的子类。
例如,Restrict<int> 这样的写法会报错,必须用包装类型 Restrict<Integer>。
总结:
泛型类型参数只能是引用类型,不能是基本类型。
如果需要用基本类型,使用对应的包装类(如 Integer、Double)
4.2 运行时类型查询只适用于原始类型
if (restrictDouble instanceof Restrict<Double>) {} // 这种不允许
if (restrictDouble instanceof Restrict) {} // 这种不允许
Restrict<String> restrictString = new Restrict<>();
System.out.println(restrictDouble.getClass() == restrictString.getClass()); // This will print false because they are different type parameters
System.out.println(restrictDouble.getClass().getSimpleName()); // This will print "Restrict"
因为 Java 的泛型在编译后会进行类型擦除,所有的泛型类型参数(如 Restrict<String>、Restrict<Integer>)在运行时都变成了原始类型(如 Restrict)。运行时虚拟机只知道原始类型,不知道具体的泛型参数类型。
所以,instanceof Restrict 是允许的,但 instanceof Restrict<String> 是非法的,因为运行时没有 Restrict<String> 这个类型信息。
总结:
运行时只保留原始类型信息,泛型参数信息被擦除。
因此类型查询(如 instanceof、getClass())只能用于原始类型。
4.3 泛型类的静态上下文中类型变量失效
// 静态域或者方法里不能引用类型变量
private static T instance; // 错误, 静态成员不能直接引用类的泛型类型参数
// 静态方法不能引用类的类型变量
// private static T getInstance2() {} // 错误,静态方法不能直接引用类的泛型类型参数
//静态方法本身是泛型方法就行
private static <T> T getInstance() {} // 正确,如果需要在静态方法中使用泛型,必须让方法本身成为泛型方法(即在方法声明上加<T>),这样T是方法级别的,与类的泛型参数无关。
不能在静态域或方法中引用类型变量。泛型类型参数(如T)是在类实例化时由外部指定的,而静态成员属于类本身,不依赖于任何实例。类加载时,静态成员就已经初始化了,但这时还没有任何泛型类型信息(因为还没创建对象)。同样的静态方法在类加载时随类一起加载到方法区(或元空间),但只有在第一次主动使用该类(如创建对象、访问静态成员、调用静态方法等)时,类才会被加载和初始化。静态方法属于类本身,不依赖于实例。所以静态域或静态方法不能直接引用类的泛型类型参数。
通俗点讲因为泛型是要在对象创建的时候才知道是什么类型的,而对象创建的代码执行先后顺序为先是static的部分,然后才是构造函数等等。所以在对象初始化之前static的部分已经执行了,如果你在静态部分引用的泛型,那么毫无疑问虚拟机根本不知道是什么东西,因为这个时候类还没有初始化。
4.4 不能创建参数化类型的数组
// 不能创建参数化类型的数组
Restrict<Double>[] restrictArray; // 可以
// private Restrict<String>[] restrictArray = new Restrict<String>[10]; // 不允许
Java 的泛型是通过类型擦除实现的,编译后泛型类型参数会被擦除为原始类型(如 Object)。而数组在运行时需要知道其元素的具体类型,以保证类型安全。如果允许创建参数化类型的数组(如 new Restrict<String>[10]),在运行时无法检查数组元素的实际类型,可能导致类型安全问题。这样做会破坏 Java 的类型安全机制,因此 Java 不允许直接创建参数化类型的数组。
总结:泛型信息在运行时不可用,数组需要运行时类型信息,所以不能创建参数化类型的数组。
4.5 不能实例化类型变量
public class Restrict<T> {
private T value;
// 不能实例化类型变量
public Restrict() {
value = new T();
}
}
Java 的泛型是通过类型擦除实现的,类型参数 T 在编译后会被擦除为它的限定类型(默认是 Object)。在运行时,JVM 并不知道 T 具体是什么类型,因此无法直接执行 new T() 这样的操作,因为没有类型信息来创建对象。
如果需要实例化类型变量,通常有两种做法:
1. 通过构造函数传入 Class<T>,用反射创建对象。
2. 让调用者传入需要的实例。
public class Restrict<T> {
private T value;
public Restrict(Class<T> clazz) throws IllegalAccessException, InstantiationException {
value = clazz.newInstance();
}
}
4.6 不能捕获泛型类的实例
//泛型类不能extends Exception/Throwable
// private class Problem<K> extends Exception{}
// 不能捕获泛型类对象
// public <T extends Throwable> void doSomething(T t) {
// // 不能捕获泛型类对象
// try {
//
// } catch (T e) {
// // 这里的e是T类型,但T是Throwable的子类
// System.out.println("Caught: " + e);
// }
// }
Java 的泛型是通过类型擦除实现的,类型参数(如 T)在编译后会被擦除为限定类型(如 Throwable 或 Object)。而 catch 语句在编译时需要明确的异常类型,不能是类型变量。编译器无法确定 T 具体是什么类型,因此不能写 catch (T e)。
总结:
1. catch 语句要求捕获的异常类型在编译期已知。
2. 泛型类型参数在编译期无法确定具体类型,类型擦除后只剩原始类型。
所以不能捕获泛型类对象。
但是这样是可以的:
public <T extends Throwable> void doSomething(T t) throws T {
// 不能捕获泛型类对象
try {
// 模拟一些操作
throw t; // 抛出传入的异常
} catch (Throwable e) {
// 这里的e是Throwable类型,但T是Throwable的子类
System.out.println("Caught: " + e);
throw (T) e; // 强制转换为T类型并抛出
}
}
5 泛型类型的继承规则
现在我们有一个类和子类:
public class Employee {
}
public class Worker extends Employee{
}
有一个泛型类:
public class Pair<T> {
}
请问Pair<Employee>和Pair<Worker>是继承关系吗?
答案:不是。Pair<Employee> 和 Pair<Worker> 之间没有继承关系。虽然 Worker 继承自 Employee,但泛型类型参数不同的泛型类是完全独立的类型。在 Java 中,Pair<Worker> 不是 Pair<Employee> 的子类。
但是泛型类可以继承或者扩展其他泛型类,比如List和ArrayList
/**
* 但是泛型类可以继承或者扩展其他泛型类,比如List和ArrayList
* @param <T>
*/
public class ExtendPair<T> extends Pair<T> {
}
Pair<Employee> pair = new ExtendPair<Employee>();
6 通配符类型
正是因为前面所述的,Pair<Employee>和Pair<Worker>没有任何关系,
public class Fruit {
}
public class Apple extends Fruit{
}
public class Orange extends Fruit{
}
public class HongFuShi extends Apple{
}
如果我们有一个泛型类和一个方法:
public static void print(GenericType<Fruit> generics) {
System.out.println(generics);
}
public class GenericType<T> {
}
则会产生这种情况:
为解决这个问题,于是提出了一个通配符类型 ?
有两种使用方式:
? extends X 表示类型的上界,类型参数是X的子类
? super X 表示类型的下界,类型参数是X的超类
这两种方式从名字上来看,特别是super,很有迷惑性,下面我们来仔细辨析这两种方法。
6.1 ? extends X
表示传递给方法的参数,必须是X的子类(包括X本身)
public class Caller {
public static void print2(GenericType<? extends Fruit> generics) {
System.out.println(generics);
}
public static void use2() {
GenericType<Fruit> a = new GenericType<>();
print2(a);
GenericType<Apple> b = new GenericType<>();
print2(b);
GenericType<? extends Fruit> c = b;
}
}
但是对泛型类GenericType来说,如果其中提供了get和set类型参数变量的方法的话,set方法是不允许被调用的,会出现编译错误
public class GenericType<T> {
private T value;
public T getValue() {
return value;
}
public void setValue(T value) {
this.value = value;
}
@Override
public String toString() {
return "GenericType{" +
"value=" + value +
'}';
}
}
get方法则没问题,会返回一个Fruit类型的值。
为何?
道理很简单,? extends X 表示类型的上界,类型参数是X的子类,那么可以肯定的说,get方法返回的一定是个X(不管是X或者X的子类)编译器是可以确定知道的。但是set方法只知道传入的是个X,至于具体是X的那个子类,不知道。
总结:主要用于安全地访问数据,可以访问X及其子类型,并且不能写入非null的数据。
6.2 ? super X
表示传递给方法的参数,必须是X的超类(包括X本身)
public class Caller {
public static void printSuper(GenericType<? super Apple> generics) {
System.out.println(generics);
}
public static void useSuper() {
GenericType<Fruit> fruitGenericType = new GenericType<>();
printSuper(fruitGenericType);
GenericType<Apple> appleGenericType = new GenericType<>();
printSuper(appleGenericType);
GenericType<HongFuShi> hongFuShiGenericType = new GenericType<>();
printSuper(hongFuShiGenericType); // 编译错误,HongFuShi不是Apple的父类
GenericType<Orange> orangeGenericType = new GenericType<>();
printSuper(orangeGenericType); // 编译错误,Orange不是Apple的父类
}
}
但是对泛型类GenericType来说,如果其中提供了get和set类型参数变量的方法的话,set方法可以被调用的,且能传入的参数只能是X或者X的子类:
public class GenericType<T> {
private T value;
public T getValue() {
return value;
}
public void setValue(T value) {
this.value = value;
}
@Override
public String toString() {
return "GenericType{" +
"value=" + value +
'}';
}
}
public static void useSuper() {
GenericType<? super Apple> e = new GenericType<>();
Apple apple = new Apple();
Fruit fruit = new Fruit();
HongFuShi hongFuShi = new HongFuShi();
e.setValue(fruit); // 编译错误,不能将Fruit赋值给Apple的父类
e.setValue(apple); // 可以将Apple赋值给Apple的父类
e.setValue(hongFuShi); // 可以将HongFuShi赋值给Apple的父类
}
get方法只会返回一个Object类型的值:
GenericType<? super Apple> e = new GenericType<>();
Object fruit1 = e.getValue(); // 唯一可行的获取值,返回类型为Object,因为e的类型是Apple的父类,所以getValue()返回的是Object类型
为什么会这样子呢?
? super X 表示类型的下界,类型参数是X的超类(包括X本身),那么可以肯定的说,get方法返回的一定是个X的超类,那么到底是哪个超类?不知道,但是可以肯定的说,Object一定是它的超类,所以get方法返回Object。编译器是可以确定知道的。对于set方法来说,编译器不知道它需要的确切类型,但是X和X的子类可以安全的转型为X。
总结:主要用于安全地写入数据,可以写入X及其子类型。
7 无限定的通配符 ?
表示对类型没有什么限制,可以把?看成所有类型的父类,如Pair< ?>;
比如:
ArrayList<T> al=new ArrayList<T>(); 指定集合元素只能是T类型
ArrayList<?> al=new ArrayList<?>(); 集合元素可以是任意类型,这种没有意义,一般是方法中,只是为了说明用法。
在使用上:
? getFirst() : 返回值只能赋给 Object;
void setFirst(?) : setFirst 方法不能被调用, 甚至不能用 Object 调用;
8 虚拟机是如何实现泛型的?
泛型思想早在C++语言的模板(Template)中就开始生根发芽,在Java语言处于还没有出现泛型的版本时,只能通过Object是所有类型的父类和类型强制转换两个特点的配合来实现类型泛化。由于Java语言里面所有的类型都继承于java.lang.Object,所以Object转型成任何对象都是有可能的。但是也因为有无限的可能性,就只有程序员和运行期的虚拟机才知道这个Object到底是个什么类型的对象。在编译期间,编译器无法检查这个Object的强制转型是否成功,如果仅仅依赖程序员去保障这项操作的正确性,许多ClassCastException的风险就会转嫁到程序运行期之中。
泛型技术在C#和Java之中的使用方式看似相同,但实现上却有着根本性的分歧,C#里面泛型无论在程序源码中、编译后的IL中(Intermediate Language,中间语言,这时候泛型是一个占位符),或是运行期的CLR中,都是切实存在的,List<int>与List<String>就是两个不同的类型,它们在系统运行期生成,有自己的虚方法表和类型数据,这种实现称为类型膨胀,基于这种方法实现的泛型称为真实泛型。
Java语言中的泛型则不一样,它只在程序源码中存在,在编译后的字节码文件中,就已经替换为原来的原生类型(Raw Type,也称为裸类型)了,并且在相应的地方插入了强制转型代码,因此,对于运行期的Java语言来说,ArrayList<int>与ArrayList<String>就是同一个类,所以泛型技术实际上是Java语言的一颗语法糖,Java语言中的泛型实现方法称为类型擦除,基于这种方法实现的泛型称为伪泛型。
将一段Java代码编译成Class文件,然后再用字节码反编译工具进行反编译后,将会发现泛型都不见了,程序又变回了Java泛型出现之前的写法,泛型类型都变回了原生类型
public static String method(List<String> list) {
return "List<String>";
}
public static Integer method(List<Integer> list) {
return 0;
}
上面这段代码是不能被编译的,因为参数List<Integer>和List<String>编译之后都被擦除了,变成了一样的原生类型List<E>,擦除动作导致这两种方法的特征签名变得一模一样。
由于Java泛型的引入,各种场景(虚拟机解析、反射等)下的方法调用都可能对原有的基础产生影响和新的需求,如在泛型类中如何获取传入的参数化类型等。因此,JCP组织对虚拟机规范做出了相应的修改,引入了诸如Signature、LocalVariableTypeTable等新的属性用于解决伴随泛型而来的参数类型的识别问题,Signature是其中最重要的一项属性,它的作用就是存储一个方法在字节码层面的特征签名[3],这个属性中保存的参数类型并不是原生类型,而是包括了参数化类型的信息。修改后的虚拟机规范要求所有能识别49.0以上版本的Class文件的虚拟机都要能正确地识别Signature参数。
另外,从Signature属性的出现我们还可以得出结论,擦除法所谓的擦除,仅仅是对方法的Code属性中的字节码进行擦除,实际上元数据中还是保留了泛型信息,这也是我们能通过反射手段取得参数化类型的根本依据。