9.Java 集合框架：List、Set、Map 的使用与选择-易微帮

在 Java 编程世界里，集合框架是开发者手中的重要工具，它为数据的存储和操作提供了丰富的选择。本文将聚焦于 List、Set、Map 三大核心接口下的常见实现类，对比 ArrayList 与 LinkedList、HashSet 与 TreeSet、HashMap 与 TreeMap 的底层原理和性能差异，并结合有趣的案例，帮助大家掌握集合的选型与操作技巧。

一、List 家族：ArrayList vs LinkedList

1. 底层原理大揭秘

ArrayList：底层基于动态数组实现。它允许元素有序、可重复，并且可以通过索引快速访问元素。当向 ArrayList 中添加元素时，如果当前数组容量不足，会自动进行扩容，通常是按照当前容量的 1.5 倍进行扩展。
LinkedList：底层是双向链表结构。每个节点包含前驱指针和后继指针，能够方便地进行链表的遍历和节点的插入、删除操作。它同样允许元素有序、可重复，但不存在容量的概念，因为链表的长度可以动态变化。

2. 性能差异对比

操作类型	ArrayList	LinkedList
随机访问（get）	高效 O (1)	低效 O (n)
头部插入 / 删除	低效 O (n)	高效 O (1)
中间插入 / 删除	低效 O (n)	高效 O (1)
尾部插入	高效 O (1) （均摊）	高效 O (1)

3. 案例：学生名单管理

假设我们要管理一个班级的学生名单，经常需要进行以下操作：

按学号快速查找学生：比如老师要在课堂上随机点名，根据学号快速找到对应的学生信息。此时 ArrayList 是更好的选择，因为它的随机访问性能出色，能够快速通过索引定位到学生。
频繁插入转学生：当有新的转学生加入班级，需要将其插入到名单的中间位置（例如按照学号顺序插入）。这时 LinkedList 的优势就体现出来了，不需要像 ArrayList 那样移动大量后续元素，只需修改前后节点的指针即可完成插入操作。

以下是使用 ArrayList 和 LinkedList 管理学生名单的示例代码：

import java.util.ArrayList;
import java.util.LinkedList;
import java.util.List;

// 学生类
class Student {
    private int id;
    private String name;

    public Student(int id, String name) {
        this.id = id;
        this.name = name;
    }

    public int getId() {
        return id;
    }

    public String getName() {
        return name;
    }

    @Override
    public String toString() {
        return "Student{id=" + id + ", name='" + name + "'}";
    }
}

public class StudentListManager {
    public static void main(String[] args) {
        // 使用 ArrayList 管理学生名单
        List<Student> arrayListStudents = new ArrayList<>();
        // 添加学生
        arrayListStudents.add(new Student(1, "张三"));
        arrayListStudents.add(new Student(2, "李四"));
        arrayListStudents.add(new Student(3, "王五"));
        
        // 快速随机访问学生
        System.out.println("ArrayList 随机访问：" + arrayListStudents.get(1));
        
        // 中间插入转学生（效率较低）
        long startTime = System.nanoTime();
        arrayListStudents.add(1, new Student(4, "赵六"));
        long endTime = System.nanoTime();
        System.out.println("ArrayList 中间插入耗时：" + (endTime - startTime) + " 纳秒");

        // 使用 LinkedList 管理学生名单
        List<Student> linkedListStudents = new LinkedList<>();
        // 添加学生
        linkedListStudents.add(new Student(1, "张三"));
        linkedListStudents.add(new Student(2, "李四"));
        linkedListStudents.add(new Student(3, "王五"));
        
        // 中间插入转学生（效率较高）
        startTime = System.nanoTime();
        ((LinkedList<Student>) linkedListStudents).add(1, new Student(4, "赵六"));
        endTime = System.nanoTime();
        System.out.println("LinkedList 中间插入耗时：" + (endTime - startTime) + " 纳秒");
    }
}

4. 选型建议

当需要频繁进行随机访问操作时，优先选择 ArrayList。
当需要频繁在头部或中间位置进行插入、删除操作时，LinkedList 更为合适。
对于尾部插入操作，两者性能相近，但 ArrayList 在内存占用上可能更紧凑，因为链表的每个节点需要额外存储指针。

二、Set 家族：HashSet vs TreeSet

1. 底层原理剖析

HashSet：底层基于 HashMap 实现，只不过 Set 存储的元素作为 HashMap 的键，值则统一使用一个默认的 Object 对象。它通过哈希函数来确定元素的存储位置，保证元素的唯一性，但不保证元素的顺序。
TreeSet：底层使用红黑树（一种自平衡的二叉搜索树）结构。它不仅能保证元素的唯一性，还能按照自然顺序（元素实现 Comparable 接口）或定制顺序（传入 Comparator 接口）对元素进行排序。

2. 性能差异对比

操作类型	HashSet	TreeSet
添加（add）	高效 O (1)（均摊）	高效 O (log n)
查找（contains）	高效 O (1)（均摊）	高效 O (log n)
遍历	无序遍历	有序遍历 O (n)

3. 案例：用户兴趣标签管理

现在我们要为一个社交应用存储用户的兴趣标签，不同的业务场景对集合有不同的需求：

快速添加和查找兴趣标签：比如用户在注册时选择自己的兴趣爱好，系统需要快速判断某个标签是否已经存在，以避免重复添加。此时 HashSet 是首选，它的哈希查找性能非常高效，能够快速完成判断。
按热门程度排序展示标签：假设我们需要将用户的兴趣标签按照标签名称的字母顺序进行展示，方便用户浏览和选择。这时候 TreeSet 就派上用场了，它可以自动对元素进行排序，无需我们额外编写排序逻辑。

以下是使用 HashSet 和 TreeSet 管理用户兴趣标签的示例代码：

import java.util.*;

public class InterestTagManager {
    public static void main(String[] args) {
        // 使用 HashSet 管理兴趣标签（无序、快速查找）
        Set<String> hashSetTags = new HashSet<>();
        
        // 添加标签
        hashSetTags.add("Java");
        hashSetTags.add("Python");
        hashSetTags.add("C++");
        
        // 检查标签是否存在
        System.out.println("HashSet 中是否存在 Java 标签：" + hashSetTags.contains("Java"));
        
        // 使用 TreeSet 管理兴趣标签（有序、自动排序）
        Set<String> treeSetTags = new TreeSet<>();
        
        // 添加标签
        treeSetTags.add("Java");
        treeSetTags.add("Python");
        treeSetTags.add("C++");
        
        // 遍历有序标签
        System.out.println("TreeSet 有序遍历：");
        for (String tag : treeSetTags) {
            System.out.println(tag);
        }
        
        // 使用 TreeSet 自定义排序（按标签长度排序）
        Set<String> customSortedTags = new TreeSet<>(Comparator.comparingInt(String::length));
        customSortedTags.add("Java");
        customSortedTags.add("Python");
        customSortedTags.add("C++");
        
        System.out.println("按长度排序的 TreeSet：");
        for (String tag : customSortedTags) {
            System.out.println(tag);
        }
    }
}

4. 选型建议

如果只需要保证元素的唯一性，不关心元素的顺序，并且追求高效的添加和查找性能，HashSet 是最佳选择。
如果需要元素按照特定顺序存储和遍历，例如自然顺序或自定义顺序，TreeSet 则是更合适的选项。需要注意的是，TreeSet 的插入和查找性能会受到红黑树结构的影响，略低于 HashSet，但在有序性要求下是值得的。

三、Map 家族：HashMap vs TreeMap

1. 底层原理探究

HashMap：底层由数组和链表（JDK 8 及以后引入红黑树）组成的散列表结构。通过键的哈希值确定存储位置，当发生哈希冲突时，使用链表或红黑树来解决。它允许键和值为 null（但键只能有一个 null），不保证键的顺序。
TreeMap：同样基于红黑树实现，键会按照自然顺序或指定的比较器顺序进行排序。它不允许键为 null，因为红黑树的节点需要进行比较，而 null 无法参与比较操作。

2. 性能差异对比

操作类型	HashMap	TreeMap
插入（put）	高效 O (1)（均摊）	高效 O (log n)
查找（get）	高效 O (1)（均摊）	高效 O (log n)
按顺序遍历键	无序遍历	有序遍历 O (n)
范围查询（如获取大于某个键的所有键值对）	不支持高效范围查询	支持高效 O (log n + k)，k 为范围大小

3. 案例：学生成绩管理系统

在开发一个学生成绩管理系统时，我们需要根据不同的需求选择合适的 Map：

快速录入和查询成绩：老师需要快速录入每个学生的成绩，并根据学号快速查询某个学生的成绩。此时 HashMap 是理想选择，它的快速存取性能能够满足高频的录入和查询操作。
按学号排序展示成绩：学校需要将学生的成绩按照学号顺序进行统计和展示，方便进行成绩分析。TreeMap 可以自动对学号（键）进行排序，使得我们能够轻松地按顺序遍历所有学生的成绩。

以下是使用 HashMap 和 TreeMap 管理学生成绩的示例代码：

import java.util.*;

public class GradeManager {
    public static void main(String[] args) {
        // 使用 HashMap 管理学生成绩（无序、快速存取）
        Map<String, Integer> hashMapGrades = new HashMap<>();
        
        // 添加成绩
        hashMapGrades.put("001", 90);
        hashMapGrades.put("002", 85);
        hashMapGrades.put("003", 95);
        
        // 快速查询成绩
        System.out.println("学号 002 的成绩：" + hashMapGrades.get("002"));
        
        // 使用 TreeMap 管理学生成绩（有序、按学号排序）
        Map<String, Integer> treeMapGrades = new TreeMap<>();
        
        // 添加成绩（故意乱序）
        treeMapGrades.put("003", 95);
        treeMapGrades.put("001", 90);
        treeMapGrades.put("002", 85);
        
        // 按学号顺序遍历成绩
        System.out.println("按学号排序的成绩：");
        for (Map.Entry<String, Integer> entry : treeMapGrades.entrySet()) {
            System.out.println("学号：" + entry.getKey() + "，成绩：" + entry.getValue());
        }
        
        // TreeMap 范围查询（获取学号大于等于 002 的学生）
        System.out.println("学号大于等于 002 的学生：");
        SortedMap<String, Integer> tailMap = ((TreeMap<String, Integer>) treeMapGrades).tailMap("002");
        for (Map.Entry<String, Integer> entry : tailMap.entrySet()) {
            System.out.println("学号：" + entry.getKey() + "，成绩：" + entry.getValue());
        }
    }
}

4. 选型建议

当需要高效的键值对存取操作，且不关心键的顺序时，HashMap 是首选。
当需要键按照特定顺序存储，并且需要支持范围查询等操作时，TreeMap 更为合适。例如，在统计成绩时，需要获取成绩在某个分数段内的所有学生信息，TreeMap 的范围查询功能可以大大提高效率。

四、集合选型的通用原则

明确需求：首先确定数据是否需要有序、是否允许重复、是否需要根据键进行快速查找或排序等。
性能考量：根据常见的操作类型（如插入、删除、查找、遍历）选择合适的集合类。例如，频繁随机访问选 ArrayList，频繁有序遍历选 TreeSet/TreeMap。
特殊场景：注意一些特殊情况，如 HashMap 允许 null 键值，而 TreeMap 不允许键为 null；LinkedList 在内存占用上比 ArrayList 稍高，因为每个节点需要存储指针。

五、总结

通过深入理解不同集合类的底层原理和性能差异，结合具体的业务场景，我们能够更加精准地选择合适的集合，提高代码的效率和可读性。

9.Java 集合框架：List、Set、Map 的使用与选择

一、List 家族：ArrayList vs LinkedList

1. 底层原理大揭秘

2. 性能差异对比

3. 案例：学生名单管理

4. 选型建议

二、Set 家族：HashSet vs TreeSet

1. 底层原理剖析

2. 性能差异对比

3. 案例：用户兴趣标签管理

4. 选型建议

三、Map 家族：HashMap vs TreeMap

1. 底层原理探究

2. 性能差异对比

3. 案例：学生成绩管理系统

4. 选型建议

四、集合选型的通用原则

五、总结

微信公众号

今日签到

热门文章

最新发布