SQL 序列生成器

发布于:2023-01-20 ⋅ 阅读:(15) ⋅ 点赞:(0) ⋅ 评论:(0)

本篇介绍SQL:2016(ISO/IEC 9075:2016)标准中定义的序列生成器(Sequence generator)和相关操作,以及六种主流数据库中的实现及差异:Oracle、MySQL、Microsoft SQL Server、PostgreSQL、Db2、SQLite。

序列概述

在 SQL 中,序列生成器(简称序列)用于自动生成一系列不重复的数字。序列的数据类型通常是整数,包含一个最小值,一个最大值,一个起始值,一个增量值,以及一个循环使用选项。
sequence number

如果序列的增量是一个正整数,称为升序序列,例如 1,3,5,7,…(增量为 2);如果序列的增量是一个负整数,称为降序序列,例如2,1,0,-1,…(增量为 -1)。

由于序列可以生成不重复的值,因此通常用于主键值的生成;由于序列的值具有递增特性,因此可以用于记录各个操作发生的先后顺序。

序列可以通过两种方式进行定义:使用CREATE SEQUENCE语句创建一个外部序列;或者通过一个标识列(identity column)或自动增长列(auto increment column)隐式创建一个内部序列。

本文先介绍外部序列相关的操作,包括序列的创建、使用、修改和删除;最后介绍六种数据库中实现的标识列或自增列功能。

创建序列

在 SQL 中使用CREATE SEQUENCE创建一个外部序列,标准语法如下:

CREATE SEQUENCE seq_name
  [ AS data_type ]
  [ START WITH s ]
  [ INCREMENT BY i ]
  [ MAXVALUE M | NO MAXVALUE ]
  [ MINVALUE m | NO MINVALUE ]
  [ CYCLE | NO CYCLE ]
;

其中,只有序列名称 seq_name 是必须的参数;其他可选参数的意义如下:

  • AS data_type指定序列的数据类型,只能是整数类型;
  • START WITH s指定序列的初始值,s 是一个数值常量。默认为序列的最小值或者最大值;
  • INCREMENT BY i指定序列的增量值,i 是一个数值常量,负数表示降序序列。默认值为 1;
  • MAXVALUE M指定序列允许的最大值;NO MAXVALUE表示不指定最大值,通常由序列的数据类型或者数据库产品自定义一个最大值;
  • MINVALUE m指定序列允许的最小值;NO MINVALUE表示不指定最小值,通常由序列的数据类型或者数据库产品自定义一个最小值;
  • CYCLE表示当序列的取值到达最大值(最小值)时,是否重新循环使用;NO CYCLE表示当序列到达最大值(最小值)时,无法生成新的序列值。默认为NO CYCLE

MySQL 和 SQLite 目前还不支持创建序列对象。
Oracle 不支持指定序列的数据类型,默认使用 NUMBER 类型。

以下示例使用默认值创建一个名为 seq1 的序列:

-- For Oracle, SQL Server, PostgreSQL and Db2
CREATE SEQUENCE seq1;

对于 Oracle,以上语句创建一个从 1 开始,增量为 1,最小值为 1,最大值为 1028 - 1 的非循环序列。

对于 SQL Server,以上语句创建一个从 -263 开始,增量为 1,最小值为 -263,最大值为 263 - 1 的非循环序列。

对于 PostgreSQL,以上语句创建一个从 1 开始,增量为 1,最小值为 1,最大值为 263 - 1 的非循环序列。

对于 Db2,以上语句创建一个从 1 开始,增量为 1,最小值为 1,最大值为 231 - 1 的非循环序列。

以下语句创建一个从 10 开始,增量为 -2(降序),最小值为 0,最大值为 100 的循环序列。

-- For Oracle, SQL Server, PostgreSQL and Db2
CREATE SEQUENCE seq2
 START WITH 10
 INCREMENT BY -2
 MAXVALUE 100
 MINVALUE 0
 CYCLE;

序列 seq2 的取值依次为 10,8,6,…,0,100,98,… ;序列取值到达最小值(0)之后,再次从最大值开始(100)。

不同的数据库产品针对 SQL 标准进行了一些专有的扩展,以下是常见的扩展选项。

CACHE

Oracle、SQL Server、PostgreSQL 以及 Db2 都支持序列的缓存选项,例如:

-- For Oracle, SQL Server, PostgreSQL and Db2
CREATE SEQUENCE seq2
 START WITH 10
 INCREMENT BY -2
 MAXVALUE 100
 MINVALUE 0
 CYCLE
 CACHE 20;

使用 CACHE 选项可以减少获取序列值的磁盘操作,可以提高序列生成的性能。不过,此时服务崩溃(如电源故障)可能导致缓存中保留的序列号丢失。

使用序列

在 SQL 标准中,获取序列下一个值的语法如下:

NEXT VALUE FOR seq_name

SQL Server 和 Db2 遵循 SQL 标准;
Oracle 使用伪列 seq_name.NEXTVAL 获取下一个序列值;
PostgreSQL 使用函数 nextval(‘seq_name’) 获取下一个序列。

举例说明,以下查询使用序列 seq2 返回一系列数值。

-- For SQL Server and Db2
SELECT NEXT VALUE FOR seq2 AS Seq,
       employee_id,
       first_name,
       last_name
  FROM employees;
-- For Oracle only
SELECT seq2.NEXTVAL AS Seq,
       employee_id,
       first_name,
       last_name
  FROM employees;
-- For PostgreSQL only
SELECT nextval('seq2') AS Seq,
       employee_id,
       first_name,
       last_name
  FROM employees;

查询结果如下:
use sequence

对于查询结果中的每一行,即使存在同一个序列的多次调用,也只生成一次新值。例如,

-- For SQL Server and Db2
SELECT NEXT VALUE FOR seq2 AS Seq, -- seq2.NEXTVAL for Oracle
       NEXT VALUE FOR seq2 AS Seq_2, -- nextval('seq2') for PostgreSQL
       employee_id,
       first_name,
       last_name
  FROM employees;

查询结果中的每一行,字段 Seq 和 Seq_2 都返回了相同的值:
use sequence

同样可以在 INSERT 语句中使用序列的值,以下示例使用序列 seq2 为表 test_seq 生成主键值:

CREATE TABLE test_seq
    ( id   INTEGER NOT NULL PRIMARY KEY
    , name CHARACTER VARYING(20)
    ) ;
-- For SQL Server and Db2
INSERT INTO test_seq(id, name)
VALUES (NEXT VALUE FOR seq2, 'sql'); -- seq2.NEXTVAL for Oracle
INSERT INTO test_seq(id, name)
VALUES (NEXT VALUE FOR seq2, 'java'); -- nextval('seq2') for PostgreSQL
INSERT INTO test_seq(id, name)
VALUES (NEXT VALUE FOR seq2, 'c++');

SELECT id, name
  FROM test_seq;
id  |name |
----|-----|
96  |c++  |
98  |java |
100 |sql  |

此外,插入到表中的序列值有可能是存在间断,例如在事务中生成了序列值,然后事务被回滚,已经使用的序列值将会被丢弃。如果使用了扩展的 CACHE 选项,当服务器故障时可能会丢失掉已经缓存的序列值。

相关内容

关于数据库自增字段的 3 种实现方式,可以参考这篇文章

参考资料: