【redis】Redis数据类型(四)Set类型

发布于:2024-05-07 ⋅ 阅读:(28) ⋅ 点赞:(0)

Set类型介绍

  • Redis set 对外提供的功能与 list 类似,是⼀个列表的功能,特殊之处在于 set 是可以⾃动排重的,当你需要存储⼀个列表数据,⼜不希望出现重复数据时,set 是⼀个很好的选择,并且 set 提供了判断某个成员是否在⼀个 set 集合内的重要接⼝,这个也是 list 所不能提供的。
  • Redis 的 set 是 string 类型的⽆序集合。它底层其实是⼀个 value 为 null 的 hash 表,所以添加,删除,查找的复杂度都是 O(1)。⼀个算法,随着数据的增加,执⾏时间的⻓短,如果是 O(1),数据增加,查找数据的时间不变。
  • Redis 中集合是通过哈希表实现的,所以添加,删除,查找的复杂度都是 O(1)。相对于列表,集合也有两个特点:无序、不可重复
  • 一个集合最多可以存储 2^32-1 个元素。概念和数学中个的集合基本类似,数学集合的概念是指具有某种特定性质的具体的或抽象的对象汇总而成的集体。
  • 简而言之,Redis 集合就是一些不重复值的组合。利用集合(Set)这个数据结构,Redis 可以存储一些集合类型的数据,Redis也通过一些简便的命令很好的支持了交集、并集和差集等集合的基本运算。

使用场景

  • 点赞/收藏:Set 类型可以保证一个用户只能点一个赞;
  • 共同关注:Set 类型支持交集运算,所以可以用来计算共同关注的好友、公众号等;
  • 抽奖活动:存储某活动中中奖的用户名 ,Set 类型因为有去重功能,可以保证同一个用户不会中奖两次
  • 其他:投票系统、标签系统、共同好友、共同爱好、商品筛选栏,访问 IP 统计等

Set类型数据结构

  • Redis Set 的底层存储采用 整数集合 IntSet 和哈希表,二者是相互转换的,使用 IntSet 存储必须满足下面两个条件,否则使用 HashTable,条件如下
    • 结合对象保存的所有元素都是整数值;
    • 集合对象保存的元素数量不超过 512 个
  • 以 Set 的 SADD 命令为例子,整个添加过程如下:
    • 检查 Set 是否存在不存在则创建一个 Set 结合。
    • 根据传入的 Set 集合一个个进行添加,添加的时候需要进行内存压缩。
    • setTypeAdd 执行 Set 添加过程中会判断是否进行编码转换

set的单个元素的添加过程

如果已经是 HashTable 的编码,那么我们就走正常的 HashTable 的元素添加,如果原来是 IntSet 的情况,那么我们就需要进行如下判断

  • 如果能够转成 int 的对象(isObjectRepresentableAsLongLong),那么就用 IntSet 保存。
  • 如果用 IntSet 保存的时候,如果长度超过5 12(REDIS_SET_MAX_INTSET_ENTRIES)就转为 HashTable 编码。
  • 其他情况统一用 HashTable 进行存储。

IntSet

  • 整数集合 IntSet 是 Redis用来保存整数值的集合的一种数据结构,可以用来保存 int 类型数据,并且可以保证不会出现重复元素。因此当一个集合中只包含整数元素且数量不多的时候,Redis 会选择使用整数集合作为底层实现。
  • IntSet 内部其实是一个数组(int8_t coentents[] 数组),而且存储数据的时候是有序的,因为在查找数据的时候是通过二分查找来实现的。
    在这里插入图片描述
  • 如果你的集合只有整数值元素,并且数量是轻量的,这时候 Redis 会使用使用整数集合作为 Redis 集合的底层数据结构
  • 例如:当我们执行 SADD numbers 1 3 5 向集合对象插入数据时,该集合对象在内存的结构如下
    在这里插入图片描述

哈希表

  • Redis 中的 key-value 是通过 dictEntry 对象来实现的,而哈希表就是将 dictEntry 进行了再一次的包装得到的,这就是哈希表对象 dictht:
    typedef struct dictht {
        dictEntry **table;//哈希表数组
        unsigned long size;//哈希表大小
        unsigned long sizemask;//掩码大小,用于计算索引值,总是等于size-1
        unsigned long used;//哈希表中的已有节点数
    } dictht;
    
  • table 是一个数组,其每个元素都是一个 dictEntry 对象。
  • Java 中 HashSet 的内部实现使⽤的是 HashMap,只不过所有的 value 都指向同⼀个对象。
  • Redis 的 set 结构也是⼀样,它的内部也使⽤ hash 结构,所有的 value 都指向同⼀个内部值。

内存结构

hashtable 编码的集合对象使用字典作为底层实现,字典的每个键都是一个字符串对象,每个字符串对象对应一个集合元素,字典的值都是 NULL。当我们执行 SADD fruits “apple” “banana” “cherry” 向集合对象插入数据时,该集合对象在内存的结构如下:
在这里插入图片描述

常用命令

  • sadd <key><value1><value2> … 将⼀个或多个 member 元素加⼊到集合 key 中,已经存在的 member 元素将被忽略
  • smembers <key> 取出该集合的所有值。
  • sismember <key><value> 判断集合 <key> 是否为含有该 <value> 值,有 1,没有 0
  • scard <key> 返回该集合的元素个数。
  • srem <key><value1><value2> … 删除集合中的某个元素。
  • spop <key> 随机从该集合中吐出⼀个值。
  • srandmember <key><n> 随机从该集合中取出 n 个值。不会从集合中删除。
  • smove <source><destination><value> 把集合中⼀个值从⼀个集合移动到另⼀个集合
  • sinter <key1><key2> 返回两个集合的交集元素。
  • sunion <key1><key2> 返回两个集合的并集元素。
  • sdiff <key1><key2> 返回两个集合的差集元素( key1 中的,不包含 key2 中的)

SADD

  • 语法:sadd key member [member …]
  • 解释
    • 将一个或多个 member 元素加入到集合 key 当中,已经存在于集合的 member 元素将被忽略。
    • 假如 key 不存在,则创建一个只包含 member 元素作成员的集合。
    • 当 key 不是集合类型时,返回一个错误。
    • 注:在 Redis2.4 版本以前, SADD 只接受单个 member 值。
  • 时间复杂度:O(N), N 是被添加的元素的数量。
  • 返回值:被添加到集合中的新元素的数量,不包括被忽略的元素。

示例

# 添加单个元素
127.0.0.1:6379[2]> SADD bbs "discuz.net"
(integer) 1
# 添加重复元素
127.0.0.1:6379[2]> SADD bbs "discuz.net"
(integer) 0
# 添加多个元素
127.0.0.1:6379[2]> SADD bbs "tianya.cn" "groups.google.com"
(integer) 2
127.0.0.1:6379[2]> SMEMBERS bbs
1) "discuz.net"
2) "groups.google.com"
3) "tianya.cn"

SREM

  • 语法:srem key member [member …]
  • 解释
    • 移除集合 key 中的一个或多个 member 元素,不存在的 member 元素会被忽略。
    • 当 key 不是集合类型,返回一个错误。
    • 注:在 Redis 2.4 版本以前, SREM 只接受单个 member 值。
    • 注:在 Redis2.4 版本以前, SADD 只接受单个 member 值。
  • 时间复杂度:O(N), N 为给定 member 元素的数量
  • 返回值:被成功移除的元素的数量,不包括被忽略的元素。

示例

# 测试数据
127.0.0.1:6379[2]> SMEMBERS languages
1) "c"
2) "lisp"
3) "python"
4) "ruby"
# 移除单个元素
127.0.0.1:6379[2]> SREM languages ruby
(integer) 1
# 移除不存在元素
127.0.0.1:6379[2]> SREM languages non-exists-language
(integer) 0
# 移除多个元素
127.0.0.1:6379[2]> SREM languages lisp python c
(integer) 3
127.0.0.1:6379[2]> SMEMBERS languages
(empty list or set)

SMEMBERS

  • 语法:smembers key
  • 解释
    • 返回集合 key 中的所有成员。
    • 不存在的 key 被视为空集合。
  • 时间复杂度:O(N), N 为集合的基数。
  • 返回值:集合中的所有成员。

示例

# key 不存在或集合为空
127.0.0.1:6379[2]> EXISTS not_exists_key
(integer) 0
127.0.0.1:6379[2]> SMEMBERS not_exists_key
(empty list or set)
# 非空集合
127.0.0.1:6379[2]> SADD language Ruby Python Clojure
(integer) 3
127.0.0.1:6379[2]> SMEMBERS language
1) "Python"
2) "Ruby"
3) "Clojure"

SISMEMBER

  • 语法:sismember key member
  • 解释:判断 member 元素是否集合 key 的成员
  • 时间复杂度:O(1)
  • 返回值:
    • 如果 member 元素是集合的成员,返回 1 。
    • 如果 member 元素不是集合的成员,或 key 不存在,返回 0 。

示例

127.0.0.1:6379[2]> SMEMBERS joe_movies
1) "hi, lady"
2) "Fast Five"
3) "2012"
127.0.0.1:6379[2]> SISMEMBER joe_movies "bet man"
(integer) 0
127.0.0.1:6379[2]> SISMEMBER joe_movies "Fast Five"
(integer) 1

SCARD

  • 语法:scard key
  • 解释:返回集合 key 的基数(集合中元素的数量)。
  • 时间复杂度:O(1)
  • 返回值:
    • 集合的基数。
    • 当 key 不存在时,返回 0 。

示例

127.0.0.1:6379[2]> SADD tool pc printer phone
(integer) 3
127.0.0.1:6379[2]> SCARD tool # 非空集合
(integer) 3
127.0.0.1:6379[2]> DEL tool
(integer) 1
127.0.0.1:6379[2]> SCARD tool # 空集合
(integer) 0

SMOVE

  • 语法:smove source destination member
  • 解释:
    • 将 member 元素从 source 集合移动到 destination 集合。
    • SMOVE 是原子性操作。
      • 如果 source 集合不存在或不包含指定的 member 元素,则 SMOVE 命令不执行任何操作,仅返回 0 。否则, member 元素从 source 集合中被移除,并添加到 destination 集合中去。
      • 当 destination 集合已经包含 member 元素时,SMOVE 命令只是简单地将 source 集合中的 member 元素删除。
      • 当 source 或 destination 不是集合类型时,返回一个错误。
  • 时间复杂度:O(1)
  • 返回值:
    • 如果 member 元素被成功移除,返回 1 。
    • 如果 member 元素不是 source 集合的成员,并且没有任何操作对 destination 集合执行,那么返回 0 。

示例

127.0.0.1:6379[2]> SMEMBERS songs
1) "Billie Jean"
2) "Believe Me"
127.0.0.1:6379[2]> SMEMBERS my_songs
(empty list or set)
127.0.0.1:6379[2]> SMOVE songs my_songs "Believe Me"
(integer) 1
127.0.0.1:6379[2]> SMEMBERS songs
1) "Billie Jean"
127.0.0.1:6379[2]> SMEMBERS my_songs
1) "Believe Me"

SPOP

  • 语法:spop key
  • 解释:
    • 移除并返回集合中的一个随机元素。
    • 如果只想获取一个随机元素,但不想该元素从集合中被移除的话,可以使用SRANDMEMBER 命令。
  • 时间复杂度:O(1)
  • 返回值:
    • 被移除的随机元素。
    • 当 key 不存在或 key 是空集时,返回 nil 。

示例

127.0.0.1:6379[2]> SMEMBERS db
1) "MySQL"
2) "MongoDB"
3) "Redis"
127.0.0.1:6379[2]> SPOP db
"Redis"
127.0.0.1:6379[2]> SMEMBERS db
1) "MySQL"
2) "MongoDB"
127.0.0.1:6379[2]> SPOP db
"MySQL"
127.0.0.1:6379[2]> SMEMBERS db
1) "MongoDB"

SRANDMEMBER

  • 语法:srandmember key [count]
  • 解释:
    • 如果命令执行时,只提供了 key 参数,那么返回集合中的一个随机元素。
    • 从 Redis 2.6 版本开始, SRANDMEMBER 命令接受可选的 count 参数:
      • 如果 count 为正数,且小于集合基数,那么命令返回一个包含 count 个元素的数组,数组中的元素各不相同。如果 count 大于等于集合基数,那么返回整个集合。
      • 如果 count 为负数,那么命令返回一个数组,数组中的元素可能会重复出现多次,而数组的长度为 count 的绝对值。
    • 该操作和 SPOP 相似,但 SPOP 将随机元素从集合中移除并返回,而 SRANDMEMBER 则仅仅返回随机元素,而不对集合进行任何改动。
  • 时间复杂度:
    • 只提供 key 参数时为 O(1) 。
    • 如果提供了 count 参数,那么为 O(N) ,N 为返回数组的元素个数。
  • 返回值:
    • 只提供 key 参数时,返回一个元素;如果集合为空,返回 nil 。
    • 如果提供了 count 参数,那么返回一个数组;如果集合为空,返回空数组。

示例

# 添加元素
127.0.0.1:6379[2]> SADD fruit apple banana cherry
(integer) 3
# 只给定 key 参数,返回一个随机元素
127.0.0.1:6379[2]> SRANDMEMBER fruit
"cherry"
127.0.0.1:6379[2]> SRANDMEMBER fruit
"apple"
# 给定 3 为 count 参数,返回 3 个随机元素
# 每个随机元素都不相同
127.0.0.1:6379[2]> SRANDMEMBER fruit 3
1) "apple"
2) "banana"
3) "cherry"
# 给定 -3 为 count 参数,返回 3 个随机元素
# 元素可能会重复出现多次
127.0.0.1:6379[2]> SRANDMEMBER fruit -3
1) "banana"
2) "cherry"
3) "apple"
127.0.0.1:6379[2]> SRANDMEMBER fruit -3
1) "apple"
2) "apple"
3) "cherry"
# 如果 count 是整数,且大于等于集合基数,那么返回整个集合
127.0.0.1:6379[2]> SRANDMEMBER fruit 10
1) "apple"
2) "banana"
3) "cherry"
# 如果 count 是负数,且 count 的绝对值大于集合的基数
# 那么返回的数组的长度为 count 的绝对值
127.0.0.1:6379[2]> SRANDMEMBER fruit -10
1) "banana"
2) "apple"
3) "banana"
4) "cherry"
5) "apple"
6) "apple"
7) "cherry"
8) "apple"
9) "apple"
10) "banana"
# SRANDMEMBER 并不会修改集合内容
127.0.0.1:6379[2]> SMEMBERS fruit
1) "apple"
2) "cherry"
3) "banana"
# 集合为空时返回 nil 或者空数组
127.0.0.1:6379[2]> SRANDMEMBER not-exists
(nil)
127.0.0.1:6379[2]> SRANDMEMBER not-eixsts 10
(empty list or set)

SINTER

  • 语法:sinter key [key …]
  • 解释:
    • 返回一个集合的全部成员,该集合是所有给定集合的交集。
    • 不存在的 key 被视为空集。
    • 当给定集合当中有一个空集时,结果也为空集(根据集合运算定律)。
  • 时间复杂度:O(N * M), N 为给定集合当中基数最小的集合, M 为给定集合的个数。
  • 返回值:交集成员的列表

示例

127.0.0.1:6379[2]> SMEMBERS group_1
1) "LI LEI"
2) "TOM"
3) "JACK"
127.0.0.1:6379[2]> SMEMBERS group_2
1) "HAN MEIMEI"
2) "JACK"
127.0.0.1:6379[2]> SINTER group_1 group_2
1) "JACK"

SINTERSTORE

  • 语法:sinterstore destination key [key …]
  • 解释:
    • 这个命令类似于 SINTER 命令,但它将结果保存到 destination 集合,而不是简单地返回结果集。
    • 如果 destination 集合已经存在,则将其覆盖。
    • destination 可以是 key 本身。
  • 时间复杂度:O(N * M), N 为给定集合当中基数最小的集合, M 为给定集合的个数。
  • 返回值:结果集中的成员数量。

示例

127.0.0.1:6379[2]> SMEMBERS songs
1) "good bye joe"
2) "hello,peter"
127.0.0.1:6379[2]> SMEMBERS my_songs
1) "good bye joe"
2) "falling"
127.0.0.1:6379[2]> SINTERSTORE song_interset songs my_songs
(integer) 1
127.0.0.1:6379[2]> SMEMBERS song_interset
1) "good bye joe"

SUNION

  • 语法:sunion key [key …]
  • 解释:
    • 返回一个集合的全部成员,该集合是所有给定集合的并集。
    • 不存在的 key 被视为空集。
  • 时间复杂度:O(N), N 是所有给定集合的成员数量之和
  • 返回值:并集成员的列表。

示例

127.0.0.1:6379[2]> SMEMBERS songs
1) "Billie Jean"
127.0.0.1:6379[2]> SMEMBERS my_songs
1) "Believe Me"
127.0.0.1:6379[2]> SUNION songs my_songs
1) "Billie Jean"
2) "Believe Me"

SUNIONSTORE

  • 语法:sunionstore destination key [key …]
  • 解释:
    • 这个命令类似于 SUNION 命令,但它将结果保存到 destination 集合,而不是简单地返回结果集。
    • 如果 destination 已经存在,则将其覆盖。
    • destination 可以是 key 本身。
  • 时间复杂度:O(N), N 是所有给定集合的成员数量之和
  • 返回值:结果集中的元素数量。

示例

127.0.0.1:6379[2]>  SMEMBERS NoSQL
1) "MongoDB"
2) "Redis"
127.0.0.1:6379[2]> SMEMBERS SQL
1) "sqlite"
2) "MySQL"
127.0.0.1:6379[2]> SUNIONSTORE db NoSQL SQL
(integer) 4
127.0.0.1:6379[2]> SMEMBERS db
1) "MySQL"
2) "sqlite"
3) "MongoDB"
4) "Redis"

SDIFF

  • 语法:sdiff key [key …]
  • 解释:
    • 返回一个集合的全部成员,该集合是所有给定集合之间的差集。
    • 不存在的 key 被视为空集。
  • 时间复杂度:O(N), N 是所有给定集合的成员数量之和
  • 返回值:交集成员的列表

示例

127.0.0.1:6379[2]> SMEMBERS peter_movies
1) "bet man"
2) "start war"
3) "2012"
127.0.0.1:6379[2]> SMEMBERS joe_movies
1) "hi, lady"
2) "Fast Five"
3) "2012"
127.0.0.1:6379[2]> SDIFF peter_movies joe's_movies
1) "bet man"
2) "start war"

SDIFFSTORE

  • 语法:sdiffstore destination key [key …]
  • 解释:
    • 这个命令的作用和 SDIFF 类似,但它将结果保存到 destination 集合,而不是简单地返回结果集。
    • 如果 destination 集合已经存在,则将其覆盖。
    • destination 可以是 key 本身。
  • 时间复杂度:O(N), N 是所有给定集合的成员数量之和
  • 返回值:结果集中的元素数量。

示例

127.0.0.1:6379[2]> SMEMBERS joe_movies
1) "hi, lady"
2) "Fast Five"
3) "2012"
127.0.0.1:6379[2]> SMEMBERS peter_movies
1) "bet man"
2) "start war"
3) "2012"
127.0.0.1:6379[2]> SDIFFSTORE joe_diff_peter joe_movies peter_movies
(integer) 2
127.0.0.1:6379[2]> SMEMBERS joe_diff_peter
1) "hi, lady"
2) "Fast Five"