拿Python获取奶茶店的数据,做个可视化,浅浅尝试一下吧

发布于:2022-10-22 ⋅ 阅读:(828) ⋅ 点赞:(0)

嗨嗨,大家好~

马上又要迎来,万圣节了,很多店家都在搞活动,有我们都知道的kfc,最近奶茶店的活动也开始了,就比如coco,买奶茶送库洛米相关的周边

在这里插入图片描述

奶茶好不好喝不知道,但是还是吸引蛮多人去买的,就是为了库洛米的周边,小圆最喜欢的杯子,在周边店里,一天限量十个,还不接受预定,硬是抢不到

别管,真的很伤心

在这里插入图片描述
请添加图片描述
但是现在奶茶店这么多,
到底哪一家最好喝、性价比最高呢?

今天无聊,就来采集一些数据,浅浅对比一下吧

数据获取

本文抓取了12个热门城市的奶茶店名单,

城市包括:北京、上海、广州、深圳、天津、西安、重庆、杭州、南京、武汉、成都和长沙。

共计68614家奶茶店,3万多个奶茶品牌。

在构建抓取URL时,

需要注意将城市的维度具体到城市商圈,

因为每个URL最多只显示32页内容,

保证抓取每个城市时的数据量是准确的。

在这里插入图片描述

源码.资料.素材.点击领取即可

在这里插入图片描述

请添加图片描述

数据清洗🍨🥤

数据清洗部分,主要清洗了奶茶店铺名称,

但是同一个奶茶品牌会有多种格式,如1点点和1點點,

大卡司和大卡司DAKASI。

由于奶茶品牌数量众多,

并且真假难辨,所以只能进行针对性清洗,

对部分名气高的奶茶品牌名称要保证其统一

# 清洗字段
def clean(x):
    title = re.sub(u"(.*?)", "", x['title'])
    title = title.replace('點點','点点').replace('(','').replace(')','')
    title = title.replace('一点点','1点点')
    if '一杯会说话的茶' in title:
        title = '1314一杯会说话的茶'
    elif '大卡司' in title:
        title = '大卡司DAKASI'
    elif '1点点' in title:
        title = '1点点'
    elif '都可' in title:
        title = 'CoCo都可'
    elif '书亦烧仙草' in title:
        title = '书亦烧仙草'
    elif '蜜雪冰城' in title:
        title = '蜜雪冰城'
    elif 'royal' in title or 'Royal' in title or 'ROYAL' in title:
        title = 'Royaltea皇茶'
    elif 'ALS' in title:
        title = 'ALS GONG CHA贡茶'
    elif 'GONG' in title:
        title = '贡茶'
    elif '茶百道' in title:
        title = '茶百道'
    elif '吾饮良品' in title:
        title = '吾饮良品'
    elif '悸动烧仙草' in title:
        title = '悸动烧仙草'
    elif '沪上阿姨' in title:
        title = '沪上阿姨'
    elif '7分甜' in title:
        title = '7分甜'
    elif '古茗' in title:
        title = '古茗'
    elif '奈雪' in title:
        title = '奈雪の茶'
    elif '悦色' in title:
        title = '茶颜悦色'
    else:
        pass
    return title
df['title'] = df.apply(clean, axis=1)

请添加图片描述

数据可视化🍨🥤

当小编在制作可视化图表的时候,

会发现有些奶茶品牌的名称极为相似,

让人有一种傻傻分不清楚的感觉

在这里插入图片描述

热门城市奶茶店铺数量情况🍨🥤

从全国12个热门城市来看奶茶店铺数量分布情况,

广州的店铺数量是最多的,拥有11419家,

之后是深圳(9367家)、上海(7940家)、成都(7361家)。

在这里插入图片描述

特色奶茶分布情况🍨🧃

有些奶茶店很有自己的地域特色,

如果你想品尝它们的原版奶茶,

就可能需要跑到别的城市才能喝到,

因为它们大部分分店都只开在本土城市。

在这里插入图片描述

大众奶茶分布情况🧃🍨

接下来介绍一下大众奶茶中的1点点,CoCo,书亦烧仙草和益禾堂的热门城市分布情况,

1点点和CoCo在上海的分店数量都是最多的,而书亦烧仙草在成都和长沙比较普遍,益禾堂则是在广州和深圳。

这4家奶茶品牌在广州分店数量均有上百家,也难怪走到哪都能看到这几家奶茶店。

在这里插入图片描述

总结🧃🥤

此次小编只分析了12个热门城市的奶茶门店数据,

如果将范围扩展到全国进行分析,

或许能得到更多有意思的结果。

另外,由于奶茶的含糖量高,茶叶中又含有咖啡因,

容易导致肥胖和失眠;

身边也有朋友说晚上喝完奶茶,会睁眼到天亮的情况,

所以奶茶不能多喝。

目前也有部分品牌开始推出无糖茶,用代糖来代替白糖,

这也许是奶茶的未来趋势,既好喝又健康的奶茶,谁不爱呢?

好啦,今天的分享到这里就结束了 ~

如果需要更多视频学习的可以在b站搜索 :Python小圆 / ka-爆浆麻薯团子

对文章有问题的,或者有其他关于python的问题,可以在评论区留言或者私信我哦
觉得我分享的文章不错的话,可以关注一下我,或者给文章点赞(/≧▽≦)/

请添加图片描述

本文含有隐藏内容,请 开通VIP 后查看

网站公告

今日签到

点亮在社区的每一天
去签到