航空公司客户价值分析
学习目标
- 学会怎么进行数据分析。
- 掌握hive的使用方法。
- 学会数据清洗和K-Means聚类算法。
- 了解航空公司现状与客户价值分析
任务描述
面对激烈的市场竞争,各个航空公司都推出了更多的优惠来吸引客户。国内某航空公司面临着常旅客流失,竞争力下降和资源未充分利用等经营危机。通过建立合理的客户价值评估模型,对客户进行分群,分析及比较不同客户群的客户价值,并制定相应的营销策略,对不同的客户群提供个性化服务。
任务分析
- 了解航空公司现状。
(2)认识客户价值分析。
(3)熟悉航空公司客户价值分析的步骤与流程。
-
- 分析航空公司现状
民航的竞争除了三大航空公司之间的竞争之外,还将加入新崛起的各类小型航空公司、民营航空公司,甚至国外航空巨头。航空产品生产过剩,产品同质化特征愈加明显,于是航空公司从价格、服务间的竞争逐渐转向对客户的竞争。
-
- 认识客户价值分析
(1)航空公司的数据分析:
目前航空公司已积累了大量的会员档案信息和其乘坐航班记录。以2014-03-31为结束时间,选取宽度为两年的时间段作为分析观测窗口,抽取观测窗口内有乘机记录的所有客户的详细数据形成历史数据,44个特征,总共62988条记录。数据如air_data.csv所示!
(2)航空公司的营销实施经验分析:
1、公司收入的80%来自顶端的20%的客户。
2、20%的客户其利润率100%。
3、90%以上的收入来自现有客户。
4、大部分的营销预算经常被用在非现有客户上。
5、5%至30%的客户在客户金字塔中具有升级潜力。
6、客户金字塔中客户升级2%,意味着销售收入增加10%,利润增加50%。
-
- 熟悉航空客户价值分析的步骤与流程
(1)抽取航空公司2012年4月1日至2014年3月31日的数据。
(2)对抽取的数据进行数据探索分析与预处理,包括数据缺失值与 异常值的探索分析、数据清洗、特征构建、标准化等操作。
(3)基于RFM模型,使用K-Means算法进行客户分群。
(4)针对模型结果得到不同价值的客户,采用不同的营销手段,提供定制化的服务。
- 预处理航空客户数据
任务描述
航空公司客户原始数据存在少量的缺失值和异常值,需要清洗后才能用于分析。同时由于原始数据的特征过多,不便直接用于客户价值分析,因此需要对特征进行刷选,挑选出衡量客户价值的关键特征。
任务分析
- 处理数据缺失值与异常值。
- 结合RFM模型刷选特征。
- 标准化刷选后的数据。
- 处理数据缺失值与异常值
#建立数据库与数据表
create database air_data;
Show database;
use air_data;
create table air_table(
member_no string,
ffp_date string,
first_flight_date string,
gender string,
ffp_tier int,
work_city string,
work_province string,
work_country string,
age int,
load_time string,
flight_count int,