智能汽车-大数据标签系统应用浅谈
前言
什么是标签?
标签是一种数据特征。比如用户的年龄、性别、地区等。这些特征在数据中具有一定的通用性和价值。
标签的意义?
标签其实是一种预统计,针对有价值的信息提前统计,应用时速度快。
一、标签的分类
提示:标签分类参考https://www.jianshu.com/p/1982133638c9
1.按数据的时效性分
静态标签:又可以称为定性标签,指不会随着时间以及用户行为变化而变化的标签,如用户的性别标签、年龄标签,这些标签都是不会随着时间或用户行为而变化的。
动态标签:又可以称为定量标签,指会随着时间以及用户行为变化的标签,如用户活跃度标签,会根据特定时间段内用户特定行为的变化而变化。
2.按数据提取维度分
事实标签:从生产系统获取数据,定性或定量描述用户的自然属性、产品属性、消费属性、资源属性等,以及根据工作人员经验积累的业务规则进行筛选、分析生产的标签,如是否活跃用户、是否是考生等。
模型标签:对用户属性及行为等属性的抽象和聚类,通过剖析用户的基础数据为用户贴上相应的总结概括性标签及指数,标签代表用户的兴趣、偏好、需求等,指数代表用户的兴趣程度、需求程度、购买概率等。
预测标签:基于用户的属性、行为、信令、位置和特征,挖掘用户潜在需求,针对这些潜在需求配合营销策略、规则进行打标,实现营销适时、适机、适景推送给用户。如用户在过去一段时间经常访问汽车类APP,那么可以依据用户行为给用户打上有买车需求的标签。
3.按标签的添加方式分
手动标签
系统标签
二、智能汽车应用标签
1.汽车标签全图
2.场景应用示例
①洗车规律周期
数据来源:天气、用户车况数据、地图POI;
标签分类:行为标签-用车行为偏好;
标签规则定义:判断洗车,车辆通过地图导航目的地或者车辆GPS定位行程终点为洗车店、汽修厂、4S店(地图POI信息),P档0速(或熄火)持续时间t在设定时间内,并且驾驶中汽车无故障提醒;
标签值:标签值举例:表示周一、周二、周三有规律洗车习惯{1,2,3};
值含义描述:
0:无规律
1:周一
2:周二
3:周三
4:周四
5:周五
6:周六
7:周日
②用户规律性休息时间段
数据来源:车况数据、驾驶员监控系统(DMS)
标签分类:行为标签-用车行为偏好
标签规则定义:找寻用户休息的时间段,重点计算用户午休时间、晚休时间,具体规则如下:
车启动且(DMS判断有人在车内)且处于P档状态且速度0且持续N分钟及以上认为用户有1次休息行为。统计N天内,在星期X,休息次数>=M次,即认为有规律性休息时段,每段开始休息时间与结束休息时间归属于最近的整点时间,最终汇总用户所有休息时段列表。
标签值:输出值参考:
{
“星期”:“时间段”,
“星期”:“时间段”
}
时间段:精确到小时即可,如8:00-9:00(24小时制)
③用户出行意图
数据来源:用户车况数据、用户基础信息、地图POI
标签分类:预测标签
标签规则定义:意图判断,获取近1个月(近30个自然日的行程数据),进行行程切分,通过出行星期几、出行时间段(半小时为步长)、出行出发地(N km内视为同一出发地)、出行目的地(N km内视为同一出发地)以上几个维度,统计出大于M次(具体以数据分析师结果为准)及以上的行程,进行意图分析。
意图为上班,出发地需要包含不限于大型社区、小区、街道等地点。
意图为下班,目的地需要包含不限于大型社区、小区、街道等地点。
意图为接孩子放学,出发地需要包含幼儿园、小初高、职高、大学等学校场所。
意图为送孩子上学,目的地需要包含幼儿园、小初高、职高、大学等学校场所。
意图为送孩子去兴趣班,目的地需要包含培训机构、辅导机构、艺术类培训等场所。
意图为从兴趣班接孩子放学,出发地需要包含培训机构、辅导机构、艺术类培训等场所。
(7自驾旅游、8周末聚会、9周末亲子外出、10周末结伴出游、意图为自驾旅游,一天内有多段行程,途径服务区、加油站、旅游景点、多个城市等。意图为周末出行的,每次出行不一定是规律的,本身数据量较少,而且规律性较差,可能识别准确性差)
标签值:输出数据需要包含以下几个参数:
{意图,星期几,时间段,目的地}
参数值说明:
意图:1上班通勤、2下班通勤、3接孩子放学、4送孩子上学、5送孩子去兴趣班、6接孩子放学-兴趣班、7其他规律性驾车行为
星期几:星期一~星期日
时间段:例如00:00~00:30
目的地:地图具体位置名称
④洗车间隔预测
数据来源:天气、用户车况数据、地图POI、地图导航洗车数据
标签分类:预测标签
标签规则定义:判断洗车,车辆通过地图导航目的地或者车辆GPS定位行程终点为洗车店、汽修厂、4S店(地图POI信息),P档0速(或熄火)持续时间t在限定分钟,并且驾驶中汽车无故障提醒
行为特征/环境特征(暂定用N天内数据):
- 长途:当天累计行驶里程>=M km,当天内包含多段行程且出发地与最终目的地>=M km后的洗车的间隔平均天数
- 自驾游景区:郊区自驾游(仅限目的地为旅游景点)后的洗车间隔平均天数
- 雨天:雨天后洗车间隔平均天数
- 雪天:雪天后洗车间隔平均天数
- 雨刮喷水:打开雨刮喷水后去洗车的规律间隔平均天数
- 其他:每隔多少天去洗车,排除上述所有的情况后,计算规律平均天数
标签值:输出数据需要包含以下几个参数:
{环境特征/行为特征,洗车间隔周期(日)}
{字符串,整数}
行为特征:0长途、1雨刮喷水、2自驾游景区、3其他
环境特征:4雨天、5雪天
总结
以上就是大数据标签系统在智能汽车场景的简单应用,本文仅仅简单介绍了数据标签的定义和浅层次的使用,而数据标签系统是大数据、AI、千人千面个性化能力的基础。