利用pandas做笛卡尔积数据(多表)

发布于:2023-01-13 ⋅ 阅读:(271) ⋅ 点赞:(0)

场景:

# 第一个字典
eat_dict = {
    "noodles": 2,
    "rice": 1,
    "greens": 3
}

# 第二个字典

drink_dict = {
    "apple_juice": 1,
    "coconut_milk": 1
}

# 第三个字典

clothes_dict = {
    "shirt": 1,
    "shoe": 2,
    "pants": 1
}

实现渠道:利用pandas数据分析技术

目标:将三个字典的键值对,搞成一个笛卡尔积数据

笛卡尔积的概念:笛卡尔乘积是指在数学中,两个集合XY的笛卡尔积(Cartesian product),又称直积,表示为X × Y,第一个对象是X的成员而第二个对象是Y的所有可能有序对的其中一个成员

# 先将三个字典变为DataFrame类型的数据
df_food_data = pd.DataFrame(eat_dict.items(), columns=['food_name', 'food_num'])
df_fruit_data = pd.DataFrame(drink_dict.items(), columns=['fruit_name', 'fruit_num'])
df_clothes_dict = pd.DataFrame(clothes_dict.items(), columns=['clothes_name', 'clothes_num'])
# 再进行两两合并,其中assign(temp=1),合并的同时创建一个临时外键(需相同)
df_between_res = df_food_data.assign(temp=1).merge(df_fruit_data.assign(temp=1)).drop('temp', 1)
# 最后再两两合并得到结果
df_result_res = df_between_res.assign(temp=1).merge(df_clothes_dict.assign(temp=1)).drop('temp', 1)

结果,如下图所示:

 

 


网站公告

今日签到

点亮在社区的每一天
去签到