每日leetcode

发布于:2025-06-21 ⋅ 阅读:(19) ⋅ 点赞:(0)

2890. 重塑数据:融合 - 力扣(LeetCode)

题目

DataFrame report

+-------------+--------+
| Column Name | Type   |
+-------------+--------+
| product     | object |
| quarter_1   | int    |
| quarter_2   | int    |
| quarter_3   | int    |
| quarter_4   | int    |
+-------------+--------+

编写一个解决方案,将数据 重塑 成每一行表示特定季度产品销售数据的形式。

结果格式如下例所示:

示例 1:

输入:
+-------------+-----------+-----------+-----------+-----------+
| product     | quarter_1 | quarter_2 | quarter_3 | quarter_4 |
+-------------+-----------+-----------+-----------+-----------+
| Umbrella    | 417       | 224       | 379       | 611       |
| SleepingBag | 800       | 936       | 93        | 875       |
+-------------+-----------+-----------+-----------+-----------+
输出:
+-------------+-----------+-------+
| product     | quarter   | sales |
+-------------+-----------+-------+
| Umbrella    | quarter_1 | 417   |
| SleepingBag | quarter_1 | 800   |
| Umbrella    | quarter_2 | 224   |
| SleepingBag | quarter_2 | 936   |
| Umbrella    | quarter_3 | 379   |
| SleepingBag | quarter_3 | 93    |
| Umbrella    | quarter_4 | 611   |
| SleepingBag | quarter_4 | 875   |
+-------------+-----------+-------+
解释:
DataFrame 已从宽格式重塑为长格式。每一行表示一个季度内产品的销售情况。

思路

  1. 使用pandas的melt方法。

代码实现

import pandas as pd

def meltTable(report: pd.DataFrame) -> pd.DataFrame:
    return pd.melt(report, id_vars=["product"], value_vars=["quarter_1", "quarter_2", "quarter_3", "quarter_4"], var_name="quarter", value_name="sales")

知识积累

  • 数据重塑(将多列合并):pd.melt(df, id_vars=None, value_vars=None, var_name=None, value_name='value', col_level=None, ignore_index=True)
    • df:待转换的DataFrame。
    • id_vars:用作标识变量的列。
    • value_vars:待合并的列。如果未指定,则使用所有所有未设置id_vars的列。
    • var_name:用于variable列(即被合并的属性列——变量名)的名称。如果未设置,则使用df.columns.name或'variable'。
    • value_name:用于value列(即变量值列)的名称。默认为'value'。
    • col_level:如果是MultiIndex,则使用此级别进行转换。
    • ignore_index:如果为True,则忽略原始索引。如果为False,则保留原始索引。

网站公告

今日签到

点亮在社区的每一天
去签到