excel及panda的部分内容

发布于:2024-07-16 ⋅ 阅读:(131) ⋅ 点赞:(0)


python操作EXCEL

在 Python 中,操作 Excel 文件通常使用以下几个库:

Pandas:强大的数据分析库,支持读取和写入 Excel 文件。
Openpyxl:专门用于读写 Excel 2010 xlsx/xlsm/xltx/xltm 文件。
xlrd:用于读取旧的 Excel 文件格式(.xls)。
xlwt:用于写入旧的 Excel 文件格式(.xls)。

pandas 可以处理两种格式,但需要依赖相应的库来处理不同的格式。

Pandas 操作 Excel 的 DataFrame

读取 Excel 文件

import pandas as pd

# 读取 Excel 文件中的第一个表格
df = pd.read_excel('example.xlsx')

# 若文件有多个表格,可以指定表格名称或索引
df = pd.read_excel('example.xlsx', sheet_name='Sheet1')
df = pd.read_excel('example.xlsx', sheet_name=0)

写入 Excel 文件

import pandas as pd

# 创建一个 DataFrame
data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],
        'Age': [28, 24, 35, 32]}
df = pd.DataFrame(data)

# 写入 Excel 文件
df.to_excel('output.xlsx', index=False)

读取 .xls 文件

import pandas as pd

# 读取 .xls 文件
df = pd.read_excel('example.xls', engine='xlrd')

写入 .xls 文件

import pandas as pd

# 创建一个 DataFrame
data = {'Name': ['John', 'Anna', 'Peter', 'Linda'],
        'Age': [28, 24, 35, 32]}
df = pd.DataFrame(data)

# 写入 .xls 文件
df.to_excel('output.xls', engine='xlwt', index=False)

总结

Pandas:适合处理日常数据分析任务,支持读取和写入 .xls 和 .xlsx 文件。
Openpyxl:专门处理 .xlsx 文件。
xlrd 和 xlwt:分别用于读取和写入 .xls 文件。

使用 Pandas 操作 Excel 文件时,Pandas 会根据文件后缀自动选择合适的引擎来处理文件格式。


网站公告

今日签到

点亮在社区的每一天
去签到