数据分析7

发布于:2023-01-19 ⋅ 阅读:(162) ⋅ 点赞:(0)

目录

1.什么是pandas?

2.pandas的分类

3.series

一维数组

 字典

4.读取csv文件

 5.pandas读取数据库


1.什么是pandas?

pandas能够帮助我们处理除数值之外其他的字符串,时间序列类型等等

2.pandas的分类

series:一维数组,带标签数组
DataFrame 二维数组,series容器

3.series

一维数组

import pandas as pd
import numpy as np
t1=pd.Series(np.arange(12) ,index=list("abcdefghijkh"))
print(type(t1))
print(t1)

 字典

tmp_dict={"name":"黄晓明","年龄":48,"电话":10086}
t2=pd.Series(tmp_dict)
print(t2)
print(t2[0])
print(t2["电话"])
print(t2[["电话","name"]])
print(t2[[0,2]])
print(list(t2.index)[:2])

4.读取csv文件

t=pd.read_csv("D:\\python\\5.数据分析\\test")

 

 5.pandas读取数据库

主要使用:pd.read_sql(sql,con=db_conn)

sql:查询数据库中创建的表

con:通过pymysql建立连接

import pymysql
import pandas as pd

db_conn = pymysql.connect(
    host='localhost',
    port=3306,
    user='root',
    password='123456',
    database='test',
    charset='utf8'
)
# sql='select * from company where id="%s"'
# print(pd.read_sql(sql,con=db_conn,params=[2]))
sql='select * from company'
data=pd.read_sql_query(sql,con=db_conn)
df=pd.DataFrame(data)
print(df)

print(data.head(2))
print(df.tail(2))

#概述

print(df.info())  
print(df.describe())


网站公告

今日签到

点亮在社区的每一天
去签到