数据处理学习笔记9

发布于:2024-05-10 ⋅ 阅读:(25) ⋅ 点赞:(0)

在这里插入图片描述
一些其他的函数
“Resize”和“Reshape”的区别主要在于它们对数组元素数量和形状的处理方式不同,以下是详细介绍:
“Resize”通常会改变数组的元素数量,在放大数组形状时会用0补全新增的元素,而在缩小数组形状时会丢弃多余的元素,它通常用于改变数组的尺寸,即数组中元素的总数可能会发生变化。
“Reshape”保持原始数组中的元素数量不变,仅改变数组的维度或形状,如果新的形状导致元素数量与原始形状不同,则会抛出错误,它主要用于调整数组的外观或布局,而不改变元素的resize 无返回值(返回值为None),会改变原数组。
reshape 有返回值,返回值是被reshape后的数组,不会改变原数组。
resize 可以放大或者缩小原数组的形状:放大时,会用0补全剩余元素;缩小时,直接丢弃多余元素。
reshape 要求reshape前后元素个数相同,否则会报错,无法运行。

unique_values = np.unique(arr,return_index=False,return_inverse=False, return_counts=False, axis=None)

arr:要从中提取唯一值的输入数组。
return_index:可选参数,如果设置为 True,则返回一个索引数组,其中包含唯一值在输入数组中的第一次出现的索引。默认为 False。
return_inverse:可选参数,如果设置为 True,则返回一个整数数组,其中包含原始数组中的每个元素在唯一值数组中的索引。这可以用于将唯一值的数组还原回原始数组。默认为 False。
return_counts:可选参数,如果设置为 True,则返回一个整数数组,其中包含每个唯一值在输入数组中出现的次数。默认为 False。
axis:可选参数,用于指定在哪个轴上查找唯一值。如果未指定,则默认为 None,表示在整个数组中查找唯一值

在这里插入图片描述
通过列表创建

import pandas as pd
a = [1, 2, 3, 4]
s1 = pd.Series(a)
print(s1)
第一列为索引,是Series在创建时默认生成的,第二列即为值,通过type(s1)命令即可看到s1的数据类型为:pandas.core.series.Series,我们也可以将第四行的代码改为:
s1 = pd.Series(a, index=["a", "b", "c", "d"])
重新设置我们的索引,这样原先的索引就从0,1,2,3变为了a,b,c,d,更有一定的语义。
sI. values和s1. index,如果我们想查看索引和值可以分别通过访问Series的index属性和values属性

通过numpy中的数组创建
import pandas as pd
import numpy as np
arr = np.arange(1, 5)
s2 = pd.Series(arr)
print(s2)

字典创建
import pandas as pd
dic = {“name”: “丁少侠”, “age”: 20, “grade”: [100, 99, 88]}
s3 = pd.Series(dic)
print(s3)


网站公告

今日签到

点亮在社区的每一天
去签到