基本功能这一部分将会介绍Series和DataFrame中的数据交互的基础机制
重建索引reindex方法用于创建一个符合新索引的新对象。Series在调用reindex方法时,会将数据按照新的索引值进行排列,如果某个索引之前并不存在,则会引入缺失值
123456789101112131415obj1 = ...
Read more
pandas数据结构介绍SeriesSeries是一种一维数组型对象,包含一个值序列并包含数据标签(称为索引index)
1234567obj = pd.Series([4,7,-5,3])print(obj) ==>0 41 72 -53 3dtype: int64
这里我们发现和之前nda ...
Read more
伪随机数生成numpy.random模块可以高效生成多种概率分布下的完整样本值数组。例如用normal来获得正态分布样本数组
123456samples = np.random.normal(size=(4,4))print(samples) ==>[[ 0.47198411 1.64333761 1 ...
Read more
线性代数与其他语言相比,Numpy的线代中不同的是*是矩阵的逐元素乘积,而不是点乘积。因此Numpy的数组方法和numpy空间中都有函数dot用于矩阵操作
12345678x = np.array([[1.,2.,3.],[4.,5.,6.]])y = np.array([[6.,23.],[-1,7],[ ...
Read more
使用数组进行文件输入与输出np.save和np.load是高效存取硬盘数据的两大工具函数。数组在默认情况下以压缩方式进行存储的,后缀名:.npy
12np.save('some_array',arr)np.load('some_array.npy')
Read more
使用数组进行面向数组编程使用Numpy数组可以使用简单数组表达式而无需写大量循环。这种利用数组表达式来替代显式循环的方法称为向量化。通常向量化会快上一到两个数量级。
将条件逻辑作为数组操作numpy.where函数是三元表达式x if condition else y的向量化版本
12345arr1 = np.array( ...
Read more
通用函数:快速的逐元素数组函数通用函数也称ufunc,是一种在ndarray数据中进行逐元素操作的函数。某些简单函数接收一个或多个标量数值,并产生一个或多个标量结果,而通用函数就是对这些简单函数的向量化封装
一元通用函数指的是进行简单的逐元素转换,而二元通用函数则会接收两个数组并返回一个数组作为结果。
Read more
Numpy ndarry:多维数组对象Numpy的核心特征之一就是ndarray一个ndarray是一个通用的多维同类数据容器,也即每一个元素均为相同类型。每一个数组都有一个shape属性,用来表征数组每一纬度的数量。每一个数组都有一个dtype属性,用来描述数组的数据类型
12data.shape ==> (2,3)data.d ...
Read more