利用KMP的Next数组求解最小循环节
以下所有数组均以0作为数组首位 首先我们知道next数组的含义,next[i]表示在模式串中第i个字符失配时,下一次比较时模式串匹配的起始位置。 下面给出next数组的模板: 123456789101112131415const int N = 100002;int nxt[N];void getN ...
Read more
简明matplotlib API入门
这里看一个简单的例子: 123456import numpy as npimport matplotlib.pyplot as pltdata = np.arange(10)print(data) ==>[0 1 2 3 4 5 6 7 8 9]print(plt.plot(data)) #输 ...
Read more
分层索引
分层索引允许在一个轴向上拥有多个索引层级,也就是提供了一种在低纬度处理高纬度数据的方式 12345678910111213141516data = pd.Series(np.random.randn(9),index=[['a','a','a','b','b','c','c','d','d'], ...
Read more
字符串操作
字符串对象方法Python中的split方法可以将字符串拆成多块,可传入参数表示分隔符,如不传入参数默认分隔符为空格 123val = 'a,b, guido'print(val.split(',')) ==>['a', 'b', ' guido'] 可以用in关键字判断是否是子字符串 12 ...
Read more
数据转换
删除重复值当DataFrame中出现重复行时可进行操作 12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152data = pd.DataFrame({' ...
Read more
处理缺失值
对于数值型数据,pandas使用浮点值NaN来代表缺失。而缺失值为NA,表示数据不存在或者存在但无法观察。有一些函数可以用于处理: 12345678910111213string_data = pd.Series(['aardvark', 'artichoke', np.nan, 'avocado' ...
Read more
与Web API进行交互
这里通过一个实例来说明:获取GitHub上最新的30条关于pandas的问题 可以使用附加库requests发送一个get请求 12345678910111213141516171819202122232425262728293031323334353637url = 'https://api.gi ...
Read more
二进制格式
使用python内建的pickle序列化模块进行二进制格式操作是存储数据(也称序列化)最高效最方便的方式之一。pandas拥有to_pickle方法可以将数据以pickle格式写入硬盘 12df = pd.read_csv('/Users/roarboil/Desktop/1.csv')df.to_ ...
Read more
文本格式数据的读写
将表格型数据读取为DataFrame对象是pandas的重要特性,下表总结了部分函数 这些函数的可选参数主要有: 索引 可以将一或多个列作为返回的DataFrame,从文件或用户处获得列名 类型推断和数据转换 包括用户自定义的值转换和自定义的缺失值符号列表 日期时间解析 包括组合功能,也包括将分散 ...
Read more
描述性统计的概述与计算
pandas对象有一个强大的数学、统计方法集合,大部分属于归约、汇总统计的类别,这些方法从DataFrame的行或列中抽取一个Series或一系列的单个值,同时还内建了处理缺失值的功能 下面是一些函数使用的例子,包括归约方法和积累型方法: 123456789101112131415161718192 ...
Read more