利用KMP的Next数组求解最小循环节以下所有数组均以0作为数组首位
首先我们知道next数组的含义,next[i]表示在模式串中第i个字符失配时,下一次比较时模式串匹配的起始位置。
下面给出next数组的模板:
123456789101112131415const int N = 100002;int nxt[N];void getN ...
Read more
简明matplotlib API入门这里看一个简单的例子:
123456import numpy as npimport matplotlib.pyplot as pltdata = np.arange(10)print(data) ==>[0 1 2 3 4 5 6 7 8 9]print(plt.plot(data)) #输 ...
Read more
分层索引分层索引允许在一个轴向上拥有多个索引层级,也就是提供了一种在低纬度处理高纬度数据的方式
12345678910111213141516data = pd.Series(np.random.randn(9),index=[['a','a','a','b','b','c','c','d','d'], ...
Read more
字符串操作字符串对象方法Python中的split方法可以将字符串拆成多块,可传入参数表示分隔符,如不传入参数默认分隔符为空格
123val = 'a,b, guido'print(val.split(',')) ==>['a', 'b', ' guido']
可以用in关键字判断是否是子字符串
12 ...
Read more
数据转换删除重复值当DataFrame中出现重复行时可进行操作
12345678910111213141516171819202122232425262728293031323334353637383940414243444546474849505152data = pd.DataFrame({' ...
Read more
处理缺失值对于数值型数据,pandas使用浮点值NaN来代表缺失。而缺失值为NA,表示数据不存在或者存在但无法观察。有一些函数可以用于处理:
12345678910111213string_data = pd.Series(['aardvark', 'artichoke', np.nan, 'avocado' ...
Read more
与Web API进行交互这里通过一个实例来说明:获取GitHub上最新的30条关于pandas的问题
可以使用附加库requests发送一个get请求
12345678910111213141516171819202122232425262728293031323334353637url = 'https://api.gi ...
Read more
二进制格式使用python内建的pickle序列化模块进行二进制格式操作是存储数据(也称序列化)最高效最方便的方式之一。pandas拥有to_pickle方法可以将数据以pickle格式写入硬盘
12df = pd.read_csv('/Users/roarboil/Desktop/1.csv')df.to_ ...
Read more
文本格式数据的读写将表格型数据读取为DataFrame对象是pandas的重要特性,下表总结了部分函数
这些函数的可选参数主要有:
索引
可以将一或多个列作为返回的DataFrame,从文件或用户处获得列名
类型推断和数据转换
包括用户自定义的值转换和自定义的缺失值符号列表
日期时间解析
包括组合功能,也包括将分散 ...
Read more
描述性统计的概述与计算pandas对象有一个强大的数学、统计方法集合,大部分属于归约、汇总统计的类别,这些方法从DataFrame的行或列中抽取一个Series或一系列的单个值,同时还内建了处理缺失值的功能
下面是一些函数使用的例子,包括归约方法和积累型方法:
123456789101112131415161718192 ...
Read more