202009-23 python pandas移动窗口函数rolling的用法 超级好用的移动窗口函数最近经常使用移动窗口函数,觉得很方便,功能强大,代码简单,故将pandas中的移动窗口函数都做介绍。它都是以rolling打头的函数,后接具体的函数,来显示该移动窗口函数的功能。rolling_count计算各个窗口中非NA观测值的数量函数pandas.rolling_count(arg,window,freq=None,center=False,how=None)arg:DataFrame或numpy的ndarray数组格式window:指移动窗口的大小,为整数freq:center:布尔... 继续阅读 >
202009-23 python使用pandas抽样训练数据中某个类别实例 废话真的一句也不想多说,直接看代码吧!#-*-coding:utf-8-*-importnumpyfromsklearnimportmetricsfromsklearn.svmimportLinearSVCfromsklearn.naive_bayesimportMultinomialNBfromsklearnimportlinear_modelfromsklearn.datasetsimportload_irisfromsklearn.cross_validationimporttrain_test_splitfromsklearn.preprocessingimportOneHotEncoder,StandardScalerfromsklearnimportcross_... 继续阅读 >
202009-23 Pandas时间序列基础详解(转换,索引,切片) 时间序列的类型:时间戳:具体的时刻固定的时间区间:例如2007年的1月或整个2010年时间间隔:由开始时间和结束时间表示,时间区间可以被认为是间隔的特殊情况实验时间和消耗时间:每个时间是相对于特定开始时间的时间的量度,(例如自从被放置在烤箱中每秒烘烤的饼干的直径)日期和时间数据的类型及工具datetime模块中的类型:date使用公历日历存储日历日期(年,月,日)time将时间存储为小时,分钟,秒,微秒datetime存... 继续阅读 >
202009-23 Pandas —— resample()重采样和asfreq()频度转换方式 resample()resample()进行重采样。重采样(Resampling)指的是把时间序列的频度变为另一个频度的过程。把高频度的数据变为低频度叫做降采样(downsampling),把低频度变为高频度叫做增采样(upsampling)。降采样考虑因素:各区间哪边是闭合的(参数:closed)如何标记各聚合面元,用区间的开头还是末尾(参数:label)In[232]:ts_index=pd.date_range('2018-08-03',periods=12,freq='T')In[233]:ts=pd.Series(np.aran... 继续阅读 >
202009-23 Pandas时间序列:时期(period)及其算术运算详解 importpandasaspdimportnumpyasnp一、时间类型及其在python中对应的类型时间戳?timestamp时间间隔?timedelta时期?period二、时期时期表示的是时间区间,比如数日、数月、数季、数年等1.定义一个Periodp=pd.Period(2007,freq='A-DEC')#表示以12月作为结束的一整年,这里表示从2007-01-01到2017-12-31的全年pPeriod('2007','A-DEC')2.通过加减整数可以实现对Period的移动p+5Period('2012','A-DEC')p-2Period('2005','A-D... 继续阅读 >