2021
08-20
08-20
python缺失值的解决方法总结
1、解决方法(1)忽视元组。缺少类别标签时,通常这样做(假设挖掘任务与分类有关),除非元组有多个属性缺失值,否则该方法不太有效。当个属性缺值的百分比变化很大时,其性能特别差。(2)人工填写缺失值。一般来说,这种方法需要很长时间,当数据集大且缺少很多值时,这种方法可能无法实现。(3)使用全局常量填充缺失值。将缺失的属性值用同一常数(如Unknown或负无限)替换。如果缺失值都是用unknown替换的话,挖掘程序可能会认为...
继续阅读 >
缺失值处理一般包括三步:1.识别缺失数据;2.检查导致数据缺失的原因;3.删除包含缺失值的实例或用合理的数值代替(插补)缺失值。1.判断缺失值函数is.na()、is.nan()和is.infinite()可分别用来识别缺失值、不可能值和无穷值。每个返回结果都是TRUE或FALSEna表示缺失值nan表示NOTANUMBERinfinite表示+-Inf一定要亲手试x=0/0,以及x=1/0>x<-NA>is.na(x)[1]TRUE>is.nan(x)[1]FALSE>is.infinite(x)[1]FALSE函数compl...