2021
05-02
05-02
python 机器学习的标准化、归一化、正则化、离散化和白化
机器学习的本质是从数据集中发现数据内在的特征,而数据的内在特征往往被样本的规格、分布范围等外在特征所掩盖。数据预处理正是为了最大限度地帮助机器学习模型或算法找到数据内在特征所做的一系列操作,这些操作主要包括标准化、归一化、正则化、离散化和白化等。1标准化 假定样本集是二维平面上的若干个点,横坐标x分布于区间[0,100]...
继续阅读 >
一、项目环境开发工具:RStudioR:3.5.2相关包:infotheo,discretization,smbinning,dplyr,sqldf二、导入数据#这里我们使用的是鸢尾花数据集(iris)data(iris)head(iris)Sepal.LengthSepal.WidthPetal.LengthPetal.WidthSpecies15.13.51.40.2setosa24.93.01.40.2setosa...