2020
10-08
10-08
用pandas划分数据集实现训练集和测试集
1、使用model_select子模块中的train_test_split函数进行划分数据:使用kaggle上Titanic数据集划分方法:随机划分#导入pandas模块,sklearn中model_select模块importpandasaspdfromsklearn.model_selectimporttrain_test_split#读取数据data=pd.read_csv('.../titanic_dataset/train.csv')#将特征划分到X中,标签划分到Y中x=data.iloc[:,2:]y=data.loc['Survived']#使用train_test_split函数划分数据集(训练...
继续阅读 >