基本信息
源码名称:对PCA降维后的手写体数字图片数据分类
源码大小:0.01M
文件格式:.ipynb
开发语言:Python
更新时间:2022-11-17
   源码介绍

对PCA降维后的手写体数字图片数据分类


使用sklearn.decompositionlPCA类对手写体数字图片数据进行降维;

使用sklearn.neural networkMLPClassifier类对降维后的数据训练分类模型,对测试数据进行分类,要求分类准确率达到80%以上

训练数据:digits training.csv

测试数据:digits testing.csv

1列是类别,其他列是特征属性

1.   实验题目

1.   载入训川练数据、分出特征属性和类别,对特征属性标准化,显示读入数据的行数

#标准化函数

def normalizeData(X):

return X-np.mean(X,axis=0)

2.   使用PCA对数据降维,显示主成分个数

for i in range(len(pca.explained_variance_ratio_)):

total_ratio pca.explained_variance_ratio_[i]

3.   使用多层感知机对降维后的数据训练分类模型,保存分类模型为mlpNN_pca.m

MLPClassifier(solver='lbfgs',alpha=1e-5,hidden_layer_sizes=(48,24),

4.   载入测试数据、分出特征属性和类别,对特征属性标准化,显示读入数据的行数

xTest pca.transform(xTest)

5.   使用分类模型对测试数据分类,显示分类准确率