模式识别课程的一次作业。其目标是对UCI的手写数字数据集进行识别,样本数量大约是1600个。图片大小为16x16。要求必须使用SVM作为二分类的分类器。
本文重点是如何使用卷积神经网络(CNN)来提取手写数字图片特征,主要想看如何提取特征的请直接看源代码部分的94行左右,只要对tensorflow有一点了解就可以看懂。在最后会有完整的源代码、处理后数据的分享链接。转载请保留原文链接,谢谢。
UCI手写数字的数据集
源数据下载:http://oddmqitza.bkt.clouddn.com/archivetempsemeion.data
其中前256维为16x16的图片,后10维为one hot编码的标签。即0010000000代表2,1000000000代表0.
组合成图片大约是这样的:
卷积和池化形象理解
卷积