1 什么是机器学习
什么是机器学习?
这个问题不同的人员会有不同的理解。我个人觉得,用大白话来描述机器学习,就是让计算机能够通过一定方式的学习和训练,选择合适的模型,在遇到新输入的数据时,可以找出有用的信息,并预测潜在的需求。最终反映的结果就是,好像计算机或者其他设备跟人类一样具有智能化的特征,能够快速识别和选择有用的信息。
机器学习通常可以分为三个大的步骤,即 输入、整合、输出,可以用下图来表示大致的意思:
2 机器学习示例(scikit-learn)
在python语言中,scikit-learn是一个开源的机器学习库。下面以sklearn为例,来简单描述机器学习的过程。
2.1 加载数据
通常第一步是获取相关数据,并进行相应的处理,使之可以在后续过程中使用。
from sklearn import datasets
加载iris数据集并查看相关信息
# 加载数据集iris = datasets.load_iris()# print(iris)print(type(iris)) print(iris.keys())# 查看部分数据print(iris.data[ :5, :])# print(iris.data)
<class 'sklearn.datasets.base.Bunch'> dict_keys(['DESCR', 'data', 'feature_names', 'target', 'target_names']) [[ 5.1 3.5 1.4 &nb