scikit-learn官网:http://scikit-learn.org/stable/

通常情况下,一个学习问题会包含一组学习样本数据,计算机通过对样本数据的学习,尝试对未知数据进行预测。

学习问题一般可以分为:

  • 监督学习(supervised learning)

    • 分类(classification)

    • 回归(regression)

  • 非监督学习(unsupervised learning)

    • 聚类(clustering)

监督学习和非监督学习的区别就是,监督学习中,样本数据会包含要预测的标签(label),例如给定一组猫和狗的图片并对不同的照片给定对应的标签(猫或狗),而非监督学习只会给定一组图片,并不会给出标签。

分类和回归的区别是,分类的样本数据中的标签有大于等于2种,对于预测数据只需要判断属于其中哪个类即可,而回归则是期望输出由一个或多个连续的变量组成,例如根据鱼的年龄和重量推断鱼的长度。

网友评论