跳转至

监督学习与非监督学习

什么是机器学习

对于机器学习的两种定义:

  • "the field of study that gives computers the ability to learn without being explicitly programmed." - Arthur Samuel
  • "A computer program is said to learn from experience E with respect to some class of tasks T and performance measure P, if its performance at tasks in T, as measured by P, improves with experience E." - Tom Mitchell

任何机器学习问题可以归于两大类之一:
- 监督学习(Supervised Learning)
- 无监督学习(Unsupervised Learning,或称非监督学习)

当然,还有半监督学习、强化学习等,尚不在讨论范围内。

监督学习

监督学习使用有标签的数据集,其任务是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出一个好的预测。

监督学习问题被分为 回归(Regression)分类(Classification) 问题:

分类问题:将输入变量映射到离散的类别中,即预测一个离散值;

回归问题:将输入变量映射到某个连续函数,即预测一个连续值。 ![[AI/机器学习/assets/20250601222253.png]]

非监督学习

在非监督学习中,使用的数据集没有标签,不知道结果会是什么样子,但可以通过聚类的方式从数据中提取一个特殊的结构。 ![[AI/机器学习/assets/20250601222534.png]]