Overview

机器学习是人工智能的一个分支，它使计算机系统能够从数据中自动学习和改进，而无需进行明确的程序编写。其核心是，计算机通过算法在经验（数据）中找到规律或模式，并用它来对未知的新数据做出预测或决策。

对于一个计算机程序，如果它在某类任务 T 上的表现，根据某个性能度量 P，能够随着经验 E 的增加而提升，我们就说它从经验 E 中学习了。 ---- 卡内基梅隆大学汤姆·米切尔教授

任何机器学习问题可以归于两大类之一：监督学习（Supervised Learning），或无监督学习（Unsupervised Learning，或称非监督学习）。当然，还有半监督学习、强化学习等，尚不在讨论范围内。

监督学习

监督学习使用有标签的数据集，其任务是学习一个模型，使模型能够对任意给定的输入，对其相应的输出做出一个好的预测。

监督学习问题被分为回归（Regression）和分类（Classification）问题：

回归问题：将输入变量映射到某个连续函数，即预测一个连续值；分类问题：将输入变量映射到离散的类别中，即预测一个离散值。

在无监督学习中，使用的数据集没有标签，不知道结果会是什么样子，但可以通过聚类的方式从数据中提取一个特殊的结构。