Overview
Overview
机器学习是人工智能的一个分支,它使计算机系统能够从数据中自动学习和改进,而无需进行明确的程序编写。其核心是,计算机通过算法在经验(数据)中找到规律或模式,并用它来对未知的新数据做出预测或决策。
对于一个计算机程序,如果它在某类任务 T 上的表现,根据某个性能度量 P,能够随着经验 E 的增加而提升,我们就说它从经验 E 中学习了。 ---- 卡内基梅隆大学 汤姆·米切尔教授
任何机器学习问题可以归于两大类之一:监督学习(Supervised Learning),或无监督学习(Unsupervised Learning,或称非监督学习)。当然,还有半监督学习、强化学习等,尚不在讨论范围内。
监督学习
监督学习使用有标签的数据集,其任务是学习一个模型,使模型能够对任意给定的输入,对其相应的输出做出一个好的预测。
监督学习问题被分为回归(Regression)和分类(Classification)问题:
回归问题:将输入变量映射到某个连续函数,即预测一个连续值; 分类问题:将输入变量映射到离散的类别中,即预测一个离散值。
无监督学习
在无监督学习中,使用的数据集没有标签,不知道结果会是什么样子,但可以通过聚类的方式从数据中提取一个特殊的结构。