挠姘工贸有限公司

机器学习中算法与模型的不同

202007月17日

机器学习中算法与模型的不同

机器学习中的“算法”是什么?

机器学习中的“算法”是在数据上运走以创建机器学习“模型”的过程。

机器学习算法实走“模式识别”。算法从数据中“学习”,或者对数据集进走“拟相符”。

机器学习算法有很众。比如,吾们有分类的算法,如 K- 近邻算法;回归的算法,如线性回归;聚类的算法,如 K- 均值算法。

下面是机器学习算法的例子:

  线性回归  逻辑回归  决策树  人造神经网络  K- 近来邻  K- 均值

你能够把机器学习算法想象成计算机科学中的任何其他算法。

例如,你能够熟识的一些其他类型的算法包括用于数据排序的冒泡排序和用于搜索的最佳优先排序。

所以,机器学习算法具有很众特性:

 机器学习计算法能够用数学和假代码来描述。  能够对机器学习算法的效率进走分析和描述。  机器学习算法能够用任何一栽当代编程说话来实现。

例如,你能够会在钻研论文和教科书中望到用假代码或 线性代数 描述的机器学习算法。你能够望到一个特定的机器学习算法与另一个特性算法相比的计算效率。

学术界能够设计出全休你的机器学习算法,而机器学习实践者能够在他们的项现在中行使标准的机器学习算法。这就像计算机科学的其他周围相通,学者能够设计出崭新的排序算法,程序员能够在行使程序中行使标准的排序算法。

你还能够会望到众个机器学习算法实现,并在一个具有标准 API 的库中挑供。一个通走的例子是 scikit-learn 库,它在 Python 中挑供了很众分类、回归和聚类机器学习算法的实现。

机器学习中的“模型”是什么?

机器学习中的“模型”是运走在数据上的机器学习算法的输出。

模型外示机器学习算法所学到的内容。

模型是在训练数据上运走机器学习算法后保存的“东西”,它外示用于进走展望所需的规则、数字和任何其他特定于算法的数据组织。

吾举一些例子,能够会让人更清新地晓畅这一点:

 线性回归算法的终局是一个由具有特定值的稀奇向量构成的模型。  决策树算法的终局是一个由具有特定值的 if-then 语句树构成的模型。  神经网络 / 逆向传播 / 梯度降落算法一首产生一个由具有特定值的向量或权重矩阵和特定值的图组织构成的模型。

机器学模型对于初学者来说更具挑衅性,由于它与计算机科学中的其他算法异国清晰的类比。

例如,排序算法的排序列外输出并不是真实的模型。

最益的类比是将机器学习模型想象成一个“程序”。

机器学习模型“程序”由数据和行使数据进走展望的过程构成。

例如,考虑线性回归算法和由此产生的模型。该模型由系数(数据)向量构成,这些系数(数据)与行为输入的一走新数据相乘并乞降,以便进走展望(展望过程)。

吾们将数据保存为机器学习模型,以备后用。

吾们频繁行使机器学习库挑供的机器学习模型的展望过程。未必候,吾们能够本身实现展望过程行为吾们行使程序的一片面。考虑到大无数展望过程都专门浅易,这清淡都是直言不讳的。

算法与模型框架

现在吾们已经熟识了机器学习的“算法”和机器学习的“模型”。

详细来说,就是对数据运走算法来创建模型。

 机器学习 =>机器学习模型

吾们还晓畅到,模型由数据和如何行使数据对新数据进走展望的过程构成。倘若你情愿的话,你也能够将这一过程视为一栽展望算法。

 机器学习模型 == 模型数据 展望算法

这栽区分对于理解普及的算法专门有协助。

例如,大无数算法的一切做事都在“算法”中,而“展望算法”的做事很少。

清淡情况下,算法是某栽优化程序,即在训练数据集上使模型(数据 展望算法)的偏差最幼化。线性回归算法就是一个很益的例子。它实走一个优化过程(或用线性代数进走分析求解),联系我们找到一组权重,使训练数据集上的偏差之和平方最幼化。

线性回归

 算法:在训练数据集上找到偏差最幼的系数集。  模型:  模型数据:整个训练数据集。   展望算法:找出 K 个最相通的走,取其现在的变量的平均值。

有些算法很噜苏,甚至什么都不做,一切的做事都在模型或展望算法中。

K- 近来邻算法除了保存整个训练数据集外异国其他的算法。所以,弄醒数据就是整个训练数据集,一切的做事都在展望算法中,即,一走新数据如何与保存的训练数据集交互以作出展望。

K- 近来邻

 算法:保存训练数据。  模型:  模型数据:整个训练数据集。   展望过程:找出 K 个最相通的走,取其现在的变量的平均值。

你能够把这个分解行为一个框架来理解任何机器学习算法。

机器学习是自动编程

吾们真的只是想要一个机器学习的“模型”,而“算法”就是吾们获得模型的路径。

机器学习技术用于解决其他手段无法有效或高效解决的题目。

例如,倘若吾们必要将电子邮件分类为垃圾邮件或非垃圾邮件,吾们必要一个柔件程序来完善此义务。

吾们能够坐下来,手动查望大量的电子邮件,然后写 if 语句来完善相符格义务。人们已经试过这个手段。原形表明,这栽手段是缓慢的、薄弱的,而且终局也不是很益。

相逆,吾们能够行使机器学习技术来解决这个题目。详细来说,像 质朴贝叶斯(Naive Bayes)云云的算法就能够从大量的历史邮件样本数据荟萃学习如何将邮件分类为垃圾邮件和非垃圾邮件。

吾们不想要“质朴的贝叶斯”,吾们想要质朴贝叶斯给出的模型,就是吾们能够用来对邮件进走分类的模型(概率向量和行使概率概率的展望算法)。吾们想要的是模型,而不是用来创建模型的算法。

从这个意义上来说,机器学习模型是一个由机器学习算法自动编写、或创建、或学习的程序,用来解决吾们的题目。

行为开发人员,吾们对人造智能意义上的机器学习算法的“学习”不太感趣味。吾们并不关心模拟学习过程。有些人能够会关心,这很乐趣,但这不是吾们行使机器学习算法的因为。

相逆,吾们更望重的是机器学习算法挑供的自动编程能力更感趣味。吾们期待能够有效地创建一个有效的模型,并将其融入到吾们的柔件项现在中。

机器学习算法实走自动编程,而机器学习模型是为吾们创建的程序。

 

回到顶部

Powered by 挠姘工贸有限公司 @2018 RSS地图 html地图

Copyright 365建站 © 2013-2018 360 版权所有