你应该了解的十种机器学习算法

发布时间：2023-11-02 10:58:16 所属栏目：动态来源：

导读：未来几年内，机器学习与人工智能的发展势头会日益显著和蓬勃。由于大数据是目前科技行业最热门的趋势，机器学习非常强大，可以根据大量数据做出预测或计算建议。使用大量数据训练的深度学习算法，构建出一个能够理解

未来几年内，机器学习与人工智能的发展势头会日益显著和蓬勃。由于大数据是目前科技行业最热门的趋势，机器学习非常强大，可以根据大量数据做出预测或计算建议。使用大量数据训练的深度学习算法，构建出一个能够理解人类语言并自动生成语言的模型。像 ChatGPT、文心一言这些产品一样，也是通过机器学习技术诞生的杰作。

1、最小二乘法和多项式拟合
大学时学习的数值分析，曾经将直线和曲线拟合到点来得到方程。可以使用它们来拟合机器学习中低维度的小型数据集的曲线。（对于大数据或具有多个维度的数据集，可能最终会严重过度拟合，所以不必担心）。OLS 具有封闭式解决方案，因此无需使用复杂的优化技术。

2、主成分分析(PCA)/SVD
PCA 是一种无监督方法，用于了解由向量组成的数据集的全局属性。此处分析数据点的协方差矩阵，以了解哪些维度（大多数）/数据点（有时）更重要（即它们之间的协方差较高，但与其他维度的协方差较低）。考虑矩阵的顶级 PC 的一种方法是考虑具有最高特征值的特征向量。SVD 本质上也是一种计算有序分量的方法，但不需要获取点的协方差矩阵即可获得它。

3、逻辑回归
Logistic 回归是在应用权重后应用非线性（主要使用 sigmoid 函数，也可以使用 tanh）的约束线性回归，因此将输出限制为接近 +/- 类（在 sigmoid 情况下为 1 和 0）。交叉熵损失函数使用梯度下降进行优化。初学者注意：逻辑回归用于分类，而不是回归。还可以将逻辑回归思维单层神经网络。逻辑回归使用梯度下降或 L-BFGS 等优化方法进行训练。NLP 人们经常将其与最大熵分类器的名称一起使用。

4、K表示聚类
他是无监督聚类算法。给定一组向量形式的数据点，我们可以根据它们之间的距离来形成点簇。这是一种期望最大化算法，它迭代地移动聚类中心，然后将点与每个聚类中心结合在一起。算法采用的输入是要生成的簇的数量以及它将尝试收敛簇的迭代次数。

5、SVM（支持向量机）
SVM 是一种常用的监督学习算法，是像线性/逻辑回归一样的线性模型，不同之处在于它的核心思想是将数据映射到高维特征空间，并在该空间中寻找一个最优的超平面来进行分类。超平面是一个n-1维的线性子空间，其中 n 是特征的维数。SVM 在特征空间中选择具有最大间隔（Margin）的超平面作为最优分类边界，以提高分类的鲁棒性。

6、前馈神经网络
这些基本上是多层逻辑回归分类器。由非线性（sigmoid、tanh、relu + softmax 和很酷的新 selu）分隔的许多权重层。它们的另一个流行名称是多层感知器。FFNN 可作为自动编码器用于分类和无监督特征学习。

7、卷积神经网络（Convnets）
当今世界上几乎所有最先进的基于视觉的机器学习结果都是使用卷积神经网络实现的。它们可用于图像分类、对象检测甚至图像分割。卷积网络由 Yann Lecun 在80 年代末至90 年代初发明，其特征是卷积层充当分层特征提取器。也可以在文本（甚至图表）中使用它们。

8、循环神经网络（RNN）：
RNN 通过在时间 t 的聚合器状态和时间 t 的输入上递归应用同一组权重来对序列进行建模（假设序列在时间 0..t..T 具有输入，并且在每个时间 t 有一个隐藏状态）这是 RNN t-1 步骤的输出）。纯 RNN 现在很少使用，但其对应的 LSTM 和 GRU 在大多数序列建模任务中都是最先进的。

9、条件随机场（CRF）
CRF 可能是概率图模型 (PGM) 系列中最常用的模型。它们用于像 RNN 一样的序列建模，也可以与 RNN 结合使用。在神经机器翻译系统出现之前，条件随机场是最先进的，在许多小数据集的序列标记任务中，它们仍然比需要大量数据才能泛化的 RNN 学得更好。它们还可以用于其他结构化预测任务，例如图像分割等。CRF 对序列的每个元素（例如句子）进行建模，以便邻居影响序列中组件的标签，而不是所有标签彼此独立。

10、决策树
它是一种基于树结构的分类和回归算法。它通过对特征进行分割来构建一个树形模型，每个内部节点表示一个特征，每个叶节点表示一个类别或一个数值。决策树通过对特征进行逐层的判断和分割，以最终得到一个预测结果。

TD 算法（时间差分法）
如果仍然想知道上述方法如何解决像 DeepMind 那样击败围棋世界冠军这样的任务，那么它们不能。上面讨论的所有 10 种算法都是模式识别，而不是策略学习器。为了学习解决多步骤问题的策略，例如阿尔法GO赢得一场国际象棋比赛、ChatGPT语音机器人。这种类型的机器学习称为强化学习。该领域最近取得的许多（不是全部）成功都是将卷积网络或 LSTM 的感知能力与一组称为时间差分学习的算法相结合的结果。其中包括 Q-Learning、SARSA 、DQN等等其他一些变体。这些方法可以用于解决复杂的问题，例如，如何在不同的系统之间进行通信，以及如何使用不同的数据类型。

（编辑：驾考网）

【声明】本站内容均来自网络，其相关言论仅代表作者个人观点，不代表本站立场。若无意侵犯到您的权利，请及时与联系站长删除相关内容!