机器学习统计学领域,降维(dimensionality reduction)是指在某些限定条件下,降低随机变量个数,得到一组“不相关”主变量的过程[1]。 降维可进一步细分为变量选择特征提取两大方法。

变量选择

编辑

变量选择假定数据中包含大量冗余或无关变量(或称特征、属性、指标等),旨在从原有变量中找出主要变量。现代统计学中对变量选择的研究文献,大多集中于高维回归分析英语High-dimensional_statistics,其中最具代表性的方法包括:

特征提取

编辑

特徵提取可以看作变量选择方法的一般化:变量选择假设在原始数据中,变量数目浩繁,但只有少数几个真正起作用;而特征提取则认为在所有变量可能的函数(比如这些变量各种可能的线性组合)中,只有少数几个真正起作用。有代表性的方法包括:

参见

编辑

参考文献

编辑
  1. ^ Roweis, S. T.; Saul, L. K. Nonlinear Dimensionality Reduction by Locally Linear Embedding. Science. 2000, 290 (5500): 2323–2326. PMID 11125150. doi:10.1126/science.290.5500.2323. 

📚 Artikel Terkait di Wikipedia

平滑

数位滤波器 卡尔曼滤波 Kernel smoother(英语:Kernel smoother) Laplacian smoothing(英语:Laplacian smoothing) Stretched grid method(英语:Stretched grid method) 低通滤波器 递归滤波器

径向基函数核

Jean-Philippe, Koji Tsuda, and Bernhard Schölkopf (2004). "A primer on kernel methods." Kernel Methods in Computational Biology. Shashua, Amnon. Introduction to Machine

谱聚类

Spark 3.2.0 Documentation. [2022-08-07]. (原始内容存档于2017-07-03).  Kernlab: Kernel-Based Machine Learning Lab. 12 November 2019 [2022-08-07]. (原始内容存档于2017-06-27)

相关向量机

1162/15324430152748236. (原始内容存档于2020-02-19).  dlib C++ Library (页面存档备份,存于互联网档案馆) The Kernel-Machine Library (页面存档备份,存于互联网档案馆) Tipping's webpage on Sparse Bayesian Models

核方法

径向基函数核 字符串函数核 神经正切核 神经网络高斯过程(NNGP)核 向量输出的核方法 核密度估计 表示定理 相似性学习 科孚定理 Kernel method. Engati. [2023-04-04]. (原始内容存档于2023-04-04) (英语).  Theodoridis, Sergios

卷积

Cambridge University Press, 2011, ISBN 978-1107601048  Diggle, P. J., A kernel method for smoothing point process data, Journal of the Royal Statistical Society

核回归

核回归(英語:Kernel regression),又称局部加权线性回归是统计学中用于估计随机变量的条件期望的非参数方法。目的是找到一对随机变量X和Y之间的非线性关系。 在任何非参数回归中 ,变量的条件期望 Y {\displaystyle Y} 相对于变量 X {\displaystyle X} 可以写成:

支持向量机

间隔分开。然后,将新的实例映射到同一空间,并基于它们落在间隔的哪一侧来预测所属类别。 除了进行线性分类之外,SVM还可以使用所谓的核技巧(英语:kernel trick)有效地进行非线性分类,将其输入隐式映射到高维特征空间中。 当数据未被标记时,不能进行监督式学习,需要用非監督式學習,它会尝试找出数