降维 📖 Wikipedia

🌐 🇮🇩 ID 🇺🇸 EN 🇩🇪 DE 🇫🇷 FR 🇪🇸 ES 🇷🇺 RU 🇮🇹 IT 🇵🇱 PL 🇨🇳 ZH 🇯🇵 JA 🇧🇷 PT ↗ Wikipedia

📑 Table of Contents▼

在机器学习和统计学领域，降维（dimensionality reduction）是指在某些限定条件下，降低随机变量个数，得到一组“不相关”主变量的过程^[1]。降维可进一步细分为变量选择和特征提取两大方法。

变量选择

编辑

变量选择假定数据中包含大量冗余或无关变量（或称特征、属性、指标等），旨在从原有变量中找出主要变量。现代统计学中对变量选择的研究文献，大多集中于高维回归分析（英语：High-dimensional_statistics），其中最具代表性的方法包括：

Lasso算法 (Robert Tibshirani提出)
Elastic net regularization（英语：Elastic net regularization） (邹晖（英语：Hui Zou）和Trevor Hastie（英语：Trevor Hastie）提出)
SCAD (范剑青和李润泽提出)
SURE screening (范剑青和吕金翅提出)
PLUS (张存惠提出)

特征提取

编辑

特徵提取可以看作变量选择方法的一般化：变量选择假设在原始数据中，变量数目浩繁，但只有少数几个真正起作用；而特征提取则认为在所有变量可能的函数(比如这些变量各种可能的线性组合)中，只有少数几个真正起作用。有代表性的方法包括：

主成分分析(PCA)
因子分析
核方法(教科书中称为“Kernel method”或“Kernel trick”，常与其他方法如PCA组合使用)
基于距离的方法，例如：
- 多维尺度分析
- 非负矩阵分解（英语：Non-negative_matrix_factorization）
- 随机投影法（英语：Random projection）(理论依据是约翰逊-林登斯特劳斯定理)

参见

编辑

参考文献

编辑

^ Roweis, S. T.; Saul, L. K. Nonlinear Dimensionality Reduction by Locally Linear Embedding. Science. 2000, 290 (5500): 2323–2326. PMID 11125150. doi:10.1126/science.290.5500.2323.

📚 Artikel Terkait di Wikipedia

平滑

数位滤波器卡尔曼滤波 Kernel smoother（英语：Kernel smoother） Laplacian smoothing（英语：Laplacian smoothing） Stretched grid method（英语：Stretched grid method）低通滤波器递归滤波器

径向基函数核

Jean-Philippe, Koji Tsuda, and Bernhard Schölkopf (2004). "A primer on kernel methods." Kernel Methods in Computational Biology. Shashua, Amnon. Introduction to Machine

谱聚类

Spark 3.2.0 Documentation. [2022-08-07]. （原始内容存档于2017-07-03）. Kernlab: Kernel-Based Machine Learning Lab. 12 November 2019 [2022-08-07]. （原始内容存档于2017-06-27）

相关向量机

1162/15324430152748236. （原始内容存档于2020-02-19）. dlib C++ Library （页面存档备份，存于互联网档案馆） The Kernel-Machine Library （页面存档备份，存于互联网档案馆） Tipping's webpage on Sparse Bayesian Models

核方法

径向基函数核字符串函数核神经正切核神经网络高斯过程（NNGP）核向量输出的核方法核密度估计表示定理相似性学习科孚定理 Kernel method. Engati. [2023-04-04]. （原始内容存档于2023-04-04）（英语）. Theodoridis, Sergios

卷积

Cambridge University Press, 2011, ISBN 978-1107601048 Diggle, P. J., A kernel method for smoothing point process data, Journal of the Royal Statistical Society

核回归

核回归（英語：Kernel regression），又称局部加权线性回归是统计学中用于估计随机变量的条件期望的非参数方法。目的是找到一对随机变量X和Y之间的非线性关系。在任何非参数回归中，变量的条件期望 Y {\displaystyle Y} 相对于变量 X {\displaystyle X} 可以写成：

支持向量机

间隔分开。然后，将新的实例映射到同一空间，并基于它们落在间隔的哪一侧来预测所属类别。除了进行线性分类之外，SVM还可以使用所谓的核技巧（英语：kernel trick）有效地进行非线性分类，将其输入隐式映射到高维特征空间中。当数据未被标记时，不能进行监督式学习，需要用非監督式學習，它会尝试找出数

Movie Index: 1 2 3 4 5 6 7 8 9 A B C D E F G H I J K L M N O P Q R S T U V W X Y Z