0%

马氏距离

参考链接:马氏距离(Mahalanobis Distance) - 知乎 (zhihu.com)

马氏距离(Mahalanobis distance)是一种用于计算两个样本点之间距离的方法。它考虑了各个特征之间的相关性,与欧氏距离不同,马氏距离可以反映出各个特征之间的协方差关系。

在多元统计分析中,马氏距离常用于评估多个变量之间的相似性或差异性,特别适用于数据集中存在多个相关特征的情况。马氏距离是欧氏距离的一种推广形式(当多维随机变量之间是独立同分布的,那么它们之间的协方差矩阵就是单位矩阵),可以用来衡量样本点与所在样本总体之间的距离。

具体地,假设有两个样本点 $x$ 和 $y$,它们各自有 $$ 个特征(即 $x$ 和 $y$ 分别为 $p$ 维向量),那么它们之间的马氏距离为:

其中,$S$ 是样本协方差矩阵,可以通过样本数据估计得到。马氏距离具有对称性和非负性,且满足三角不等式,因此可以作为距离度量来进行聚类、分类等任务。