维度灾难(curse of dimensionality)是指随着特征数量的增多,模型的复杂度指数级增长。本案例首先通过高维单位球体积的变化形象地演示高维空间中体积的反直觉现象。然后通过随机生成的数据演示高维空间中欧式距离的失效特点,帮助理解维度灾难对机器学习的影响。其次,我们通过 Trunk 数据集理解了 Hughes phenomenon,即分类器的性能随着维数的增多先增大后减小的特点。我们通过一个月牙形数据集展示了核方法在利用维数的祝福方面的作用。最后,通过在一份随机噪音数据集上训练分类模型,理解随着维数的增大,分类器不断拟合噪音的过程。
![png](http://cookdata.cn/media/note_images/维度灾难封面_1593497727520_5d14.jpg)