可视化在各类算法中也有非常重要的作用,我们可以利用可视化进行很多探索性分析。 以线性回归算法为例,我们介绍一下可视化分析在线性回归算法中的应用;可视化分析主要体现在利用各类残差图进行线性回归诊断。 残差图是指以某种残差为纵坐标,以其他适宜的量为横坐标的散点图;具有不同横标坐标的残差图的意义是不一样的;这里残差取真实值与预测值之间的差值。 ## 线性诊断——散点图 以**自变量的观测值**为横坐标,**因变量的观测值**为纵坐标作散点图; 若图中的散点基本呈线性关系,则认为模型是满足线性假设的; ## 误差项同方差——位置尺度图 以**因变量的拟合值**为横坐标,**标准化残差的平方根**为纵坐标作散点图; 若模型满足误差项同方差的假设,则散点应随机分布在水平线周围,如下图: ![](http://cookdata.cn/media/bbs/images/1_1609830412683_5d14.jpg =500x*) PS:以因变量的拟合值为横坐标,残差为纵坐标作的残差图同样也可以诊断误差同方差性,如果残差大致均匀地分散在准线0的周围,没有明确的模式,则认为满足同方差性. ## 误差项相互独立——残差图 以**因变量的拟合值**为横坐标,**残差**为纵坐标作散点图; 若模型满足误差项相互独立的假设,则散点应呈随机分布,如下图: ![](http://cookdata.cn/media/bbs/images/2_1609835222416_5d14.jpg =500x*) ## 误差项正态分布——残差Q-Q图 以**理论分位点**为横坐标,**残差的次序统计量**为纵坐标作散点图; 若模型满足误差项正态分布的假设,则散点应落在45°直线附近,如下图: ![](http://cookdata.cn/media/bbs/images/3_1609835708276_5d14.jpg =500x*) PS:残差QQ图也即画出残差的正态概率图,正态概率图是一种检验数据是否服从正态分布的图形. 以上就是几种进行线性回归模型诊断的常用可视化方法啦~