首页
博客
理论工具
数据分析
spss分析
amos分析
python数据分析
结构方程模型
回归与中介
论文写作
未分类
数据服务
关于我们
0
个人中心
我的订单
退出
登录
登录
注册
Get Started
多重线性回归假设条件-残差正态性
**1.什么是残差?** **残差即因变量的观测值Yi与利用回归模型求出的预测值^ Y之间的差值**,反映了利用回归模型进行预测引起的误差。 **2.怎么测量残差是否符合正态性?** **例子**:分析住院费用与医院级别、地区、患者年龄、住院天数等的关系。 **数据展示**:  通过P-P图可以检验数据是否符合指定的分布。当数据符合指定分布时,P-P图中各点近似呈一条直线。 **Step1:**因为多重线性回归要求因变量符合正态分布,因此先利用直方图检验因变量“住院总费用”是否服从正态分布,结果如下:  **结果:**住院总费用不服从正态分布,需进行数据转换,可使用对数转换。在【转换】→【计算变量】中对“住院总费用”进行对数转换,新变量命名为“stan”。再重新绘制直方图,如下:  **结果:**经过转换后,因变量符合正态分布。 **方法一 标准化残差直方图&正态概率图(PP图)** **Step1:【**分析】→【回归】→【线性】   **Step2:**将“stan”移入“因变量”中,地区等变量移入“自变量”中。【绘图】→勾选“直方图”和“正态概率图”→“继续”。  **Step3:【**保存】  **Step4**:结果输出与解读  **结果:**标准化残差的直方图,符合正态分布。  **结果:**标准化残差的正态概率图(P-P图),近似一条直线,符合正态分布。 **方法二 学生化残差绘制正态QQ图** **Step1:【**分析】→【描述统计】→【Q-Q图】  **Step2**:将学生化残差SRE\_1选入“变量”(注:SRE\_1在上面的步骤中通过“保存”选项卡计算出来。)  **Step3**:结果输出与解读  **结果:**所有点近似一条直线,学生化残差符合正态性。  **结果:**所有点基本均匀分布于两侧,呈正态性。 **3.P-P和Q-Q图** P-P图是根据**变量的累积比例**与指定分布的累积比例之间的关系所绘制的图形。通过P-P图可以检验数据是否符合指定的分布。当数据符合指定分布时,P-P图中各点近似呈一条直线。 Q-Q图由**标准正态分布的分位数为横坐标、样本值为纵坐标**的散点图。利用QQ图可鉴别样本数据是否近似于正态分布,若QQ图上的点近似地在一条直线附近,则样本数据符合正态分布。而且该直线的斜率为标准差,截距为均值。 **P-P图和Q-Q图的用途基本相同,只是检验方法存在差异。** **4.小结** P-P图和Q-Q图可定性判断数据是否符合指定分布,例如正态分布等。值得注意的是,若利用P-P图和Q-Q图判断残差是否符合正态分布,因为原始数据一般没有直接提供残差,所以需先计算出残差,再绘制P-P图和Q-Q图。
2024-08-11 17:57 by admin
25
0
注:本文转载自https://zhuanlan.zhihu.com/p/142628689,如有侵权行为,请联系我们,我们会及时删除。
热门文章
1
clashX 设置白名单,忽略本地hosts测试域名的代理设置。
2
验证性因子分析步骤以及应达到的标准
3
Spss详细图文教程——问卷信度和效度检验步骤图解
4
信度效度分析的注意事项
5
MATLAB时代的七种开源替代方案