首页
博客
理论工具
数据分析
spss分析
amos分析
python数据分析
结构方程模型
回归与中介
论文写作
未分类
数据服务
关于我们
0
个人中心
我的订单
退出
登录
登录
注册
Get Started
回归分析结果看什么
## 回归系数(Coefficients): 回归系数表示自变量对因变量的影响大小。正系数表示自变量与因变量正相关,负系数表示负相关。回归系数的绝对值越大,表示自变量对因变量的影响越大。同时,回归系数还可以用来进行比较,比如判断哪个自变量对因变量的影响更显著。 ## 显著性水平(Significance Level): 回归分析通常会给出每个回归系数的显著性水平,通常以p值(p-value)表示。p值反映了在零假设下,观察到的回归系数等于零的概率。如果p值小于通常选择的显著性水平(如0.05),则可以拒绝零假设,即认为回归系数是显著的。 ## R方(R-squared): R方是一个衡量回归模型拟合程度的指标,它可以解释因变量的变异程度的比例。R方的取值范围在0到1之间,越接近1表示模型对数据的拟合程度越好。然而,要注意R方并不一定代表模型的准确性或预测能力,因为它只考虑了模型对因变量的解释程度。 ## 残差(Residuals): 残差是预测值与实际观测值之间的差异。通过检查残差的分布是否符合正态分布、是否存在异方差等,可以评估回归模型的合理性。如果残差分布不符合正态分布,或者存在明显的异方差,可能需要进一步探索模型的改进。 ## 置信区间(Confidence Interval): 回归分析还会给出回归系数的置信区间。置信区间表示对回归系数的估计范围,通常以95%置信度进行报告。如果置信区间包含零,表示回归系数不显著;如果置信区间不包含零,表示回归系数是显著的。 --- # 怎么看回归分析结果 一、总体显著性检验 二、回归系数显著性检验 三、其他指标解读 1、VIF值 2、R方与调整后R方 3、D-W值 4、残差 四、回归分析模型 1、模型公式 2、影响大小比较 3、coefPlot 回归分析输出的结果通常从以下4个方面进行分析:  **一、总体显著性检验** ------------- 使用多元线性回归分析过程中,**显著性检验包括两部分内容:对多个自变量与[因变量]这个整体的显著性检验(F检验),以及每个自变量对因变量影响的显著性检验(t检验)**,二者都是对线性回归的显著性检验,但是检验目的不同。 首先进行总体显著性检验,是使用F检验进行的,可以判断[多元线性回归方程]是否成立。 SPSSAU 多元线性回归分析 F检验输出结果如下:  从上表可以看出,统计量F=4009.94,对应的p值小于0.05,所以多元线性回归通过总体显著性检验,回归模型是有意义的,说明至少有1个X会对因变量Y产生影响。 > F检验的值大小范围是(0,+∞),即F值可以取任何正数,没有上限 接下来查看每个自变量对因变量影响的显著性,即回归系数显著性检验。 **二、回归系数显著性检验** --------------- 回归系数显著性检验是**指每个自变量对因变量影响的显著性检验,使用[t检验]进行**。[SPSSAU]输出每个自变量对因变量影响的t检验结果如下:  从上表可以看出,初始工资、教育程度与工作经验三个自变量对应t检验的p值均小于0.05,呈现出显著性特征。说明三个自变量X对因变量Y(工资)均呈现出显著性。 多元线性回归分析同时会输出一些其他的指标,接下来将逐个进行说明。 **三、其他指标解读** ------------ ### **1、[VIF值]** VIF值用于**共线性判断**,共线性是**指在线性回归分析时,出现的自变量之间彼此相关的现象。**共线性出现的原因可能是由于多个自变量之间本身就存在很强的相关关系;或者由于收集的样本量不足;再或者由于在回归分析时错误的使用[虚拟变量]等都可能导致共线性问题的出现。 使用[SPSSAU]进行多元线性回归时,分析结果会自动输出**VIF值以及容忍度值**,用来判断是否存在共线性。容忍度值=1/VIF值,**一般情况下VIF值小于10(严格是小于5)则说明没有共线性问题,对应[容忍度值]的标题是大于0.1(严格是大于0.2)则说明没有共线性问题。** SPSSAU输出结果如下:  从上表可以看出,VIF值均小于10,说明不存在共线性问题。但有些文献要求VIF值小于5才认为不存在共线性问题,严格来看,工作经验的VIF=6.76>5,说明可能存在一定的共线性问题。如果认为数据存在共线性,可以手动移除相关性非常高的变量,或者改用逐步回归、[岭回归]等方法进行分析。此处认为共线性可以忽略,故不再进行赘述。 ### **2、[R方]与调整后R方** R方用于分析模型的拟合优度,又称[决定系数]。R方的值介于0~1之间,代表模型的拟合程度,一般认为越大越好。例如R方为0.5,说明自变量可以解释因变量50%的变化原因。**但是实际研究中并不会过多关注R方的大小,因为进行回归分析更多的主要关注自变量对因变量是否具有影响关系**。调整后R方并没有实际意义,通常在进行模型调整(增加或者减少变量个数时)使用,用于判断你的模型中该不该加入你想加入的变量。 [SPSSAU]输出结果如下图:  从上表可以看出,R方=0.973,说明自变量可以解释因变量97.3%的变化原因,模型拟合较好。当进行模型调整时,可以关注调整后R方的变化。 ### 3、[D-W值] 模型的随机干扰项相互独立或不相关,是[多元线性回归模型]的基本假设之一。随机干扰项是数据本身的不确定性带来的误差。如果模型的随机干扰项违背了相互独立的基本假设,称为存在自相关性。**自相关性**可以使用D-W检验进行分析。 D-W检验([杜宾-瓦特森检验]),计量经济,统计分析中常用的一种检验序列一阶自相关最常用的方法。[SPSSAU]在进行线性回归分析时,输出D-W值如下:  一般认为,如果**D-W值在2附近(1.7~2.3之间),说明不存在自相关性**,模型构建比较好,反之如果D-W值明显偏离2,说明模型具有[自相关性],模型构建较差。 从上表得到,本次分析的D-W值=0.438,明显偏离2,说明模型存在自相关性,模型构建较差。但是由于一般对于[时间序列分析]才会考虑[DW值],本次分析数据并非时间序列,所以暂且忽略自相关性。如果在分析时需要自相关问题修正,可以使用[广义差分法],在此不再进行深入分析。 ### 4、残差 在进行分析时,如果有需要,可以选择勾选【保存预测和残差值】选项,[SPSSAU]会输出残差值和预测值。 针对残差值,一般会检验残差值的[正态性]。如果残差直观上满足正态性,说明模型构建较好,反之说明模型构建较差。SPSSAU利用残差绘制[直方图],得到结果如下:  从直方图可以看出,数据呈现出的分布并不对称,但是从形状来看,直方图近似呈现“中间高,两头低”的钟形分布形状,说明数据为可接受的[正态分布]。即说明残差符合正态分布,模型构建较好。如果[残差正态性]非常糟糕,建议重新构建模型,比如对因变量Y取对数后再次构建模型等。 以上指标分析完成后,最后进行归回分析结果解读,判断哪些自变量对因变量有显著影响,影响方向、影响大小是怎样的;构建回归分析模型。 **四、回归分析模型** ------------ [SPSSAU]输出回归分析结果如下:  ### **1、模型公式** 从上表可以看出,以初始工资、教育程度、工作经验为自变量,工资为因变量进行多元线性回归分析,得到回归模型公式为:工资=18326.101 + 0.353\*初始工资-280.300\*教育程度 + 144.955\*工作经验。 特别提示:**构建回归模型使用非标准化回归系数,它是方程中不同自变量对应的原始回归系数,反映了在其他自变量不变的情况下,该自变量每变化一个单位对因变量作用的大小**。通过非标准化回归系数构建的回归方程,才可以对因变量进行预测。 ### **2、影响大小比较** 自变量对因变量影响大小的比较是通过标准化回归系数进行比较的。标准化回归系数的绝对值越大,说明该自变量对因变量的影响越大。标准化回归系数,是对[自变量和因变量]同时进行标准化处理后所得到的回归系数,数据经过标准化处理后消除了量纲、数量级等差异的影响,是的不同变量之间具有可比性,因此**使用标准化回归系数比较不同自变量对因变量的影响大小。** 从线性回归结果可以看出,初始工资、教育程度、工作经验的标准化回归系数分别是:0.168、-0.046、0.881;所以工作经验对工资的影响最大,其次是初始工资,影响最小的是教育程度,且初始工资与工作经验对工资的影响是显著正向的,而教育程度对工资的影响是显著负向的。 ### **3、coefPlot** [SPSSAU]会输出coefPlot图,用于展示具体的回归系数值和对应的[置信区间],可直观查看数据的显著性情况,如果说置信区间包括数字0则说明该项不显著,如果置信区间不包括数字0则说明该项呈现出显著性。  [具体数值]还可通过[SPSSAU]输出的回归系数中间过程值表格查看,见下图:  从上表可以看出,3个自变量回归系数对应的置信区间均不包括0,说明3个自变量对因变量的影响均呈现出显著性。 综上所述,探究工资的影响关系,经过基本关系分析后,得到与因变量有相关关系的自变量后进行多元线性回归分析,发现初始工资、教育程度、工作经验对工资有显著影响,其中工作经验对工资的影响最大,多元线性回归分析结束。 <!-- https://www.zhihu.com/question/531302693/answer/3247026255 -->
2024-08-01 16:01 by admin
82
0
热门文章
1
clashX 设置白名单,忽略本地hosts测试域名的代理设置。
2
验证性因子分析步骤以及应达到的标准
3
Spss详细图文教程——问卷信度和效度检验步骤图解
4
信度效度分析的注意事项
5
MATLAB时代的七种开源替代方案