两变量作直线回归分析时,要求应变量Y服从正态分布,通常自变量X为可以精确测量或严格控制的因素。
作回归分析时要有实际意义,不能把毫无关联的两事物或现象进行回归分析。
在进行回归分析前,应绘制散点图,若各散点分布呈直线趋势时,才适宜用直线回归分析。
注意有无异常点,即残差绝对值特别大的观察点,若是错误所致,应予以修正或去除。
回归方程适用范围一般以自变量X实际取值范围为限,不能任意外推。
因为超出自变量X取值范围时,两变量间就不一定呈原有的直线关系。
直线相关与回归的区别:
1.直线回归用于说明两变量间数量依存变化的关系,描述根如何依赖于自变量而变化;
2.直线相关用于说明两变量间的直线相关关系,此时两变量的关系是平等的;
3.直线回归要求应变量根是来自正态总体的随机变量,而自变量可以是来自正态总体的随机变量,也可以是严密控制、精确测量的变量;
4.相关分析则要求是来自双变量正态分布总体的随机变量。
直线相关与回归的联系:
1.对同一样本,若同时计算,其正负号是一致的;
2.对同一样本,假设检验是等价的,二者的值相等;
3.用回归解释相关,它反映在应变量的总变异中能用根的回归关系解释的比例。
目的:
1.直线相关分析要求两个变量都是正态分布,回归分析要求因变量Y服从正态分布,而自变量X是能精确测量和严格控制的变量。
2.直线相关分析反映两变量间的伴随关系,这种关系是相互的,对等的,不一定有因果关系。
回归则分析反映两变量间的依存关系,一般将“因”或较易测定,变异较小者定为自变量,这种依存关系可能是因果关系或从属关系。
3.直线相关分析的目的是把两变量间直线关系的密切程度及方向用一统计指标表示出来。
回归分析的目的则是把自变量与应变量间的关系用函数公式定量表达出来,回归分析不仅可以揭示X对Y的影响大小,还可以由回归方程进行数量上的预测和控制。
4.在回归分析中,因变量Y处在被解释的特殊地位,在直线相关分析中,X与Y处于平等的地位。
在直线相关分析中,X与Y都是随机变量。
在回归分析中,Y是随机变量,X可以是随机变量,也可以是非随机的,通常在回归模型中,总是假定X是非随机的。