随机误差项包括因素:未知的影响因素,残缺数据,数据观察误差,模型设定误差及变量内在随机性。
随机误差,又称为偶然误差。
由于测试过程中诸多因素随机作用而形成的具有抵偿性的误差。
它是不可避免的,可以设法将其减少,但又不能完全消除。
随机误差具有统计性,在多次重复测量中,绝对值相同的正、负误差出现的机会大致相同,大误差出现的机会比小误差出现的机会少。
由于随机误差中正、负误差相互抵偿的特性,多次测量平均值的随机误差要比单次测量值的随机误差小,多次测量的随机误差的平均值趋向于零,因此不影响测量的准确度。
随机误差使测量值产生波动,影响测量结果的精密度。
随机误差项一般包括的因素是:
1.未知的影响因素;
2.残缺数据;
3.数据观察误差;
4.模型设定误差及变量内在随机性。
随机误差项反映除自变量外其他各种微小因素对因变量的影响。
在回归方程中,它是数据观察值Yi与未知的总体回归线之间的纵向距离,是不可直接观测的;残差在回归方程中,是数据观察值Yi与按照回归方程计算的Yi的差额,它是数据观察值Yi与样本回归线之间的纵向距离,当根据样本观测值拟合出样本回归线之后,可以计算残差的具体数值。
利用残差可以对随机误差项的方差进行估计。
随机过程: 一般来说,把一组随机变量定义为随机过程。
在研究随机过程时人们透过表面的偶然性描述出必然的内在规律并以概率的形式来描述这些规律,从偶然中悟出必然正是这一学科的魅力所在。
随机变量:简单的随机现象,如某班一天学生出勤人数,是静态的。
随机过程(stochastic process):随机现象的动态变化过程。
动态的。
如某一时期各个时刻的状态。
所谓过程就是事物的发展变化过程,尽管过程的形式各异,但归纳起来不外乎两种:一种是确定性的,一种是随机性的。
时间序列: 简单地说,所谓时间序列(TimeSeries),在统计意义上就是将某一个指标在不同时间上的不同数值,按照时间的先后顺序排列而成的数列。
时间序列只强调数列中数据之间的“顺序”的重要性,并非强调必须以“时间”顺序排列。
若时间序列是非平稳的,则可先对序列进行差分运算,然后再建立ARMA,即求和自回归移动平均模型(ARIMA)。