1.数据标准化主要功能是消除变量间的量纲关系,从而使数据具有可比性。
一般标准化采用是Z标准化,即均值为0,方差为1,其他标准化可根据研究目的进行选择;
2.数据标准化是企业或组织对数据的定义、组织、监督和保护进行标准化的过程。
数据标准化分为开发、候选、批准、驳回、归档等过程;
3.数据标准化方法有多种,可分为直线型方法、折线型方法、曲线型方法。
优点:
1.回归分析法在分析多因素模型时,更加简单和方便。
2.运用回归模型,只要采用的模型和数据相同,通过标准的统计方法可以计算出唯一的结果,但在图和表的形式中,数据之间关系的解释往往因人而异,不同分析者画出的拟合曲线很可能也是不一样的。
3.回归分析可以准确地计量各个因素之间的相关程度与回归拟合程度的高低,提高预测方程式的效果;在回归分析法时,由于实际一个变量仅受单个因素的影响的情况极少,要注意模式的适合范围,所以一元回归分析法适用确实存在一个对因变量影响作用明显高于其他因素的变量是使用。
多元回归分析法比较适用于实际经济问题,受多因素综合影响时使用。
缺点:有时在回归分析中,选用何种因子和该因子采用何种表达式只是一种推测,这影响了用电因子的多样性和某些因子的不可测性,使得回归分析在某些情况下受到限制。
判别分析是多元统计分析中用于判别样本所属类型的一种统计分析方法。
多元判别分析是指事物的分类是清楚的,目的是通过已知分类建立判别函数,预测新的观察对象所属类别。
判别分析和聚类分析都是分类,但判别分析是在已知对象有若干类型和一批已知样品的观测数据后的基础上根据某些准则建立判别式.,而做聚类分析时类型并不知道。
可以先聚类以得知类型,再进行判别。
因子分析的基本思想是根据相关性大小把原始变量分组,使得同组内的变量之间相关性不高,而不同组的变量间的相关性较低。
每组变量代表一个基因结构,并用一个不可观测的综合变量表示,这个基本结构就是公共因子。
主成分分析是利用降维的思想,在损失很少信息的前提下把多个指标转化为几个综合指标的多元统计方法。