作业帮 > 数学 > 作业

进行回归分析时,是先把数据标准化再取对数还是取对数后再标准化?

来源:学生作业帮 编辑:搜搜考试网作业帮 分类:数学作业 时间:2024/07/12 13:25:06
进行回归分析时,是先把数据标准化再取对数还是取对数后再标准化?
进行回归分析时,是先把数据标准化再取对数还是取对数后再标准化?
就回归分析而言,标准化不是必要的,因为标准化是数据的线性变换,不影响估计的显著性.
计量模型一般不进行标准化,保持变量的原汁原味,方便估计结果的解释.多元统计里经常要标准化,如主成份分析,因子分析等.
对数变换的主要目的:(1)估计的系数可以解释成弹性,一般用在经济学模型里;(2)可以降低样本异方差程度;(3)减少变量的波动,与其他变量的波动水平相适应.
对数变换要求原始变量为正,如果先标准化可能会出现负值,对数变换就不行了.只能对正取值的变量先取对数,再标准化.
再问: 也就是说在回归分析时,可以对已经取过对数的数据再进行标准化?而不是取过对数就不能再标准化了?
再答: 标准化或者不标准化都可以。 一般计量经济模型不做标准化,只关心是否显著。 有时我们想比较哪个因素更重要,由于原始变量的单位不同(或者根本无法比较,例如重量和体积),就先作标准化,回归估计的系数称为标准化系数,标准化系数的大小能够反映变量的重要性。
再问: 只取对数不标准化的话,回归结果中最大条件指数是42点多,超过了30,不是说最大条件指数超过30的话可能存在共线性吗?如果数据取对数并标准化后再回归的话,最大条件指数才1点多。这两种情况下容忍度和方程膨胀因子都满足不存在多重共线的要求。请问这种情况下应该怎么办?
再答: 变量标准化不能改善回归模型的任何性能,包括R2、显著性、多重共线性,因为它只是原始指标的线性变换。我不明白最大条件指数是什么统计量,多重共线性的诊断参考膨胀因子。如果有解释变量的膨胀因子超过10就说明存在共线性,然后按照处理共线性的方法做。标准化无法消除共线性。
再问: 嗯,我明白了。现在回归还遇到一个问题就是,方程的其它检验全都通过,但是模型拟合度特别低,R^2才0.05,请问这种情况该怎么解决?
再答: R2低说明现有的解释变量不是很给力。如果找不到更好的变量就只能这样了。 看看系数的符号是不是和预期一致,t统计量是不是显著,这些如果还可以,也能接受。