R语言异方差回归模型建模:用误差方差解释异方差
在社会科学中将OLS估计应用于回归模型时,其中的一个假设是同方差,我更喜欢常误差方差。这意味着误差方差没有系统的模式,这意味着该模型在所有预测级别上都同样差。
异方差性是同方差性的补充,不会使OLS产生偏差。如果您不像社会科学中的大多数人那样关心p值,那么异方差性可能不是问题。
计量经济学家已经开发出各种各样的异方差一致性标准误差,因此他们可以继续应用OLS,同时调整非恒定误差方差。这些更正的Wikipedia页面列出了这些替代标准错误所使用的许多名称。
我们提供了似然函数,并且两个函数都将找到使似然最大化的参数估计。
让我们来看一个简单的例子:
首先,我从均值3和标准差1.5的正态分布中提取500个观测值,并将其保存到数据集中:
dat <- data.frame(y = rnorm(n = 500, mean = 3, sd = 1.5))
样本的平均值和标准偏差为:
mean(dat$y)
[1] 2.999048sd(dat$y)
[1] 1.462059
我也可以这样问这个问题,正态分布,均值和标准差的哪些参数可以最大程度地提高观察到的变量的可能性?
m.sd <- mle2(y ~ dnorm(mean = a, sd = exp(b)), data = dat,start = list(a = rnorm(1), b = rnorm(1)))
在上面的语法中,R变量y的平均值是一个常数a,而y的标准偏差是一个常数b。标准差取幂,确保它永远不会为负数。我们提供初始值,因此它可以在收敛到使可能性最大化的值之前开始估算。随机数足以满足初始值。
m.sdCall:
mle2(minuslogl = y ~ dnorm(mean = a, sd = exp(b)), start = list(a = rnorm(1),b = rnorm(1)), data = dat)Coefficients:a b
2.9990478 0.3788449Log-likelihood: -898.89
系数a非常类似于数据的平均值。必须对系数b取幂,以获得标准偏差:
exp(coef(m.sd)[2])b
1.460596
这类似于我们上面获得的标准偏差。上面的语法演示的另
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
