贝叶斯java_贝叶斯与OLS

2023-10-26 04:06:04

“更好”始终是一个意见问题，它在很大程度上取决于背景 .

Advantages to a frequentist OLS approach ：更广泛，更快速，更容易被更广泛的受众访问(因此更难以解释) . 我的一位聪明的教授常说"You don't need to build an atom smasher when a flyswatter will do the trick."

Advantages to an equivalent Bayesian approach ：进一步模型开发更灵活，可以直接模拟派生/计算数量的后验(还有更多，但这些是我通过给定分析去贝叶斯的动机) . 注意“等价”这个词 - 你可以在贝叶斯框架中做一些你不能在频率论方法中做的事情 .

嘿，这是R的探索，首先模拟数据，然后使用典型的OLS方法 .

epsilon

summary(lm(y ~ x))

## Call:

## lm(formula = y ~ x)

## Residuals:

## Min 1Q Median 3Q Max

## -2.9053 -0.6723 0.0116 0.6937 3.7880

## Coefficients:

## Estimate Std. Error t value Pr(>|t|)

## (Intercept) 0.0573955 0.0641910 0.894 0.371

## x 0.9999997 0.0001111 9000.996 <2e-16 ***

## ---

## Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

## Residual standard error: 1.014 on 998 degrees of freedom

## Multiple R-squared: 1, Adjusted R-squared: 1

## F-statistic: 8.102e+07 on 1 and 998 DF, p-value: < 2.2e-16

...这里是一个等价的贝叶斯回归，在回归参数和所有1000个数据点上使用非信息先验 .

library(R2jags)

cat('model {

for (i in 1:N){

y[i] ~ dnorm(y.hat[i], tau)

y.hat[i]

}

a ~ dnorm(0, .0001)

b ~ dnorm(0, .0001)

tau

sigma ~ dunif(0, 100)

}', file="test.jags")

test.data

test.jags.out

parameters.to.save=c("a","b","tau","sigma"), n.chains=3, n.iter=10000)

test.jags.out$BUGSoutput$mean$a

## [1] 0.05842661

test.jags.out$BUGSoutput$sd$a

## [1] 0.06606705

test.jags.out$BUGSoutput$mean$b

## [1] 0.9999976

test.jags.out$BUGSoutput$sd$b

## [1] 0.0001122533

请注意，参数估计值和标准误差/标准偏差基本相同！

现在这是另一个贝叶斯回归，使用前500个数据点来估计先验，然后使用前500个来估计后验 .

test.data

test.jags.out

parameters.to.save=c("a","b","tau","sigma"), n.chains=3, n.iter=10000)

cat('model {

for (i in 1:N){

y[i] ~ dnorm(y.hat[i], tau)

y.hat[i]

}

a ~ dnorm(a_mn, a_prec)

b ~ dnorm(b_mn, b_prec)

a_prec

b_prec

tau

sigma ~ dunif(0, 100)

}', file="test.jags1")

test.data1

a_mn=test.jags.out$BUGSoutput$mean$a,a_sd=test.jags.out$BUGSoutput$sd$a,

b_mn=test.jags.out$BUGSoutput$mean$b,b_sd=test.jags.out$BUGSoutput$sd$b)

test.jags.out1

parameters.to.save=c("a","b","tau","sigma"), n.chains=3, n.iter=10000)

test.jags.out1$BUGSoutput$mean$a

## [1] 0.01491162

test.jags.out1$BUGSoutput$sd$a

## [1] 0.08513474

test.jags.out1$BUGSoutput$mean$b

## [1] 1.000054

test.jags.out1$BUGSoutput$sd$b

## [1] 0.0001201778

有趣的是，推论类似于OLS结果，但差不多 . 这让我怀疑用于训练先前的500个数据点在分析中没有像过去500那样多的重量，而之前的数据点实际上已经被淘汰了，尽管我不确定这一点 .

无论如何，我想不出有什么理由不使用所有1000个数据点(和非信息先验)，特别是因为我怀疑500 500使用前500和后500不同 .

也许，所有这一切的答案是： I trust the OLS and 1000-point Bayesian results more than the 500+500, and OLS is simpler.

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

上一篇 > javascript实现年、季度、月、时间段的查询条件切换
下一篇 > python如何运用ols_python – 使用Pandas数据框架运行OLS回归

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce

贝叶斯java_贝叶斯与OLS

相关文章