计量经济学学习与Stata应用笔记(一)概率统计回顾

2023-10-26 06:42:58

记录一下个人计量经济学学习的笔记。

第二章概率统计

这一章主要是复习本科概率论与应用统计的部分知识。

概率与条件概率

条件概率

$P(A|B)=\frac {P(A\cap B)}{P(B)}$

全概率公式

$P(A)=\sum_{i=1}^n P(B_i)P(A|B_i)$

分布与条件分布

分布

$F(x)=\int_{-\infty}^x f(t)\,{\rm d}t$

多维随机向量的概率分布

$f_x(x)=\int_{-\infty}^{\infty} f(x,y)\,{\rm d}y$
$F(x,y)=\int_{-\infty}^{x} \int_{-\infty}^{y} f(t,s)\, {\rm d}t{\rm d}s$

随机变量的数字特征

期望（expectation)

$E(x)=\mu =\int_{-\infty}^{\infty} xf(x)\,{\rm d}x$

方差 (variance)

$Var(X)=\sigma^2 =E[X-E(X)^2]=E(X^2)-[E(X)]^2$

协方差（covariance）

$Cov(X,Y)=E[(X-E(X))(Y-E(Y))]=E(XY)-E(X)E(Y)=\sigma_{XY}$
$C o v (X, Y) > 0$ 则 $X$ 与 $Y$ 正相关，反之则负相关。

矩（moment）

主要考虑原点矩与中心矩。一阶原点矩为 $E (X)$ 即期望，二阶中心矩为 $E[X-E(X)]^2$ 即方差。

偏度（skewness）

偏度为标准化后的三阶中心矩 $E[(X-\mu /\sigma)]^3$ ，其反映了密度函数的不对称性。对称分布的随机变量偏度为0（如正态分布）。

峰度（kurtosis）

峰度为标准化后的四阶中心矩 $E[(X-\mu /\sigma)]^4$ ，其反映了密度函数的最高处的“尖”与尾部的“厚”。
正态分布的峰度为3。若随机变量X的峰度大于3，则其最高处比正态分布更尖，尾部比正态分布更厚。
定义超额峰度为 $E[(X-\mu /\sigma)]^4-3$ ，可用于检验某个分布是否是正态分布。

条件期望与条件方差

条件期望就是条件分布 $Y ∣ x$ 的期望。
$E(Y|X=x)=E(Y|x)=\int_{-\infty}^\infty yf(y|x)\, {\rm d}y$
同理，条件方差就是条件分布 $Y ∣ x$ 的方差。
$Var(Y|X=x)=Var(Y|x)=\int_{-\infty}^\infty [y-E(Y|x)]^2f(y|x)\, {\rm d}y$
在以上两式中，要注意由于 $y$ 已经在积分中被积掉，条件期望与条件方差只是 $x$ 的函数。

正定与半正定

对于 $n\times n$ 对称矩阵 $\pmb A$ ，如果对任意 $n$ 维非零列向量 $\pmb c$ ，都有二次型 $\pmb c^T\pmb {Ac}\ge0$ ，则 $\pmb A$ 为半正定矩阵。
对于 $n\times n$ 对称矩阵 $\pmb A$ ，如果对任意 $n$ 维非零列向量 $\pmb c$ ，都有二次型 $\pmb c^T\pmb {Ac}\ge0$ ，则 $\pmb A$ 为正定矩阵。
半负定与负定的定义类似。

协方差矩阵

设 $\pmb X=(X_1,X_2\ldots X_n )^T$ 为 $n$ 维随机向量，则定义其协方差矩阵为
$Cov(\pmb X)=Var(\pmb X)=E[(\pmb X-E(\pmb X))(\pmb X-E(\pmb X))^T]\\ =\begin{bmatrix} \sigma_{11}&\cdots&\sigma_{1n}\\ \vdots& &\vdots\\ \sigma_{n1}&\cdots&\sigma_{nn} \end{bmatrix}$
协方差矩阵为对称半正定矩阵，其中主对角线元素 $\sigma_{ii}=Var(X_i)$ 。可以证明：

$E(\pmb {AX})=\pmb AE(\pmb X)$
$Var(\pmb X)=E(\pmb X \pmb X^T)-E(\pmb X)[E(\pmb X)^T]$
$Var(\pmb{AX})=\pmb AVar(\pmb X)\pmb A^T$

迭代期望定律

$E(Y)=E_X[E(Y|x)]$
无条件期望 $E (Y)$ 等于给定 $X = x$ 情况下 $Y$ 的条件期望 $E (Y ∣ x)$ 再对 $x$ 求期望。
进一步地，对于任意函数 $g$
$E[g(Y)]=E_XE[g(Y)|x]$
当期望算子 $E_X$ 下标被省去时要注意求期望的对象。

随机变量无关的三个层次概念

注意三个概念的关系，不能反推。
相互独立 $\Rightarrow$ 均值独立 $\Rightarrow$ 线性不相关

相互独立： $f(x,y)=f_x(x)f_y(y)$
均值独立： $E (Y ∣ x) = E (Y)$ ，条件期望 $E (Y ∣ x)$ 不依赖于 $X$ 的值，注意这种关系不是对称的关系。
线性不相关： $C o v (X, Y) = 0$

常用连续型统计分布

正态分布
卡方分布: $Z$ ~ $N (0, 1)$ ，则 $Z^2$ ~ $\chi^2(1)$ 。卡方自由度取决于正态分布平方和的数目。
$t$ 分布: $Z$ ~ $N (0, 1)$ ， $Y$ ~ $\chi^2(k)$ ，且 $Z$ 与 $Y$ 相互独立，则 $\frac Z{\sqrt{Y/k}}$ ~ $t (k)$ 。
$F$ 分布： $Y_1$ ~ $\chi^2(k_1)$ ， $Y_2$ ~ $\chi^2(k_2)$ ，且 $Y_1$ 与 $Y_2$ 相互独立，则 $\frac {Y_1/k_1}{Y_2/k_2}$ ~ $F(k_1,k_2)$ 。

习题

2.2 证明：
$\begin{aligned}Cov(X,Y+Z)=&E[X(Y+Z)]-E(X)E(Y+Z)\\ =&E(XY)+E(XZ)-E(X)E(Y)-E(X)E(Z)\\ =&Cov(X,Y)+Cov(X,Z)\end{aligned}$
2.3 证明：
$\begin{aligned}E(Y|x)=&\int_{-\infty}^{\infty}\frac{yf(x,y)}{f(x)}\,{\rm d}y\\ =&\int_{-\infty}^{\infty}\frac{yf(x)f(y)}{f(x)}\,{\rm d}y\\ =&\int_{-\infty}^{\infty}yf(y)\,{\rm d}y\\ =& E(Y)\end{aligned}$
2.4 考虑到 $X=\frac Z{\sqrt{Y/k}}$ ~ $t (k)$ ， $X^2=\frac {Z^2}{Y/k}$ ~ $t (k)$ , $Z^2$ ~ $\chi^2(1)$ , $Y$ ~ $\chi^2(k)$ ，根据 $F$ 分布的定义有 $X^2$ ~ $F (1, k)$ 。

本文来自互联网用户投稿，文章观点仅代表作者本人，不代表本站立场，不承担相关法律责任。如若转载，请注明出处。 如若内容造成侵权/违法违规/事实不符，请点击【内容举报】进行投诉反馈！

标签：技术

Duilib中list控件支持ctrl和shif多行选中的实现

[ICML2015]Batch Normalization:Accelerating Deep Network Training by Reducing Internal Covariate Shif

win10系统微软输入法于eclipse ctrl+shif+f冲突间接处理办法

Codeforces Round #259 (Div. 2) B. Little Pony and Sort by Shif

读LDD3，内存映射与DMA--PAGE_SHIF…

VMware虚拟机安装XP【要先分区，再设置BOOT 启动CD，shif+上移】

更换iBus五笔的左与右Shif

sublime ctrl+shif+f 没用解决办法

idea 对 ctrl + z 的撤销是 ctrl + shif + z

计算机最早的设计师应用于,计算机应用基础选择题doc.doc

win10自带截图神器：Win+Shift+S

Python基础之文件目录操作

python简述目录_Python基础之文件目录操作(示例代码)

tp5 如何做数据采集

任务2-7(服务器字体+阿里巴巴矢量库)

html标签（1)：h1~h6,p,br,pre,hr

TI 电量计介绍与芯片选型指南

几款TI电源芯片简介

TI DSP芯片C2000系列读取FLASH数据

德州仪器(Ti)平台嵌入式开发基础

TI三相电机智能栅极驱动芯片特点分类

省选模拟（12.08） T3 圈圈圈圈圈圈圈圈

Hadoop生态圈技术栈（上）

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之6.Impala交互式查询

小猿圈之Linux下Mysql 操作命令

大数据Hadoop生态圈常用面试题

大数据开发基础入门与项目实战（三）Hadoop核心及生态圈技术栈之4.Hive DDL、DQL和数据操作

备战Noip2018模拟赛11（B组）T3 Monogatari 物语

【智能优化算法-圆圈搜索算法】基于圆圈搜索算法Circle Search Algorithm求解单目标优化问题附matlab代码

NYOJ 78 圈水池

递归问题跑道汽车绕圈问题 Python实现

Hadoop生态圈（三）：MapReduce