一、随机事件与概率

1.公式

  1. 条件概率:P(A|B)=P(AB)P(B)
  2. 乘法公式:P(AB)=P(A|B)P(B)=P(B|A)P(A)
  3. 全概率公式:P(A)=i=1nP(A|Bi)P(Bi)
  4. 贝叶斯公式:P(Bi|A)=P(A|Bi)P(Bi)i=1nP(A|Bi)P(Bi)
  5. 抽签问题:P(A)=mn

2.事件独立性

事件A,B,C相互独立 P(ABC)=P(A)P(B)P(C), P(AB)=P(A)P(B), P(AC)=P(A)P(C), P(BC)=P(B)P(C)

例题

A,B,C独立,ABC=, P(A)=P(B)=P(C)<12, P(ABC)=916,求P(A)

P(ABC) =P(A)+P(B)+P(C)P(AB)P(AC)P(BC)+P(ABC) =3P(A)3P(A)2+0=916 P(A)=14P(A)=34(舍)

3.超几何分布

  1. 概述:n+m件产品中有m件次品,从中抽取k件,求其中有i件次品的概率
  2. 分布律:P(X=i)=CmiCnkiCm+nk

二、随机变量及其分布+数字特征

1. X ~ B(n,p)

  1. 分布名称:二项分布
  2. 概述:n次独立重复试验中,事件A发生的次数X(伯努利试验)
  3. 分布律:P(X=k)=Cnkpk(1p)nk
  4. 期望:E(X)=np
  5. 方差:D(X)=np(1p)

2. X ~ P(λ)

  1. 分布名称:泊松分布
  2. 概述:多次试验中小概率事件A发生的次数X
  3. 分布律:P(X=k)=λkk!eλ
  4. 期望:E(X)=λ
  5. 方差:D(X)=λ
  6. 泊松定理:对于X ~ B(n,p),当n,p0,np=λ时,可近似认为X ~ P(λ)

3. X ~ g(p)

  1. 分布名称:几何分布
  2. 概述:多次试验中事件A第一次成功的次数X
  3. 分布律:P(X=k)=p(1p)k1
  4. 期望:E(X)=1p
  5. 方差:D(X)=1pp2
  6. 无记忆性:P(X>s+t|X>s)=P(X>t)

4. X ~ U(a,b)

  1. 分布名称:均匀分布
  2. 分布函数:F(x)={0,x<axaba,axb1,x>b
  3. 概率密度函数:f(x)={1ba,axb0,其他
  4. 期望:E(X)=a+b2
  5. 方差:D(X)=(ba)212

5. X ~ E(λ)

  1. 分布名称:指数分布
  2. 分布函数:F(x)={1eλx,x00,x<0
  3. 概率密度函数:f(x)={λeλx,x00,x<0
  4. 期望:E(X)=1λ
  5. 方差:D(X)=1λ2
  6. P(X>t)=eλt
  7. 无记忆性:P(X>s+t|X>s)=P(X>t)
  8. 与泊松分布的关系:服从E(λ)的事件,t时间内发生的次数X ~ P(λt)
  9. 事件下次发生的时间:X ~ E(λ)P(X>t)=eλt

6. X ~ N(μ,σ2)

  1. 分布名称:正态分布
  2. 分布函数:F(x)=12πσxe(tμ)22σ2dt
  3. 概率密度函数:f(x)=12πσe(xμ)22σ2
  4. 期望:E(X)=μ
  5. 方差:D(X)=σ2
  6. 对称轴:x=μ
  7. 拐点:x=μ±σ
  8. 分布函数最大值:f(x)max=f(μ)=12πσ
  9. σ:扁平 ; σ:尖锐
  10. μ↑↓:左右平移,形状不变

7. X ~ N(0,1)

  1. 分布名称:标准正态分布
  2. 分布函数:Φ(x)=12πxet22dt
  3. 概率密度函数:φ(x)=12πex22
  4. 期望:E(X)=0
  5. 方差:D(X)=1
  6. Φ(x)=1Φ(x)
  7. P(a<X<b)=Φ(b)Φ(a)
  8. P(|X|<a)=2Φ(a)1
  9. 3μ原则:P(|Xμ|<kσ),k=1,2,3分别对应0.683,0.954,0.997
  10. 正态分布标准化:X ~ N(μ,σ2)Z=Xμσ ~ N(0,1)

三、多维随机变量及其分布

1. 二维随机分布函数的充要条件(3)

  1. 右连续:F(x+0,y)=F(x,y)
  2. 规范性:P(+,+)=1,P(,)=0
  3. 容斥:P(x1xx2,y1yy2) =F(x2,y2)F(x1,y2)F(x2,y1)+F(x1,y1)

2. 边缘分布函数

  1. FX(x)=F(x,+)
  2. FY(y)=F(+,y)

3. 联合密度函数、边缘密度函数定义

  1. 联合密度函数:F(x,y)=xyf(x,y)dxdy
  2. 边缘密度函数:fX(x)=+f(x,y)dy,fY(y) =+f(x,y)dx

4. 二维正态分布

  1. (X,Y) ~ N(μ1,μ2,σ12,σ22,ρ)
  2. 二维正态分布的边缘分布仍是正态分布:X ~ N(μ1,σ12),Y ~ N(μ2,σ22)
  3. X,Y 独立 X,Y 无关 ρ=0

5. 可加性

  1. 前提:Xi 独立
  2. 泊松分布:Xi ~ P(λi) Xi ~ P(λi)
  3. 二项分布:Xi ~ B(ni,p) Xi ~ B(ni,p)
  4. 正态分布:Xi ~ N(μi,σi2) kiXi ~ N(kiμi,ki2σi2)

6. 最值分布函数

  1. Fmax(x)=P(X1x,X2x,,Xnx) =F(xi)
  2. Fmin(x)=P(X1x,X2x,,Xnx) =1(1F(xi))

例题:已知X=(X1,X2,,Xn)独立同分布,且服从于U(0,θ),求max(X)min(X)的密度函数fM(x)fN(x)

Xi ~ U(0,θ) F(x)={0,x<0xθ,0xθ1,x>θ

FM(x)=F(xi)=(F(x))n ={0,x<0(xθ)n,0xθ1,x>θ

fM(x)=dFM(x)dx={nxn1θn,0xθ0,Otherwise

FN(x)=1FM(x)={1,x<01(xθ)n,0xθ0,x>θ

fN(x)=dFN(x)dx={nxn1θn,0xθ0,Otherwise

专:随机变量函数的分布

1. 离散型随机变量

  1. 一维:P(X=xi)=piY=h(X) P(Y=yj)=h(xi)=yjpi
  2. 二维:P(X=xi,Y=yj)=pijZ=h(X,Y) P(Z=zk)=h(xi,yj)=zkpij

2. 连续型随机变量

一维例题:X ~ N(0,1) , Y=X2,求fY(y)

第1步:写X的取值范围,确认fY(y)的定义域,定义域外fY(y)=0

XR Y=X20

第2步:写出X的分布函数FX(x)

FX(x)=Φ(x)

第3步:求Y的分布函数FY(y)

y0 时, FY(y)=P(Yy)=P(X2y) =P(|X|y)=2Φ(y)1

FY(y)={0,y<02Φ(y)1,y0

第4步:对FY(y)求导,得fY(y)

fY(y)=dFY(y)dy={0,y<0y12φ(y),y0

二维例题:X ~ E(1) , Y ~ U(0,1) , X,Y独立 , Z=X+2Y,求fZ(z)

第1步:写X,Y的取值范围,确认fZ(z)的定义域,定义域外fZ(z)=0

X0 , Y[0,1] Z=X+2Y0

第2步:写出X,Y的密度函数fX(x)fY(y)

fX(x)={ex,x00,Otherwise

fY(y)={1,y[0,1]0,Otherwise

第3步:写出X,Y的联合密度函数fXY(x,y)

fXY(x,y)=fX(x)fY(y)={ex,x0,y[0,1]0,Otherwise

第4步:确定积分区域(作图)

第5步:求Z的分布函数FZ(z)

FZ(z)=P(Zz)=P(X+2Yz)=P(YzX2)

(1)FZ(z)={0zexdx0zx2dy,z[0,2]0z2exdx01dy+z2zexdx0zx2dy,z20,Otherwise(2)={12(ez+z1),z[0,2]112e2z+12ez,z20,Otherwise

第6步:对FZ(z)求导,得fZ(z)

fZ(z)=dFZ(z)dz={12ez+12,z[0,2]12e2z12ez,z20,Otherwise

四、随机变量的数字特征

1. 数学期望

离散型:E(X)=xipi

连续型:E(X)=+xf(x)dx

随机变量函数:E(Y)=E(h(X))

性质:

  1. E(C)=C
  2. E(CX)=CE(X)
  3. E(X±Y)=E(X)±E(Y)
  4. X,Y 独立 E(XY)=E(X)E(Y)

2. 方差

D(X)=E(XE(X))2=E(X2)[E(X)]2

标准差:D(X)

性质:

  1. D(C)=0
  2. D(X+C)=D(X)
  3. D(CX)=C2D(X)
  4. D(X±Y)=D(X)+D(Y)±2Cov(X,Y)
  5. X,Y 独立 D(X±Y)=D(X)+D(Y)
  6. D(X)=0P(X=E(X))=1

3. 协方差

Cov(X,Y)=E(XY)E(X)E(Y)

性质:

  1. Cov(X,X)=D(X)
  2. Cov(X,Y)=Cov(Y,X)
  3. Cov(aX,bY)=abCov(X,Y)
  4. Cov(X1+X2,Y)=Cov(X1,Y)+Cov(X2,Y)
  5. Cov(X,C)=0
  6. X,Y 独立 Cov(X,Y)=0

4. 相关系数

随机变量X的标准化:X=XE(X)D(X)

相关系数:ρXY=Cov(X,Y)=Cov(X,Y)D(X)D(Y)

性质:

  1. |ρXY|1
  2. |ρXY|=1 X,Y 成线性关系,a,b s.t. P(Y=aX+b)=1, aρXY>0

五、大数定律与中心极限定理

1. 大量独立同分布随机变量和的极限分布是正态分布(基础)

E(Xi)=μ,D(Xi)=σ2,Y=Xi

E(Y)=nμ,D(Y)=nσ2

Y ~ N(nμ,nσ2)

标准化: Ynμσn ~ N(0,1)

2. 切比雪夫不等式(重点)

E(X)=μ,D(X)=σ2,则对任意ϵ>0,有P(|Xμ|ϵ)σ2ϵ2

落在μ±ϵ外的概率不超过σ2ϵ2

3. 中心极限定理

X=(X1,X2,,Xn)独立同分布,E(Xi)=μ,0<D(Xi)=σ2<,则x,limnP(Xinμσnx)=Φ(x)

例题:每台车床有70的时间在工作

1. 100台车床,求任意时刻有70至80台车床在工作的概率

第1步:写出单个样本X的期望和方差

单个车床X ~ B(1,0.7) E(X)=0.7,D(X)=0.21

第2步:写出样本总体Y的期望和方差

记任意时刻工作的车床数为Y
E(Y)=100E(X)=70,D(Y)=100D(X)=21

第3步:写出所求概率,对Y进行标准化,并用标准正态分布分布函数表示

P(70Y80)=P(707021Y7021807021) =Φ(1021)Φ(0)=Φ(2.18)Φ(0)

第4步:查表代入

2. 求以0.997的概率保证 任意时刻至少有80台车床在工作 所需的车床数

设所需车床数为N,任意某时刻工作的车床数为X,则E(X)=0.7N,D(X)=0.21N

P(X80)=1P(X<80) =1P(X0.7N0.21N<800.7N0.21N) =1Φ(800.7N0.21N)0.997

Φ(800.7N0.21N)0.003 800.7N0.21N2.75

4*. 伯努利大数定律

n次独立重复试验中,事件A发生的次数mP(A)=p,则对任意ϵ>0,有limnP(|mnp|ϵ)=1

5*. 辛钦大数定律

X=(X1,X2,,Xn)独立同分布,记Xi={1,A0,A,则对任意ϵ>0,有limnP(|Xinp|ϵ)=1

6*. 切比雪夫大数定律

X=(X1,X2,,Xn)不相关,E(Xi),D(Xi)<,则对任意ϵ>0,有limnP(|XinE(Xi)n|ϵ)=1

六、抽样分布

1. 统计量

  1. 样本均值:X=1nXi
  2. 样本方差:S2=1n1(XiX)2
  3. 样本标准差:S=S2
  4. 样本k阶原点矩:Ak=1nXik
  5. 样本k阶中心矩:Bk=1n(XiX)k

X=A1S2=n1nB2B1=0

2. X~N(μ,σ2)

  1. 分布名称:正态分布
  2. α分位数:uα

3. X~χ2(n)

  1. 分布名称:卡方分布
  2. 概述:X1,X2,,Xn独立同分布,且Xi ~ N(0,1),则X=Xi2 ~ χ2(n)
  3. α分位数:χα2(n)
  4. 期望:E(X)=n
  5. 方差:D(X)=2n
  6. n时,χ2(n)近似于N(n,2n)
  7. 可加性:Xi ~ χ2(ni) Xi ~ χ2(ni)

4. X~t(n)

  1. 分布名称:t分布
  2. 概述:X ~ N(0,1)Y ~ χ2(n)X,Y独立,XYn ~ t(n)
  3. α分位数:tα(n)
  4. 期望:E(X)=0 对称性:t1α(n)=tα(n)
  5. n时,t(n)近似于N(0,1)

5. X~F(n1,n2)

  1. 分布名称:F分布
  2. 概述:X1 ~ χ2(n1)X2 ~ χ2(n2)X1,X2独立,X1/n1X2/n2 ~ F(n1,n2)
  3. α分位数:Fα(n1,n2)
  4. 性质1:F1α(n1,n2)=1Fα(n2,n1)
  5. 性质2:P(FFα(n1,n2))=1α

6.单正态总体下的抽样分布

  1. X ~ N(μ,σ2n)
  2. U=Xμσn ~ N(0,1)
  3. T=XμSn ~ t(n1)
  4. C=(n1)S2σ2=1σ2(XiX)2 ~ χ2(n1)

7.两正态总体下的抽样分布

  1. XY ~ N(μ1μ2,σ12n1+σ22n2) U=(XY)(μ1μ2)σ12n1+σ22n2 ~ N(0,1)
  2. (XY)(μ1μ2)Sw1n1+1n2 ~ t(n1+n22) T=(XY)(μ1μ2)Sw1n1+1n2 ~ t(n1+n22)
  3. S12/σ12S22/σ22 ~ F(n11,n21) F=S12/σ12S22/σ22 ~ F(n11,n21)

注:Sw2=(n11)S12+(n21)S22n1+n22

七、参数估计(点估计)

1. 矩估计

利用样本矩去估计总体矩,建立样本矩与总体矩的关系,解出参数

A1=X=E(X)A2=1nXi2=E(X2)B2=A2X2

μ=A1σ2=B2

2. 极大似然估计

  1. 写出总体的密度函数f(x;θ)
  2. 写出样本的似然函数L(θ)=f(xi;θ)
  3. L(θ)取对数,得到对数似然函数lnL(θ)
  4. lnL(θ)求导,令其等于0,解出θ的值
  5. 多个参数时,对每个参数分别求偏导,令其等于0,得到方程组,解出每个参数的值

3. 点估计的优良性

  1. 无偏性:E(θ^)=θ
  2. 有效性:D(θ^)D(θ~)θ^=X时最有效

例题:设X1,X2,,Xn是来自总体X的样本,X的密度函数为f(x;σ)=12σe|x|σ,其中σ>0为未知参数,求σ的矩估计和极大似然估计

矩估计

E(X)=+xf(x;σ)dx=12σ+xe|x|σdx=0,无法求出σ,故用二阶矩求解

E(X2)=+x2f(x;σ)dx=12σ+x2e|x|σdx=2σ2

A2=2σ^2,解得σ^=A22

极大似然估计

L(σ^)=f(xi;σ^)=12σ^e|xi|σ^=12nσ^ne|xi|σ^

lnL(σ^)=nln(2σ^)|xi|σ^

dlnL(σ^)dσ^=nσ^+|xi|σ^2=0,解得σ^=|xi|n

八、假设检验

1. 基本步骤

  1. 建立原假设H0和备择假设H1,确定显著性水平α
  2. 选取检验统计量U,此时拒绝域C=|U|uα2
  3. 计算检验统计量的值u,若uC,则拒绝H0,否则接受H0

2. 单个正态总体的假设检验

H0:μ=μ0H1:μμ0

  1. σ2已知,U=Xμ0σ/n ~ N(0,1)
  2. σ2未知,T=Xμ0S/n ~ t(n1)

H0:σ2=σ02H1:σ2σ02

χ2=(n1)S2σ02 ~ χ2(n1)

3. 两个正态总体的假设检验

H0:μ1=μ2H1:μ1μ2

  1. σ12,σ22已知,U=(XY)(μ1μ2)σ12n1+σ22n2 ~ N(0,1)
  2. σ12,σ22未知,T=(XY)(μ1μ2)Sw1n1+1n2 ~ t(n1+n22)

H0:σ12=σ22H1:σ12σ22

F=S12S22 ~ F(n11,n21)