写在前面
Coldrain 在第一轮基础复习的时候并没有留下任何笔记,直到概率论刷题的时候,发现知识点比较零散容易忘记,做题卡住了,遂准备从第二轮基础复习开始好好留下笔记,便于知识点检索与记忆
至于为什么选择以 blog 的形式记录,因为 Coldrain 平时没有手写笔记的习惯💦
本笔记参考书目包括:
- 27 版的余丙森概率论(基础与强化在同一本书中)
- 26 版的方皓概率论基础与强化两本书
- 27 版的张宇概率论基础 9 讲
- 本科概率论留下的笔记(和社团的朋友们共同编辑的)
1. 随机事件及其概率
2. 一维随机变量及其分布
3. 二维随机变量及其分布
4. 数字特征
5. 大数定律和中心极限定理
6. 数理统计的基本概念
6.1 总体与样本
-
总体是指与所研究的问题有关的个体的全体所构成的集合,在数理统计中,总体就是一个服从某概率分布的随机变量 X,其概率分布称为总体分布,其数字特征称为总体数字特征
-
样本的性质:
- 独立性:X1,X2,...,Xn 相互独立
- 代表性:Xi 与 X 同分布
6.2 统计量
-
统计量:样本 X1,X2,...,Xn 的不含总体任何未知参数的函数 g(X1,X2,...,Xn)
-
常见统计量
- (1)样本均值:X=n1i=1∑nXi
- (2)样本方差:S2=n−11i=1∑n(Xi−X)2=n−11(i=1∑nXi2−nX)
- (3)样本标准差 S=S2
- (4)样本 k 阶原点矩 Ak=n1i=1∑nXik
- (5)样本 k 阶中心矩 Bk=n1i=1∑n(Xi−X)k
- (6)顺序统计量:X1∗=min{X1,X2,...,Xn},X2∗=max{X1,X2,...,Xn}
重要结论:
- E(X)=E(X)
- D(X)=nD(X)
- E(S2)=D(X)
6.3 卡方分布
-
定义:设(X1,X2,...,Xn)为来自总体 X~N(0,1)的一个简单随机样本,那么统计量 χ2=X12+X22+...+Xn2 为服从自由度为 n 的 χ2 分布,记作 χ2~χ2(n)
-
χ2 分布的性质:
- (1)设 X~N(0,1),则 X2~χ2(1),E(X2)=1,D(X2)=2
- (2)设 χ2~χ2(n),则 E(χ2)=n,D(χ2)=2n
- (3)设 χi2~χ2(ni),且 χ12,χ22 相互独立,则 χ12+χ22~χ2(n1+n2)
6.4 t 分布
- 定义:设 X~N(0,1),Y~χ2(n),且 X 与 Y 相互独立,则称 T=Y/nX 为服从自由度为 n 的 t 分布,记作 T~t(n)
6.5 F 分布
-
定义:设 X~χ2(n1),Y~χ2(n2),且 X 与 Y 相互独立,则称 F=Y/n2X/n1 为服从第一自由度为 n1,第二自由度为 n2 的 F 分布,记作 F~F(n1,n2)
-
F 分布的性质
- (1)若 F~F(n1,n2),则 F1~F(n2,n1)
- (2)若 T~t(n),则 T2=Y/nX2~F(1,n)
6.6 上侧 alpha 分位点
原本是正态分布里面的那个标准正态分布查表法,这里也可以推广到 χ2、t、F 分布中,此处暂时没什么好写的,可以去看一下参考书上的图
6.7 单正态总体下常用统计量的分布
- 设 X~N(μ,σ2),(X1,X2,...,Xn) 为来自总体 X 的简单随机样本,则:
- (1)X=n1i=1∑nXi~N(μ,nσ2)
- (2)U=σ/nX−μ~N(0,1)
- (3)X 与 S2 相互独立,且 σ2(n−1)S2=σ2i=1∑n(Xi−X)2~χ2(n−1)
- (4)σ2i=1∑n(Xi−μ)2~χ2(n)(提示:σXi−μ~N(0,1))
- (5)T=S/nX−μ~t(n−1)
6.8 双正态总体
(这个真的会考吗…💦)
7. 参数估计
7.1 参数的点估计、估计量、估计值
- 估计量 θ^(X1,X2,...,Xn) 是一个随机变量
- 估计值 θ^(x1,x2,...,xn) 为估计量所取的具体值
- 点估计 就是用估计量的值估计位置参数的值
7.2 矩估计法
-
用样本矩估计相应的总体矩从而得到参数估计的方法称为矩估计法
-
总体矩:
- μk=E(Xk)
- γk=E{[X−E(X)]k}
小结论:
- μ1=E(X)
- μ2=E(X2)
- γ2=D(X)
- 样本矩:
- Ak=n1i=1∑nXik
- Bk=n1i=1∑n(Xi−X)k
小结论:
- A1=X
- A2=n1i=1∑nXi2
- B2=n1(i=1∑nXi2−nX2)
-
关系:
- E(Ak)=μk
- 由大数定律,Ak⟶Pμk,A1⟶Pμ1、A2⟶Pμ2、Bk⟶PD(X)
-
计算方法:按照低阶矩优先原理,建立方程(组),从中解出未知参数
- (1)当 k=1 时,建立方程:若 E(X) 含 θ,令 X=E(X),解出 θ^
- (2)当 k=2 时,最常用的两个方程为 ⎩⎨⎧X=E(X)n1i=1∑nXi2=E(X2) 或 ⎩⎨⎧X=E(X)n1(i=1∑nXi2−nX2)=n1i=1∑n(Xi−X)2=D(X)
7.3 最大似然估计法
-
似然函数:样本 X1,X2,...,Xn 取到观察值 x1,x2,...,xn 的概率 L(θ)
- (1)离散型:X 分布律为 P{X=x}=p(x;θ),则似然函数 L(θ)=P{X1=x1,X2=x2,...,Xn=xn}=i=1∏nP{Xi=xi}=i=1∏np{xi;θ}
- (2)连续型:X 概率密度为 f(x)=f(x;θ),则似然函数 L(θ)=i=1∏nf(xi;θ)
-
思想:在 θ 的取值范围内求 θ^ 使 L(θ^)=maxL(θ)
-
解题步骤:
- (1)写出似然函数 L(θ),取对数 lnL(θ)
- (2)对 θ 求导,令导函数为 0,计算得到驻点
- (3)再针对具体情况分析
-
最大似然估计的不变性:
- 设 θ^ 是未知参数 θ 的最大似然估计,对于 θ 的函数 g(θ),如果 g(θ) 具有单值反函数,则 g(θ^) 为 g(θ) 的最大似然估计
7.4 估计量的评选标准
- 无偏性:
- 设 θ^ 为 θ 的估计量,若 E(θ^)=θ,则 θ^ 为无偏估计量,否则为有偏估计量
- 若 n→0limE(θ^)=θ,则称 θ^ 为 θ 的渐近无偏估计
常用结论:
- (1)X 是 E(X)=μ 的无偏估计,即 E(X)=E(X)=μ
- (2)S2 是 D(X)=σ2 的无偏估计,即 E(S2)=D(X)=σ2
- (3)设 θ1^,θ2^,...,θn^ 均为 θ 的无偏估计,c1,c2,...,cn 为常数且 i=1∑nci=1,则 c1θ1^+c2θ2^+...+cnθn^ 仍是 θ 的无偏估计
-
有效性:
- 设 θ1^,θ2^ 均为 θ 的无偏估计,若 D(θ1^)<D(θ2^),则称 θ1^ 比 θ2^ 更有效
-
一致性(相合性):
- 若对 ∀ϵ>0,有 n→∞limP{∣θ^−θ∣<ϵ}=1,则称 θ^ 为 θ 的一致估计量或相合估计量
-
置信区间:P{θ1^<θ<θ2^}=1−α,则称 (θ1^,θ2^) 为未知参数 θ 的置信度为 1−α 的置信区间。
-
正态总体下参数 μ,σ2 的置信区间(设总体 X~N(μ,σ2),求取置信度为 1−α)
| 题意 | 枢轴量 | 双侧置信区间 | 单侧置信限 |
|---|
| σ2 已知,估μ | Z=σ/nX−μ∼N(0,1) | (X−nσzα/2,X+nσzα/2) | μ=X+nσzαμ=X−nσzα |
| σ2 未知,估μ | T=S/nX−μ∼t(n−1) | (X−nStα/2(n−1),X+nStα/2(n−1)) | μ=X+nStα(n−1)μ=X−nStα(n−1) |
| μ 已知,估σ2 | χ2=σ2i=1∑n(Xi−μ)2∼χ2(n) | χα/22(n)i=1∑n(Xi−μ)2,χ1−α/22(n)i=1∑n(Xi−μ)2 | σ2=χ1−α2(n)i=1∑n(Xi−μ)2σ2=χα2(n)i=1∑n(Xi−μ)2 |
| μ 未知,估σ2 | χ2=σ2(n−1)S2∼χ2(n−1) | (χα/22(n−1)(n−1)S2,χ1−α/22(n−1)(n−1)S2) | σ2=χ1−α2(n−1)(n−1)S2σ2=χα2(n−1)(n−1)S2 |
8. 假设检验