Hệ thống kiến thức Thống kê toán

Biên tập: Bùi Dương Hải


Biến ngẫu nhiên gốc 1 chiều X

Mẫu ngẫu nhiên kích thước n:

W_n(X)=(X_1,X_2,...,X_n) displaystyle

Các thống kê đặc trưng mẫu:

Trung bình mẫu, phương sai mẫu:

ar{X}=frac{1}{n}sum^n_{i=1}X_i quad ; quad S^2 = frac{1}{n-1}sum^n_{i=1}(X_i - ar{X})^2

Biến ngẫu nhiên gốc k chiều X = (X1, X2,…, Xk)

Mẫu ngẫu nhiên kích thước n:

W_n(X)=egin{pmatrix} X^1_1 & X^2_1 & cdots & X^k_1  X^1_2 & X^2_2 & cdots & X^k_2  vdots & vdots & ddots & vdots  X^1_n & X^2_n & cdots & X^k_n end{pmatrix}

Có k trung bình mẫu, k phương sai mẫu:

ar{X}_1,...,ar{X}_k quad ; quad S^2_1,..., S^2_k

Có k(k – 1)/2 hiệp phương sai và hệ số tương quan

Cov(j,s)=Cov(X^j,X^s)=frac{1}{n-1}sum^n_{i=1}(X^j_i-ar{X^j})(X^s_i-ar{X^s})

R(j,s)=R(X^j,X^s)=frac{Cov(X^j,X^s)}{S_jS_s}

Ma trận phương sai-hiệp phương sai và ma trận hệ số tương quan

Cov(X)=egin{pmatrix} S^2_1 & Cov(1,2) & cdots & Cov(1,k)  Cov(2,1) & S^2_2 & cdots & Cov(2,k) vdots & vdots & ddots & vdots  Cov(k,1) & Cov(k,2) & cdots & S^2_k end{pmatrix}

R(X)=egin{pmatrix} 1 & R(1,2) & cdots & R(1,k)  R(2,1) & 1 & cdots & R(2,k) ) vdots & vdots & ddots & vdots  R(k,1) & R(k,2) & cdots & 1 end{pmatrix}


Biến ngẫu nhiên gốc X có quy luật bất kỳ, trung bình a và phương sai b2 hữu hạn, quy luật bất kỳ, momen bậc k là µk.

Tính chất của trung bình mẫu

E(ar{X})=aquad ; quad V(ar{X})=frac{b^2}{n} quad ; quad sigma_{ar{X}} = frac{b}{sqrt{n}}

Với phương sai S02, MS và phương sai S2:

S^2_0 =frac{1}{n}sum^n_{i=1}(X_i-a)^2 quad ; quad MS = frac{1}{n}sum^n_{i=1}(X_i- ar{X})^2

S^2 = frac{n}{n-1}MS = frac{1}{n-1}sum^n_{i=1}(X_i - ar{X})^2

thì:

E(S^2_0)=b^2 quad ; quad V(S^2_0) = frac{mu_4 - b^4}{n}

E(MS)=frac{n-1}{n}b^2 quad ; quad V(MS) = frac{(n-1)^2}{n^3}mu_4-frac{(n-1)(n-3)}{n^3}b^4

E(S^2)=b^2 quad ; quad V(S^2) = frac{mu_4}{n}-frac{(n-3)}{n(n-1)}b^4

Nếu X phân phối Chuẩn

X sim N(mu,sigma^2)

ar{X} sim N(mu,frac{sigma^2}{n}) quad ; quad frac{ar{X}-mu}{sigma / sqrt{n}} sim N(0,1)

E(S_0^2)=sigma^2 quad ; quad V(S^2_0)=frac{2sigma^4}{n} quad ; quad frac{nS^2_0}{sigma^2} sim chi^2(n)

E(S^2)=sigma^2 quad ; quad V(S^2)=frac{2sigma^4}{n-1} quad; quad frac{(n-1)S^2}{sigma^2}sim chi^2(n-1)

T=frac{ar{X}-mu}{S/ sqrt{n}} sim T(n-1)

Các công thức suy diễn về mẫu (Khoảng chấp nhận)

Với mức xác suất (1 – α) cho trước

Suy diễn trung bình mẫu:

P left ( mu - frac{sigma}{sqrt{n}}u_{alpha_1} < ar{X} < mu + frac{sigma}{sqrt{n}}u_{alpha_2} < ar{X} 
ight ) = 1 - (alpha_1 + alpha_2)

Suy diễn phương sai mẫu:

P left ( frac{sigma^2}{n-1}chi^{2(n-1)}_{1-alpha_1} < S^2 < frac{sigma^2}{n-1}chi^{2(n-1)}_{alpha_2} 
ight ) = 1 - (alpha_1 + alpha_2)

Suy diễn tần suất mẫu:

P left ( p - frac{sqrt{p(1-p)}}{sqrt{n}} u_{alpha_1} < f < p + frac{sqrt{p(1-p)}}{sqrt{n}} u_{alpha_2} 
ight ) = 1 - (alpha_1 + alpha_2)

Ba trường hợp thông dụng: tối đa (phía trái), tối thiểu (phía phải), đối xứng (hai phía)


ƯỚC LƯỢNG THAM SỐ

Ước lượng tham số θ thì hàm rủi ro

E(hat{	heta}-	heta)^2=V(hat{	heta})+(	heta-E({hat{	heta}}))^2

Ước lượng không chệch nếu:

E(hat{	heta})=	heta

Lượng chệch (độ chệch)

bias=	heta-E(hat{	heta})

Ước lượng hiệu quả hơn (trong số các ước lượng không chệch)

V(hat{	heta}_1) < V(hat{	heta}_2)

Ước lượng hiệu quả (nhất)

V(hat{	heta}^*) leq V(hat{	heta})

Hàm hợp lý

L=L(X_1,...,X_n,	heta)=left{egin{matrix} prod_{i=1}^{n}P(X_i,	heta) & : &discrete   prod_{i=1}^{n}f(X_i,	heta) & : & continuous end{matrix}
ight.

Hàm điểm

Score(X,	heta)=frac{partial }{ partial 	heta} ln L(X,	heta)

Tính chất:

E(Score(X,	heta))=0

Lượng tin theo nghĩa Fisher

I(	heta)=E(Score(X,	heta))^2

Suy ra:

I(	heta)=V(Score(X,	heta))=-Eleft ( frac{ partial^2}{partial 	heta^2} ln L(X,	heta) 
ight )

Bất đẳng thức Cramer-Rao:

Với mọi thống kê G = g(X, θ) thì:

V(g(X,	heta)) geq dfrac{left ( dfrac{partial}{partial 	heta}E(g(X,	heta)) 
ight )^2}{I(	heta)}

V(g(X,	heta)) geq dfrac{left ( dfrac{partial}{partial 	heta}E(G) 
ight )^2}{I(	heta)}

Nếu G là ước lượng không chệch của θ thì E(G) = θ

V(hat{	heta}) geq dfrac{1}{nEleft ( dfrac{partial}{partial 	heta} ln f(X,	heta)
ight )^2}

V(hat{	heta}) geq dfrac{1}{-nEleft ( dfrac{partial^2}{partial 	heta^2} ln f(X,	heta)
ight )}

Độ hiệu quả

e(hat{	heta}) =frac{1}{V(hat{	heta})I(	heta)}

Ước lượng tiệm cận không chệch:

lim_{n 
ightarrow infty} E(hat{	heta}) = 	heta

Ước lượng tiệm cận hiệu quả:

lim_{n 
ightarrow infty} e(hat{	heta}) =1

Ước lượng vững:

lim_{n 
ightarrow infty} P(|hat{	heta}-	heta| < epsilon) =1

Ước lượng hợp lý tối đa

Cực đại hóa hàm hợp lý, qua hàm logarit

max_{	heta} L(x,	heta) Leftrightarrow max_{	heta} ln L(x,	heta) Leftrightarrow left{egin{matrix} dfrac{partial}{partial 	heta} ln L(x,	heta) = 0   dfrac{partial^2}{partial 	heta^2} ln L(x,	heta) < 0 end{matrix}
ight.


Ước lượng khoảng – Khoảng tin cậy

Ước lượng tham số µ khi biết σ2:

P left ( ar{X} - dfrac{sigma}{sqrt{n}}u_{alpha_2} < mu < ar{X} + dfrac{sigma}{sqrt{n}}u_{alpha_1} 
ight ) = 1 - (alpha_1 + alpha_2)

Nếu khoảng đối xứng:

ar{X} - dfrac{sigma}{sqrt{n}}u_{alpha/2} < mu < ar{X} + dfrac{sigma}{sqrt{n}}u_{alpha/2}

Có thể viết dưới dạng:

ar{X} pm ME quad; quad ME = frac{sigma}{sqrt{n}}u_{alpha/2}

Xác định kích thước mẫu:

n=frac{sigma^2}{ME^2}u^2_{alpha/2}

Ước lượng tham số µ khi chưa biết σ2:

P left ( ar{X} - frac{S}{sqrt{n}}t^{(n-1)}_{alpha_2} < mu < ar{X} + frac{S}{sqrt{n}}t^{(n-1)}_{alpha_1} 
ight ) = 1 - (alpha_1 + alpha_2)

Ước lượng tham số σ2 khi biết µ:

P left ( frac{nS^2_0}{chi^{2(n)}_{alpha_2}} < sigma^2 < frac{nS_0^2}{chi^{2(n)}_{alpha_1}} 
ight ) = 1 - (alpha_1 + alpha_2)

Ước lượng tham số σ2 khi chưa biết µ:

P left ( frac{(n-1)S^2}{chi^{2(n-1)}_{alpha_2}} < sigma^2 < frac{(n-1)S^2}{chi^{2(n-1)}_{alpha_1}} 
ight ) = 1 - (alpha_1 + alpha_2)

Ước lượng p tổng quát

Cận dưới:

left ( nf+frac{1}{2}u^2_{alpha_2}-u_{alpha_2}sqrt{nf(1-f)+frac{1}{4}u^2_{alpha_2}} 
ight )/(n+u^2_{alpha_2})

Cận trên

left ( nf+frac{1}{2}u^2_{alpha_1}+u_{alpha_1}sqrt{nf(1-f)+frac{1}{4}u^2_{alpha_1}} 
ight )/(n+u^2_{alpha_1})

Với n lớn hơn hoặc bằng 100

P left ( f - frac{sqrt{f(1-f)}}{sqrt{n}}u_{alpha_2} < p < f + frac{sqrt{f(1-f)}}{sqrt{n}}u_{alpha_1} 
ight ) = 1 - (alpha_1 + alpha_2)

Với khoảng đối xứng:

f - frac{sqrt{f(1-f)}}{sqrt{n}}u_{alpha/2} < p < f + frac{sqrt{f(1-f)}}{sqrt{n}}u_{alpha/2}

có thể viết dưới dạng:

f pm ME quad; quad ME =frac{sqrt{f(1-f)}}{sqrt{n}}u_{alpha/2} quad Rightarrow ME leq frac{u_{alpha/2}}{2sqrt{n}}

Kích thước mẫu:

n=frac{f(1-f)}{ME^2}u^2_{alpha/2}

Ước lượng hiệu hai tham số µX và µY của hai biến ngẫu nhiên phân phối chuẩn

Với mẫu theo cặp:

W(n)=left ( (X_1,Y_1),(X_2,Y_2),...,(X_n,Y_n) 
ight )

Đặt chênh lệch của hai biến là d:

d_i=X_i - Y_i

Ước lượng cho kỳ vọng của µ= µX – µY:

ar{d}-frac{S_d}{sqrt{n}}t^{(n-1)}_{alpha/2} <mu_d < ar{d}+frac{S_d}{sqrt{n}}t^{(n-1)}_{alpha/2}

Nếu mẫu không theo cặp:

W_{n_X}(X)=(X_1,...,X_{n_X}) ; W_{n_Y}(Y)=(Y_1,...,Y_{n_Y})

Ước lượng hiệu hai µ khi biết σ:

(ar{X}-ar{Y}) - sigma_{(ar{X}-ar{Y})}u_{alpha/2} < mu_X -mu_Y < (ar{X}-ar{Y}) + sigma_{(ar{X}-ar{Y})}u_{alpha/2}

Với

sigma_{(ar{X}-ar{Y})}=sqrt{frac{sigma^2_X}{n_X}+frac{sigma^2_Y}{n_Y}}

Ước lượng hiệu hai µ khi không biết σ và giả thiết chúng khác nhau:

(ar{X}-ar{Y}) - Se{(ar{X}-ar{Y})}t^{(df)}_{alpha/2} < mu_X -mu_Y < (ar{X}-ar{Y}) +Se{(ar{X}-ar{Y})}t^{(df)}_{alpha/2}

Với

Se(ar{X}-ar{Y})=sqrt{frac{S^2_X}{n_X}+frac{S^2_Y}{n_Y}}

df=

Khoảng tin cậy đối xứng

 

This entry was posted in Uncategorized. Bookmark the permalink.