Ugrás a fő tartalomhoz

Becslések

A statisztika egy fontos területe a becslés.

Tiszta matematikai szempontból a valószínűségszámításnál szerencsénk volt, hiszen mindig olyan eloszlásokról beszéltünk, melyeknek paramétereit ismertük.

A valóságban azonban sokszor nem ismerjük az eloszlások paramétereit, így azokat becslülnünk kell.

Definíció (torzítatlan becslés)

A T(X1,X2,,Xn)T(X_1, X_2, \dots, X_n) statisztikai függvény torzítatlanul becsli a g(p)g(p) függvényt, ha a tetszőleges pp paraméter esetén:

Ep(T(X1,X2,,Xn))=g(p)\E_p(T(X_1, X_2, \dots, X_n)) = g(p)
megjegyzés

gg általában az identitásfüggvény.

Torzítatlan becslés például a mintaátlag: X1,X2,,XnX_1, X_2, \dots, X_n azonos eloszlású valószínűségi változók. Legyen

T(X1,X2,,Xn)=X1+X2++XnnE(Xi)=p\begin{align*} T(X_1, X_2, \dots, X_n) &= \frac{X_1 + X_2 + \dots + X_n}{n} \\ E(X_i) &= p \end{align*}

Ekkor:

Ep(T(X1,X2,,Xn))=Ep(X1+X2++Xnn)E_p(T(X_1, X_2, \dots, X_n)) = \E_p \left( {\frac{X_1 + X_2 + \dots + X_n}{n}} \right)

Ami

Ep(1ni=0n(Xi))=1ni=0nEp(Xi)(vaˊrhatoˊ eˊrteˊk additıˊv)=1nnp=p\begin{align*} \E_p\left( \frac{1}{n} \cdot \sum_{i=0}^{n}{(X_i)} \right) &= \frac{1}{n} \cdot \sum_{i=0}^{n}{\E_p(X_i)} \quad \text{(várható érték additív)} \\ &= \frac{1}{n} \cdot n \cdot p \\ &= p \end{align*}

Torzítatlan becslés még a relatív gyakoriság is. Legyen adott egy pp valószínűségű esemény, ekkor az eseményeket egy-egy indikátor változóval tudjuk reprezentálni.

{Xi=1n,ha sikeres az i-edik kıˊseˊrletXi=0,ku¨lo¨nben\begin{cases} X_i = \frac{1}{n}, \quad &\text{ha sikeres az } i \text{-edik kísérlet} \\ X_i = 0, \quad &\text{különben} \end{cases}

Ekkor X1+X2++Xkk\underbrace{X_1 + X_2 + \dots + X_k}_{k} éppen kn\frac{k}{n}, ami a relatív gyakoriság, így

E(X1+X2++Xk)=i=1nE(Xi)=np1n=p\E(X_1 + X_2 + \dots + X_k) = \sum_{i=1}^{n}\E(X_i) = n \cdot p \cdot \frac{1}{n} = p
Példa (4.1)

Legyenek X1,X2,,XnX_1, X_2, \dots, X_n azonos eloszlású valószínűségi változók, mm várható értékkel.

Torzítatlan becslés-e T(X)=X8T(X) = X_8?

Em(T(X1,,Xn))=Em(X8)=m\E_m(T(X_1, \dots, X_n)) = \E_m(X_8) = m