Ugrás a fő tartalomhoz

Maximum likelihood módszer

Adott egy nn független, azonos eloszlású elemből X1,X2,,XnX_1,X_2,\dots,X_n álló minta. Egyetlen ismeretlen paraméterünk van, amit λ\lambda-val jelölünk.

Az x1,x2,,xnx_1,x_2,\dots,x_n elemek likelihood függvényének nevezük, és L(λ;x)\mathrm{L}(\lambda; x)-el jelöljük az

fλ(x)=gλ(x1)gλ(x2)gλ(xn)f_\lambda(x) = g_\lambda(x_1) \cdot g_\lambda(x_2) \cdot \ldots \cdot g_\lambda(x_n)

függvényt.

Egy mintahalmazra vonatkozó ML becslés alatt azt a λ\lambda értéket írjük, melyre a mintahalmaz likelihood függvénye maximális.

Ezt a maximális értéket nyilvánvalóan a likelihood függvény deriválásával tudjuk meghatározni. A likelihood függvény egy sok tagból álló szorzatfüggvény így deriválása nehéz.

tanács

A becslés során célszerű a függvény logaritmusát az ún. log-likelihood függvényt venni. Így a logaritmus azonosságait kihasználva, jelentősen le tudjuk egyszerűsíteni a számításokat.

loga(xy)=loga(x)+loga(y)loga(xy)=loga(x)loga(y)loga(xn)=nloga(x)\begin{align*} \log_a(xy) &= \log_a(x) + \log_a(y) \\ \log_a\left(\frac{x}{y}\right) &= \log_a(x) - \log_a(y) \\ \log_a(x^n) &= n \cdot \log_a(x) \end{align*}
Példa (4.3)

Annak valószínűsége, hogy pontosan ilyen kombinációját kapjuk az értékeknek c4(3c)10(14c)6c^4 \cdot (3c)^{10} \cdot (1-4c)^6. Ez a likelihood függvényünk. Ez egyszerűbb számolás érdekében vegyük ennek a logaritmusát.

Ekkor a log-likelihood függvény:

ln(c4(3c)10(14c)6)=lnc4+ln(3c)10+ln(14c)6=4lnc+10ln(3c)+6ln(14c)=4lnc+10ln3+10lnc+6ln(14c)\begin{align*} \ln(c^4 \cdot (3c)^{10} \cdot (1-4c)^6) &= \ln{c^4} + \ln{(3c)^{10}} + \ln{(1-4c)^6} \\ &= 4 \ln{c} + 10 \ln{(3c)} + 6 \ln{(1-4c)} \\ &= 4 \ln{c} + 10 \ln{3} + 10 \ln{c} + 6 \ln{(1-4c)} \end{align*}

A lokális szélsőértékre vonatkozó elsődleges feltétel miatt:

0=4c+0+10c+(614c4)=14c2414c=1456c24cc(14c)=1480cc(14c)\begin{align*} 0 &= \frac{4}{c} + 0 + \frac{10}{c} + \left(\frac{6}{1-4c} \cdot -4 \right) \\ &= \frac{14}{c} - \frac{24}{1-4c} \\ &= \frac{14-56c - 24c}{c(1-4c)} \\ &= \frac{14-80c}{c(1-4c)} \end{align*}

Ez pontosan akkor nulla, ha a számláló nulla, azaz:

1480c=014-80c = 0

Így:

c=740c = \frac{7}{40}

(Még le kéne ellenőrizni, hogy cc valóban maximum hely-e de ez már az analízis feladata.)

Példa (4.4/a)

Legyen XX egy nn elemből álló minta. Adjunk ML becslést Bin(m,p)\mathrm{Bin}(m,p) eloszlás pp paraméterére!

Ekkor a log-likelihood függvény:

lni=0n(mxi)pxi(1p)mxi\ln \prod_{i=0}^{n}{{m \choose x_i} \cdot p^{x_i} \cdot (1-p)^{m-x_i}}

Ami a logaritmus tulajdonságai alapján:

lnL(m,p,x)=i=0nln(mxi)+i=0nlnpxi+i=0nln(1p)mxi=i=0nln(mxi)+i=0nxilnp+i=0n(mxi)ln(1p)=i=0nln(mxi)+lnpi=0nxi+ln(1p)i=0n(mxi)\begin{align*} \ln \mathrm{L}(m, p, x) &= \sum_{i=0}^{n}{\ln{m \choose x_i}} + \sum_{i=0}^{n}{\ln{p^{x_i}}} + \sum_{i=0}^{n}{\ln{(1-p)^{m-x_i}}} \\ &= \sum_{i=0}^{n}{\ln{m \choose x_i}} + \sum_{i=0}^{n}{x_i \cdot \ln{p}} + \sum_{i=0}^{n}{(m-x_i) \cdot \ln{(1-p)}} \\ &= \sum_{i=0}^{n}{\ln{m \choose x_i}} + \ln{p} \cdot \sum_{i=0}^{n}{x_i} + \ln{(1-p)} \cdot \sum_{i=0}^{n}{(m-x_i)} \end{align*}

Mivel xix_i adott minden i<ni < n esetén, illetve ismerjük mm-et, ezért csak pp szerint kell deriválni:

(lnL(m,p,x))=0+1pi=0nxi+11pi=0n(mxi)=1pi=0nxi11p(nmi=0nxi)\begin{align*} (\ln \mathrm{L}(m, p, x))' &= 0 + \frac{1}{p} \sum_{i=0}^{n}{x_i} + \frac{-1}{1-p} \sum_{i=0}^{n}{(m-x_i)} \\ &= \frac{1}{p} \sum_{i=0}^{n}{x_i} - \frac{1}{1-p} \cdot \left( nm - \sum_{i=0}^{n}{x_i} \right) \end{align*}

Vegyük észre hogy az előbb kapott egyenletben a mintaáltag x\overline{x} szerepel, ekkor pp becsléséhez a következő egyenletet kell megoldanunk:

1pnxˉ=11p(nmnxˉ)(1p)nxˉ=p(nmnxˉ)nxˉpnxˉ=pnmpnxˉnxˉ=pnmxˉ=pmp=xˉm\begin{align*} \frac{1}{p} n \bar{x} &= \frac{1}{1-p} \cdot (nm - n\bar{x}) \\ (1-p) \cdot n \bar{x} &= p \cdot (nm - n\bar{x}) \\ n \cdot \bar{x} - p \cdot n\bar{x} &= p \cdot nm - p \cdot n\bar{x} \\ n \cdot \bar{x} &= p \cdot nm \\ \bar{x} &= pm \\ p &= \frac{\bar{x}}{m} \\ \end{align*}

Tehát pp-re a xˉm\frac{\bar{x}}{m} becslést tudjuk adni.