적률(Moment)과 적률생성함수

정리하려고 벼르고 벼르다 이제서야 글을 쓰게 됐다.
이 글에서는 확률변수에 대한 적률 개념과 적률생성함수를 정리해보려 한다.

적률(Moment)이란 함수의 모양에 대한 정량 지표이다.
그렇기에 수학이나 물리학, 통계학 등 다양한 분야에서 활용된다.
중등교육과정에서는 수학 시간에 평균과 분산이라는 이름으로, 물리 시간에는 질량과 가속도라는 이름으로 공부하였다.
이제 적률을 정의하고 이것이 어디에 활용되어왔고 활용할 수 있는 지를 살펴볼 것이다.
앞으로는 적률 대신 모멘트라는 용어를 사용할 것이다.

모멘트 도출

확률론에서 모멘트는 어떻게 등장하게 됐을까?
모멘트는 확률밀도함수나 누적분포함수 이외의 방법으로 확률분포를 나타내려 할 때 생각할 수 있는 자연스러운 결과물이다.
예를 들어 이산 확률변수가 f(0), f(1), f(2), ...처럼 주어질 때 이와 일대일 대응하는 멱급수를 다음과 같이 정의해보자.

$$
f(0)s^0 + f(1)s^2 + \cdots = \sum^{\inf}_{x=0}s^x f(x), -1 \lt s \lt 1
$$

이 때, \sum^{\inf}_{x=0}s^x f(x)은 기댓값이므로 다음과 같이 확률생성함수 G(s)를 도출할 수 있다.

$$
G(x) = E(s^X) = \sum^{\inf}_{x=0}s^x f(x), -1 \lt s \lt 1
$$

여기서 s가 양수라면 t = \log{s}를 통해 다음과 같이 표현할 수 있고

$$ E(s^X) = E(e^{X\log{s}}) = E(e^{tX}) $$

이 때의 e^{tX}는 테일러 전개를 통해 다음과 같이 쓸 수 있다.

$$ e^{tX} = 1 + \frac{tX}{1!} + \frac{(tX)^2}{2!} + \frac{(tX)^3}{3!} + \cdots $$

그러므로 E(e^{tX})는 다음과 같이 정리된다.

$$ E(e^{tX}) = 1 + \frac{E(X)}{1!} + \frac{E(X^2)}{2!} + \frac{E(X^3)}{3!} + \cdots $$

여기서 나타나는 E(X^k)를 k차(k-th) 모멘트라고 하며 E(e^{tX})를 확률변수 X의 적률생성함수(moment generating function; mgf)라 한다.

모멘트의 종류

모멘트를 조금만 변형하면 훨씬 다양하게 활용할 수 있다.
mean-centered 확률변수 X로 정의한 모멘트를 중심 모멘트(Central Moment) \mu_{n}라 한다.

$$ \mu_{n} = E[(X – E(X))^n] $$

그리고 standardized 확률변수 X로 정의한 모멘트를 정규화 모멘트(Standardized Moment)라 한다.
정규화 모멘트 \tilde{\mu_{n}}은 다음과 같이 정의한다.

$$
\begin{align*}
\tilde{\mu_{n}} &= \frac{\mu_{n}}{\sigma^{n}} \\
\mu_{n} &= E[(X – E(X))^n] \\
\sigma^{n} &= \mu^{\frac{n}{2}}_{2} = E[(X – E(X))^2]^{\frac{n}{2}}
\end{align*}
$$

다들 무섭게 생겼지만 잘 생각해보면 익숙한 형태들이다.
이제 이 모멘트들을 어떻게 활용할지 아래의 표를 통해 확인해보자.

from Wikipedia

평균, 분산, 왜도, 첨도가 각각 1차 모멘트, 2차 중심 모멘트, 3차 정규화 모멘트, 4차 정규화 모멘트가 된다는 것을 확인할 수 있다.
이 사실을 몰랐을 땐 왜도와 첨도 공식을 열심히 외웠어야 했는데 이젠 그럴 필요가 없다.
펜을 들고 한번쯤 직접 증명해보는 것이 좋다.

적률생성함수

위에서 도출한 적률생성함수(이하 mgf)를 통해 확률분포를 얻어낼 수 있다.
방법은 단순하다.
얻고자 하는 차수만큼 미분한 후 0을 대입하여 해당 항의 차수를 얻어내는 것이다.
이제 아래의 확률생성함수 G(s)에 대해

$$ G(s) = E(s^X) = \sum^{\inf}_{x=0}s^x f(x) = f(0)s^0 + f(1)s^1 + \cdots $$

아래와 같이 미분한다.

$$ \frac{d^k}{ds^k}{\sum^{\inf}_{x=0}s^x f(x)} = \sum^{\inf}_{x=k} x(x-1) \cdots (x-k+1) s^{x-k} f(x) $$

그 결과 확률밀도함수 f(k)가 다음과 같이 도출된다.

$$
\begin{align*}
f(k) &= \frac{d^k}{ds^k}{\sum^{\inf}_{x=0}s^x f(x)} \bigg\rvert_{s=0} / k! \\
&= G^{(k)}(0) / k!
\end{align*}
$$

단, k는 음이 아닌 정수이다.

mgf를 확률분포 계산에도 활용할 수도 있겠지만 두 확률변수 X, Y의 mgf가 존재하고 0을 포함하는 열린구간에서 두 mgf가 일치한다면 X와 Y의 확률분포가 일치한다는 정리를 통해 두 확률변수의 동일성을 활용하는 데도 사용할 수 있다.

댓글 남기기