의사결정의 탐색시행과정, 통계적추정
알고자 하는 미지의 수를 "모수"라고 하자.
모수를 알아내고자 하는 것이 목표이고, 그 방법은 표본정보로부터 "추론"하는 것이다.
그 체계적인 절차를 우리는 "통계적 추론 또는 추정"이라고 한다.
수학적으로 확립된 그 체계적 절차를 다음과 같은 과정으로 진행한다.
1. 알고자 하는 미지의 수가 포함된 집단 즉, 모집단으로부터 확률표본들을 추출한다.
기업현장에서 상정될 수 있는 모집단의 종류는 다음분기의 매출액, 변동비, 고정비, 이익, 재고수준
시장점유율, 생산불량품, 손익분기확률... 등 사업과정에 요구되는 의사결정과 관련된 것이며,
이는 모두 당근! 미래에 대한 것이다.
한편 이들 모집단으로부터 알고자 하는 모수는 상황에 따라 다르겠으나, 일반적으로
"모평균", "모분산", "모비율" 세 가지로 요약될 수 있다.
선거과정에서 정당, 후보들의 지지율 또는 제품불량율, 시장점유율 등은 여기서
"모비율"을 추정하는 것에 해당될 것이며,
매출액, 비용, 이익, 재고수준.. 등등은 "모평균" 그리고 "모분산"을 추정하는 것이 될 것이다.
2. 추출한 확률표본으로부터 표본통계량을 계산한다.
요구되는 표본통계량은 추정하고자 하는 모수에 의해 결정될 것이다.
모평균과 모분산을 추정하고자 한다면 표본평균과 표본분산을,
모비율의 추정이라면 표본비율을 계산할 것이다.
이러한 표본통계량의 계산방법은 수학적으로 확립되어 있으며,
이들은 모두 "불편추정량"이다.
다른말로 수식으로 결정된 이 표본통계량의 수학적 기대값은,
현재 알지못하는 미지의 수이지만 그것은 상수!로써 존재하고 있는 "모수"와 같다는 의미이다.
불편추정량에서 이미 논의한 바와 같다.
3. 모집단에서 추출한 확률표본의 확률분포를 확인, "표본의 확률분포 수학식"을 결정하고,
계산한 표본통계량을 확률표본 수식에 대입, 모수를 추정한다.
추출한 확률표본이 곧 표본통계량과 모수를 연결하는 이른바 "관계식"이 된다.
관계식을 결정하기 위해서는 추출한 표본의 확률분포를 알아야 하는데,
여기에서 중심극한정리(CLT)가 이용된다.
모든 확률분포는 기하학적 그래프로 표현되지만 모두 고유한 수학적 함수의 시각적 표현에 불과하다.
확률분포에서 "확률"을 계산하는 행위는 그래프에서 특정 영역의 "면적"을 계산하는 것이고
따라서 이는 함수식을 정적분하는 것인데, 이는 매우 까다로운 일이다.
그러나 이미 수학자들이 계산해 놓았으므로 우리는 이를 이용하기만 하면 될 것이다.
얼마나 고마운 일인가..
모수를 추정하는데, "확률"을 계산하고 이는 "면적"을 계산하는 과정이라 했는데..
모수는 특정의 값, 다른말로 "점추정값"이겠지만
우리는 신이아닌 관계로 그것을 정확히 추정할 수는 현실적으로 불가능한 것이다.
현실적으로 우리가 얻을 수 있는 값은 "진실된 참값"이 아니라 그 "주변에 분포한 수"들이다.
지난 글을 참조할 수 있다. http://subiz_atman.blog.me/150046850990
따라서 "신뢰구간"이라는 아이디어를 도입해 그것을 확률적으로 추정한다.
확률이 추정의 매개변수, 연결도구가 되는 이유는 이 때문이다.
이는 확률통계학의 핵심 아이디어이며 그 이론적 체계는 모두 이것을 기반으로 한다.
따라서 이렇게 추정된 결과는 즉, 모수의 추정결과는
앞에 항상 "신뢰구간 ~%에서 표본오차 ~.."라는 수식어가 붙게 되는데,
신뢰구간, 표본오차..등의 용어는 모두 표본확률분포 즉, 관계식에 포함된 용어들이다.
따라서 결국 표본확률분포, 다른말로 관계식을 이해해야 하는 것으로 요약될 수 있겠다.
한편 표본확률분포는 그 자체로 고유한 성질들을 갖고 있는데 이를 위해서
중심극한정리를 먼저 논의하는 것이 타당하다.
Source : http://subiz_atman.blog.me/
Comments
Post a Comment