안녕하세요? 앞으로 여러분과 함께 'Statistics 때려잡기'를 같이 할 교주 'LGS'입니다.
그럼 바로 강의를 시작하도록 하겠습니다.
(중요한 부분은 노랑색으로 강조해 두었습니다)

Statistics(통계학 統計學)을 알아 두면 실생활에 많은 도움이 됩니다.
당장 TV 뉴스, 신문에 통계학 용어가 나오지 않는 날이 하루도 없습니다.
공학, 과학,사회학 분야에서 Statistics의 중요성은 점점 커져가고 있습니다.
당장 회사에 들어가시면 6시그마 배우셔야 할 껄요?? ;; 킁 (전 6시그마 그린벨트^^)
결론은 통계학(Statistics) 알아두시면 좋타!! 이거죠.

MATLAB을 잘 활용하시면 이 Statistics를 정말 쉽게 하실 수 있습니다.(Statistics Toolbox 제공)
통계처리할 때 많은 분들이 Excel을 사용하시는데 Excel도 충분히 훌륭한 Tool이지만
MATLAB은 Excel과는 레베루가 다릅니다. 레베루가!! 
Excel이 사시미칼이라면 MATLAB은 삼국지의 관우가 쓰는 청룡언월도(靑龍偃月刀) 랄꺄요...
그.러.나. 명검도 잘 휘둘러야 명검이지 들지도 못하면 꽝. 도구가 아무리 좋아도 활용 못하면 꽝이습죠
그리하야 준비했습니다. "Statistics 때려잡기' with MATLAB !! 두둥 ^^
(기본적인 MATLAB 사용법은 'MATLAB 때려잡기' 강좌를 참조하세욤~)
그럼 본격적으로 강의 들어가겠습니다.

(위의 그림을 잘 기억해 두세요. 나무보다는 숲을 먼저 보아야 합니다.)

통계학을 이해하기 위해서 대통령 선거 만큼 좋은 예가 없을 겁니다.
대통령 선거가 오후 6시에 땡하고 끝나면 각 방송사들은 출구 조사를 통해 조사한 결과를 발표합니다.
현란한 차트와 그래프를 보여 주면서 신뢰도 95 ±3% 라느니 하며 당선자를 예측하죠~

왜 출구조사를 할까요? 투표한 사람들 모두를 조사하면 가장 정확한 당선 예측을 할 수 있을 텐데...
그런대 투표한 사람 모두를 조사하자니 돈도 많이 들고 시간도 없고 ... 
그래서 투표하고 나오는 사람들 중에 몇명만 찝어서 '누구 찍으셨어요?' 하고 조사하는 거죠~

즉 출구조사를 실시해서 출구조사에 참여했던 사람들(Sample)의 성향(Statistic  맨 끝에's'가 붙지 않습니다)을 
바탕으로 전체 유권자(Population)의 성향(Parameter)를 추측(Inference)합니다.

다시 말해 통계학(Statistics)이란게 딴것이 아니고 전체(Population) 중에 몇개(Sample)를 뽑아보고(Sampling)
뽑힌 몇개만을 보고(Statistic) 전체가가 어떨 것이다(Parameter) 하고 추측(Inference) 하는 거죠~
추측이기 때문에 100% 정확하지 않아서 신뢰도라는 말이 나오는 거구요.


전우주에서 관심 있는 대상을 Population 이라고 하고 Population 중 일부 뽑힌 녀석들을 Sample이라고 합니다.
즉 Sample은 Population중 일부 입니다.

관심 있는 대상 전체(Population)에서 우리가 관심 있는 특징(값)을 Parameter라고 합니다.
Sample의 Population과 같은 종류의 특징(값)은 Statistic( s 안 붙음)이라고 해요.

예를 들어 우리나라 남자의 평균키를 알고 싶다고 하면 
우리나라 전체 남성이 Population이 되겠고 키가 Parameter가 되겠죵?
그런데 실제로는 우리나라 남성 전부 다를 조사할 수 없으니까 몇명만 뽑아서 키를 잽니다.
뽑힌 사람이 Sample이고 뽑힌 사람들의 키가 Statistic 입니다. 이해가시죠?

참고로 우리나라 남성의 평균 신장은 174cm 정도 입니다.
180cm가 안되면 Looser라던데 저도 2cm 모자라는 루저 털썩 OTL  ㅜㅜ
(나중에 평균,분산 할 때 나는 키로 우라나라에서 몇등인가를 계산해보겠습니다)

이런 통계학(Statistics)을 크게 2개로 나눠보라고 하면 
Descriptive Statistics와 Inferential Statistics로 나눌 수 있습니다.


Descriptive Statistics(기술통계학)은 말 그대로 록하고 서(묘사)하는 통계학입니다.
위의 우라나라 남성평균키를 예로 들자면 남자를 Sampling할 때 어떻게 Sampling 할 건지, 
키를 젤때 줄자로 젤지, 나이를 10년 단위로 나눌 건지 1년 단위로 나룰 건지... 등등...
그리고 그 측정한 결과를 이해하기 쉽게 그래프로 그린다거나 표를 만들어 보여준다거나 
결과의 특징을 어떻게 잘 표현할지 하는 것들이죠

Inferential Statistics(추측통계학)은 말그대로 Statistic에서 Parameter를 추측하는 것에 관련된 통계학입니다.
일부를 가지고 전체를 추측하는데 그 추측이 얼마나 신뢰할 수 있냐? 추측이 맞냐 틀리냐 이런걸 따지는 거죠


이제 위에 그림 이해가시죠? ^^

아래 동영상은 Statistics 때려잡기 with MATLAB 2부 예고입니다.
(당분간 Descriptive Statistics에서 놀겁니다)
그럼 다음 시간에 뵙겠습니다. 꾸벅. ^^

profile