w9yLIXe0E8XpQyrf6L0kQ2Mtqo84NeBknGiiYNPC557b9ZWFapfoOkWSbRtxkbrGa1x87RLjuvuRKoo1T-KhYccwBh1TlZJmZGWPW_APslJ_47fGTbE


안녕하세요? 교주 LGS입니다.

이번 시간은 Inferential Statistics(추측통계학)의 하이라이트라고 할 수 있는 Hypothesis(가설)에 대한 소개 강좌입니다.

이번 강좌에서는 매우 생소한 한자어들이 많이 등장합니다. ;;

사실 Hypothesis와 관련된 개념도 알고 보면 정말~ 별거아니거든요~ 

그냥 말을 어렵게 지어 놓았을 뿐입니다. 솔직히 제 생각에는 밥그릇 지키려고 어려운 용어로 진입장벽을 치는 것 같아요~;;


가설(假說)은 "명(주장)" 입니다. 모든 학문이 그렇지만 통계학도 매우 보수적인 곳입니다.

어떤 주장이 진짜라고 확인되고 판명이 나기전에는 그 주장이 가짜라고 가정을 합니다.

마치 법정에서의 '무죄 추정의 원칙'처럼 검사가 아무리 저 녀석이 살인범이라고 주장해도 

확실한 증거로써 그 사람이 살인범이라는 것을 입증(검증)하기 전에는 그 사람은 일단은 무죄입니다.

주장하는 바(가설)가 진짜인지 확인, 테스트, 검증(사하고 명) 하는 것을?? 가설검증(假說檢證 Hypothesis Test)라고 그러구요 ^^

주장이 진짜로 판명이 나면 주장은 더이상 가설이 아니죠~



hypothesis02.png


Hypothesis(하이파세시스) 즉 가설(주장)에는 크게 두가지 종류의 hypothesis가 있습니다.

그것은 바로바로바로 Null Hypothesis(귀무가설 歸無假說)와 Alternative Hypothesis(대립가설 對立假說)입니다!!

Null Hypothesis 부터 설명드릴께요

Null Hypothesis는 기존에 이미 인정되고 있는 사실(주장)을 말합니다.

Null Hypothesis를 우리나라 말로하면 귀무가설 歸無假說 이라고 그러구요

귀무에서 귀자가 귀향, 복귀, 귀순 등에 쓰이는 '돌아가다'는 의미의 한자입니다.

그러므로 귀무(歸無)라는 것이 아무것도 없는 것(없을 無)으로 다시 돌아간다(돌아갈 歸)는 뜻이잖아요?

이미 인정받고 있는 사실을 다시 주장해서 입증해봤자 아무 소용이 없다는 말이죵



"이영애는 여자입니다" 라고 주장해봤자 사람들은 "그래서 뭐? 어쩌라고~" 하고 

아무일 없었다는 듯이() 일상으로 복 하겠죠~ 이해가 가셨나요?

Null Hypothesis에는 항상 '='의 개념이 들어갑니다. '이영애 == 여자', '해가 뜨는 방향 == 동쪽','20만개 사과의 평균무게 == 112g' 등등...

아!! Null Hypothesis는 기호로 H0로 나타냅니다. H는 Hypothesis의 H에서 가지고 왔구요 0은 아무것도 없다는 Null에서 따왔습니다.


약간 삼천포로 빠지자면 지방에서 서울로 유학간 첫해에 학교내에서 드라마 촬영중인 이영애느님을 1m 앞에서 직접 뵈었습죠^^

(정말 여신이예요 ㅠㅠ 정말 광채가 납니다.) 싸인을 받으려고 막 연습장을 꺼내고 있는데 친구녀석들이 촌티나게 쫌!! 봐~ 서울 사람들은 연예인 봐도

아무렇지 않게 지나가잖아!! 라는 말에... 그만... 흑흑... 그때 싸인을 받았어야되는 건데 ㅜㅜ 


각설하고 자~ 그럼 Null Hypothesis의 반대편에 서있는 Alternative Hypothesis가 어떤 녀석인지 대충 예상을 할 수 있으시겠죠? ^^

학자들이 연구를 왜하나요? 기존의 학설, 주장을 뒤집는 깜짝 놀랄만한 자신만의 연구 결과(새로운 지식)를 인정받기 위해서죠?

Alternative Hypothesis는 한마디로 기존의 주장(H1)을 대체할 수 있는 새로운 주장(내가 말하고 싶은 주장)입니다.

즉 Hypothesis Test가설검증)가 굴러가는 구조는 대충 

[봐!! 너희들이 믿고 있는 Null Hypothesis가 틀렸지!! 그러니까 내가 주장하는 Alternative Hypothesis가 맞잖아!!]

라는 식으로 돌아갑니다.


그런데요~ 조금 애매한 부분이 있습니다.

예를 들어 수년간의 연구 끝에 "여자인줄 알았던 이영애는 사실은 남자입니다!!" 라는 결론에 도달한 한 학자가 자신의 주장을 펼친다고 합시다.

위의 가설검증의 구조대로라면 ["이영애는 여자입니다" 라는 말이 틀렸으니까 "이영애는 남자입니다" ] 라는 논리인데 이 논리가 맞는 건가요? ;;

아니죠!! 아니죠!! "이영애는 여자입니다"라는 말이 틀렸다고해서 100% 확실하게 "이영애는 남자입니다"라고 말할 수는 없습니다. 

이영애는 외계인일 수도 있으니까요~ ;; 

가설검증만으로 우리가 알 수 있는 사실은 단지 이영애가 여자가 아니라는 사실 뿐입니다.

다시 말해 Null Hypothesis(H0)가 "이영애는 여자입니다"라고 한다면 Alternative Hypothesis는 "이영애는 남자입니다"가 아니라

"이영애는 여자가 아닙니다"가 되어야 합니다..

Alternative Hypothesis에는 '같지 않다' ≠  개념이 들어갑니다.


hypothesis03.png


정리하자면 즉 모든 가치판단의 기준은 이미 받아들여지고 있는 가설(H0)에 대한 검증이지 새로운 가설(H1)이 맞냐 틀리냐가 중요한게 아닙니다.

기존 가설이 맞는냐 틀리냐를 따진다는 이야기입니다.

"이영애는 남자입니다"라는 주장은 따로 입증을 해야 합니다. 

즉 H1에는 H0를 부정하는 말이들어갸야지 세로운 주장은 따로 검증을 해줘야한다는 말씀

이해가시나요? 



MIT 유학을 꿈꾸는 청년이 어머니의 손에 이끌려 아주 유명한 점집에 갔다고 합시다.

(사실 저는 Engineer로써 미신 잘 안 믿거든요!! 그런데 사주팔자는 진짜 신기하게 과거는 잘 맞추더군요 -_-;;)

점쟁이와 청년 사이에 팽팽한 긴장감이 흐르는 가운데 청년이 맞출 수 있으면 맞춰보란 식으로 점쟁이에게 질문을 던집니다.

"제가 이번에 MIT에 원서를 넣었는데 붙을 수 있을까요?"

(여기서 비디오 일시정지 II ㅋㅋ)


자~ 위의 상황에서는 총 4가지의 경우가 있을 겁니다.

점쟁이가 MIT에 간다고 했는데 실제로도 MIT에 간 경우           (긍정적으로 예측한 것이 맞았음)  -->  (True   Positive)

점쟁이가 MIT에 간다고 했는데 실제로는 MIT에 못 간 경우       (긍정적으로 예측한 것이 틀렸음)  -->  (False  Positive)

점쟁이가 MIT에 못 간다고 했는데 실제로는 MIT에 간 경우       (부정적으로 예측한 것이 틀렸음)  -->  (False  Negative)

점쟁이가 MIT에 못 간다고 했는데 실제로도 MIT에 못 간 경우   (부정적으로 예측한 것이 맞았음)  -->  (True   Negative)


표로 그려보면..


hypothesis04.png


위의 Table 처럼 되구요~ 각 상황을 부르는 말이 있습니다.

예측이 실제로 맞으면 무조건 True, 예측이 틀리면 False를 쓰시고...

예측이 긍정적 예측이였다면 Positive를, 예측이 부정적 예측이였다면 Negative를 뒤에 붙여주시면 되요~ 쉽죠? ^^

특히 예측이 틀린 경우에는 다른 말로 Error(오류)라고 말합니다.

통계학이란 곳은 보수적이란 곳이라고 그랬죠? 그래서 기존에 믿고 있는 H0 (Null Hypothesis)를 맞다고 가정하고 항상 "1"순위로 둡니다.

그래서 원래는 맞는데 틀렸다고 예상한 오류를 Type I Error 라고 그러고 원래는 틀렸는데 맞다고 예상한 오류를 Type II Error라고 해요 ^^;




이번강좌는 여기서 급마무리 하구요 ;;

다음 시간에는 실제 재미있는 문제를 풀어보면서 개념을 다시 잡아봅시다 ^^

다음 강좌에서 뵈요~ 


profile