test 종류 파이썬으로 T te st 해보는 프로그래밍 통계 3:T 검정(T test)이란? , T

T 検定 ( T test 、 Student T tes t ) ?

T값(tvalue)으로 불리는 검정통계량을 계산하여 두 그룹간 평균 또는 한 그룹의 평균과 특정 값의 차이가 있는지를 검정하는 방법이다.

T 값(T value) T test에 사용되는 검정 통계량으로, 두 집단 차이의 평균을 표준 오차로 나누는 값, 즉 표준 오차와 표본 평균 사이의 차이의 비율이다.여기서 표준 오차(Standard Error, SE)란: 표본의 표준편차를 표본수의 제곱근으로 나눈 것이다. 표준편차가 분산의 제곱근이기 때문에 표준오차를 표본수로 나눈 값의 제곱근이라고 표현할 수도 있다. 간단히 말하면, 추정치가 원래 구하고자 하는 값에서 얼마나 떨어져 있는지=추정치와 모집단 값의 표준적인 차이다. 표준오차는 표본의 수가 많아질수록 작아지는데(표본의 수로 나눈 값이므로), 이는 원리적으로 생각해도 표본이 클수록 모집단에 가까워지기 때문에 오차가 줄어들 수밖에 없기 때문이다.

나중에 표본오차라는 개념도 나오지만 용어는 비슷하지만 전혀 다른 개념이다. 표본오차(Sampling Error)란 오차의 한계와 같은 개념으로 표본에 의해 모수를 추정하면 항상 오차가 생긴다고 앞서 말했는데(추정치이기 때문에) 그때 생기는 오차를 말한다.T검정의 종류

  1. 독립 표본 T test vs 대응 표본 T test
  2. 일반적으로 T검정은 다른 두 모집단 또는 다른 두 표본의 평균차이가 있는지를 검정하는 데 사용된다. 이것이 독립 표본 Ttest이다. (ex) 신약을 먹은 A그룹과 B그룹의 혈압 평균에 차이가 있는가? (이 때 유의해야 할 점은, A그룹과 B그룹 모두 신약을 먹은 상태이거나, 두 그룹 모두 신약을 먹지 않은 상태여야 한다는 것이다) 귀 무가설: 「A와 B의 평균은 통계적으로 유의한 차이가 없다(같다)」※모든 가설 검정은 통계를 기본으로 하고 있기 때문에, 항상 오차를 수반한다. 즉, 근거는 있지만 「추측」인 것이다.
  3. 반면 대응 표본 T test는 동일 표본의 어떤 변수에 의한 사전/사후에 대한 차이를 보고자 할 때 사용된다. (A그룹이 신약을 먹기 전/마신 후 혈압 평균에 차이가 있는가.독립 표본과 검정 방법에 다르지 않다. 결국, 양쪽 모두 주어진 두 데이터의 평균 차이를 비교하는 것이다. 다만 검정을 할 때 동일한 표본에서 추출된 사전/사후 변수가 비교돼야 한다는 점을 유의하면 된다.변수에 의한 사전과 사후는 통계적으로 유의한 차이가 없다(=신약을 먹은 후에도 복용 전과 유의한 차이가 없다).
  4. 2 . 단일표본 T test ( One sample T test ) vs 2 표본 T test ( Two sample T test )
  5. 단일 표본 T test는 가지고 있는 데이터의 표본이 특정 값과 차이가 있는지를 검정하는 방법이다. A그룹의 평균은 40정도인가?굳이 특정 값과 비교할 것은 없기 때문에 연구에서 별로 사용될 것은 없다고 한다. 파이썬에서는 Scipy 라이브러리를 통해 다음 코드로 실행된다.2 표본 T test는 두 데이터의 평균 차이를 비교함으로써 일반적으로 이루어지는 T 검정법이다. 위의 독립 표본 test/대응 표본 test의 예가 포함된다고 이해하면 된다.파이썬으로 아래 코드에서 실행된다(평균값을 넣는 것이 아니라 그룹의 데이터 전체가 들어있는 list/data frame 행 또는 열/series를 넣는 것에 주의하자)
  6. 2개 표본 Ttest를 파이썬으로 시행하기 전에는 두 표본의 분산이 동일한지 확인해야 한다. 이 때문에 등분산검정 중 하나인 levene 검정을 시행하고, pvalue가 0.05보다 크면 두 표본의 분산이 같고, 작으면 두 표본의 분산이 다르다고 판단할 수 있다.3. 한쪽 (One tail or One side) T test vs 양쪽 (Twotail or Two side) T test는 평균 “차이”를 확인하는 검정방법이다. ‘차이’라는 것은 ‘같다/다를 수도 있지만, ‘크다/작다’가 될 수도 있다. 이 때 “같은/다른” 을 확인하는 것을 twotail(또는 two side) T test라고 하며, “큰/작은” 을 확인하는 것을 one tail(또는 one side) T test라고 한다.
  7. 아래의 정규 분포도를 보았을 때, ‘같다’는 것은 크지도 작지도 않음을 의미하므로, 연두색과 주황색의 twoside를 모두 확인해야 한다. 그래서 ‘같다/다르다’는 twoside 라고 칭해지는데, 크거나 작으면 크거나 작으면 되니까, (같아도 상관없는) 주황색(큰) 또는 연두색(작은) 부분만 확인하면 된다. 그러므로 one side라 불린다. 정규 분포 양단의 좁아지는 부분을 tail이라 하는데, T 검정에서 귀무가설을 채택할지 여부를 결정하는 pvalue(유의확률)가 tail에 위치하기 때문에 one tail/twotail이라 부르기도 한다.
  8. ‘크다’를 검정하는 단계를 ‘greater thantest’라고 하고, ‘작다’를 검정하는 단계를 ‘less thantest’라고 한다. 귀무설은 다음과 같다. 주의해야 할 점은, 귀무 가설이 크지 않기/작지 않기 때문이지만, 그 이유는 기각 영역, 즉 아래의 그림의 주황색(큰 경우)/초록(작은 경우)을 제외한 부분이 「같다(초록+주황색을 제외한 부분)」를 포함하기 때문이다.<Greater thantest> 귀무 가설:「A의 평균은 B의 평균보다 크지 않다」대안 가설:「Greater thantest」의 평균은 B의 평균보다 크다.
  9. <Les thantest> 귀무 가설: “A의 평균은 B의 평균보다 작지 않다” 대안 가설: “A의 평균은 B의 평균보다 작다”

T검정 해석 T검정의 해석은 크게 연구자가 설정한 신뢰도, 알파값(유의수준), 그리고 t값으로부터 도출된 pvalue에 기초해 이루어진다(t값으로부터 p값을 도출하는 공식은 구글링.).

신뢰도: 연구자가 설정한 값으로 어느 정도 오차범위를 허용하느냐에 따라 달라진다. 보통 95%가 일반적이고 90%까지 결정하기도 한다고 한다. T검정을 하는 사람 마음대로지만 신뢰도에 따라 귀무가설 채용 여부가 달라지므로 신중하게 설정해야 한다.유의 수준:(1-신뢰도)/100. 즉, 신뢰도가 95%이면 유의 수준이 0.05이며, pvalue에 의해서 귀무가설의 채용의 가부를 결정하는 기준이 된다.Pvalue(유의 확률):양 비교 대상간의 차이가 얼마나 다른가를 0에서 1 사이의 값으로 나타낸 수치이다. 1에 가까울수록 같고 0에 가까울수록 다르다.

  1. 쌍방 검정의 T검정해석 신뢰도 95%, 유의수준 0.05인 경우 P value > 0.05: 귀무가설의 채용 = A와 B(2표본) 또는 A와 특정값(단일표본)은 같다(=변하지 않는다).Pvalue < 0.05 : 귀무가설 기각 = A와 B(2표본) 또는 A와 특정 값(단일 표본)이 같다고는 말할 수 없다.만약 P value가 0.05에서 0.1사이가 나온 경우는 애매하기 때문에 재검정을 하는 경우도 있다. 0.05를 기각 역에 포함시킬 수 있을지도 연구자의 마음이다.
  2. 2. 단, 측정검정의 T 검정해석 신뢰도 95%, 유의수준 0.05 의 경우 Pvalue/2 > 0.05, tvalue >= 0 : Lessthan 귀무가설 채택 A 는 B (2 표본) 또는 A 는 특정 값 (단일 표본) 보다 작지 않다.Pvalue/2 < 0.05, tvalue < 0: Lessthan 귀무 가설 기각 A는 B(2표본) 또는 A는 특정값(단일 표본)보다 작다.Pvalue/2 > 0.05, tvalue < = 0: Greaterthan 귀무가설 채택 A는 B(2표본) 또는 A는 특정값(단일 표본)보다 크지 않다.Pvalue/2 < 0.05, tvalue > 0: Greaterthan 귀무가설 기각 A는 B(2표본) 또는 A는 특정값(단일 표본)보다 크다.파이톤으로 테스트해 보는 독립표본인지 대응표본인지는 표본에 따라 달라지지만 검정방법이나 해석은 틀림없다.검정방법은 표본의 수, 즉 표본이 하나인지 vs 둘인지=비교값을 정확히 알고 있는지 vs 모르는 두 표본간의 비교인지에 따라 나뉘며 해석방법은 동일 비교인지 소비교인지에 따라 다르다.표본이 1개인 경우는 거의 없고 위에서 간단히 언급했으므로 표본이 2개인 경우 – 단측 vs 양측 T test를 예로 들어 이해해 보자.
  3. Q. 게임 장르 중 스포티스와 액션이라는 두 장르의 매출은 다른가. Q. 게임 장르 중 스포티스와 액션이라는 두 장르의 매출액은 큰가. (한쪽 비교)

statistic = T value

  1. 쌍방검정 및 해석의 실시결과 p value가 0.2505…다.해당 가격을 통해 우리는 유의 수준 0.05이고 p value가 유의 수준보다 크기 때문에 굼커서를 채택할 수 있다. 즉, 스포트의 매출액은 Action의 매출액은 변하지 않는다’라고 해석할 수 있다.
  2. 2. 단측검정 및 해석의 실시결과 p value/2=약 0.1252…한편 t value는 위로부터 변하지 않으므로 1.149…이다.따라서 ‘유의수준 0.05 에서 p value/2 가 유의수준보다 크고 t value 가 0 보다 크므로 Sports 의 매출액은 Action 의 매출액보다 작지 않다.’라고 풀이할 수 있다.
  3. 결론적으로 보면 1회가 두 번에 포함되는 말이지만, 여기서 언급했듯이 작지 않다는 듯 크고 합쳐진 말이었기 때문이다. 그러나, 같은 데이터 세트에 유의수준을 동일하게 설정한 경우, 항상 양측검정의 결과값이 단측의 검정에 포함되는 것은 아니다. 예를 들어 어떤 데이터의 A, B그룹을 비교한 p값이 0.06이 나왔다면 유의수준 0.05기준, 쌍방검정이라고 해석했을 때는 굼카서를 채택하기 위해 ‘A와 B의 평균은 통계적으로 같다’라고 말할 수 있다. 그러나 동일한 유의수준에서 단측 검정해석을 하면 p값이 0.03이 되므로 굼커서가 기각되어 ‘작다’ 또는 ‘크다’는 결론이 나왔다. 이유는 p값은 클래스로 나누었지만 유의 수준은 그대로 두고 오차를 허용하는 범위가 더 넓어졌기 때문이다. 쌍방의 검정을 했을 때는 5%를 인정해주었다면 왼손(작다)으로 2.5%/오른쪽(높다)으로 2.5%를 나눠 적용받아야 하지만 단측검정은 5%가 한쪽에만 적용되면 된다.

error: Content is protected !!