고전 시험 이론

고전 시험 이론 / 실험 심리학

테스트는 과학 도구 그것은 그것이 의도하는 바를 측정하는 범위, 즉 그것이 타당하고 적절하게 측정된다. 즉, 정확하거나 신뢰할 만하다. 그들이 제공하는 척도를 신뢰할 수없는 도구를 발견하면, 우리는 동일한 객체를 측정 할 때마다 시간이 다르기 때문에 신뢰할 수 없다고 말할 것입니다. 측정 할 계기 바르게 뭔가 틀림없이 정확해야합니다. 그렇지 않으면 측정 한 것을 측정하고 잘못 측정해야하기 때문입니다. 그러므로 정확한 것은 충분하지만 충분하지는 않습니다. 또한 유효해야합니다. 즉, 정확하게 측정 한 것은 측정하려는 것이고 다른 것은 아무것도 아닙니다..

당신은 또한 관심이있을 수 있습니다 : 항목 응답 이론 - 응용 프로그램 및 테스트

신뢰성 :

절대 및 상대 신뢰도 : 테스트의 신뢰성 문제는 두 가지 방법으로 해결할 수 있습니다. 배경에서는 일치하지만.

측정의 부정확성으로서의 신뢰성 : 시험에 응한 피험자는 오류의 영향을받는 경험적 점수를 얻습니다. 오류가 없으면 피험자는 자신의 진정한 점수를 얻습니다. 경험적 점수가 참된 점수와 일치하지 않기 때문에 테스트가 부정확합니다. 두 점수의 차이는 샘플링 오류, 측정 오류입니다. 그 측정의 전형적인 오류 ~ 될거야. 측정 오차의 표준 편차. 그 측정의 전형적인 오류 오류가없는 경우 획득 한 값과 얻은 값의 차이를 추정 할 수 있기 때문에 테스트의 절대 정확도를 나타냅니다.

측정의 안정성으로서의 신뢰성 : 테스트가 반복 될 때 제공되는 결과가보다 일정하거나 안정 될수록 테스트의 신뢰도가 높아집니다. 결과가 두 차례에 걸쳐 안정적 일수록 그 결과는 더 커집니다. 이 상관 관계를 호출 신뢰성 계수. 이것은 오류의 양이 아니라 테스트의 일관성과 그것이 제공하는 정보의 일관성을 나타내는 것입니다. 그 신뢰성 계수 시험의 상대적인 신뢰도를 나타낸다..

신뢰성 계수 및 신뢰성 지수 : - 신뢰성 계수 예를 들어 두 가지 병렬 형식으로 얻은 테스트와 자체의 상관 관계입니다 : rxx. - 정밀도 지수 시험 점수와 실제 점수 사이의 경험적 상관 관계는 다음과 같습니다 정확도 속도가 항상 주 세 고전적인 방법이있다의 신뢰성 계수를 결정하기 위해 신뢰성 계수보다 높을 것이다 RXV :

  • 테스트와 반복 사이의 상관 관계를 찾습니다. 반복 또는 테스트 - 테스트 방법 : 동일한 테스트를 두 번에 걸쳐 동일한 그룹에 적용하고 두 가지 일련의 점수 사이의 상관 관계를 계산합니다. 이 상관 관계는 신뢰성 계수입니다. 이 방법은 일반적으로 다른 절차에서 얻은 것보다 높은 신뢰도 계수를 제공하며 불안정한 요인으로 인해 오염 될 수 있습니다.
  • 두 가지 평행 형태의 시험 사이의 상관 관계를 찾으십시오 : 평행 형태의 방법 : 동일한 시험의 두 가지 평행 형태, 즉 동일한 정보를주는 두 가지 동등한 형식을 준비하고 같은 주제 그룹에 적용하십시오. 두 형식 간의 상관 관계는 신뢰성 계수입니다. 이 방법을 사용하면 동일한 테스트를 반복하지 않아도 재 테스트 신뢰성의 방해 소스는 피할 수 있습니다.
  • 테스트의 두 개의 병렬 반쪽 사이의 상관 관계를 찾습니다. 두 반쪽의 방법 : 테스트를 두 개의 반으로 나누고 두 반쪽의 상관 관계를 찾습니다. 그것은 간단하고 이전 절차의 한계를 무시하기 때문에 바람직한 방법입니다. 테스트의 홀수 요소를 선택하여 절반을 구성하고 짝수 요소를 다른 요소로 구성 할 수 있습니다.

신뢰성 계수 및 병렬 시험 간의 상관 관계

신뢰성 계수 테스트의 실제 분산은 경험적 분산의 비율을 나타냅니다. graphic33 테스트의 신뢰성 계수는 ​​0과 1 사이에서 다양합니다. 예 : 두 개의 병렬 테스트 간의 상관 관계가 rxx 인 경우´ = 0.80은 테스트의 분산의 80 %가 실제 측정으로 인한 것이며, 나머지는 테스트의 분산의 20 %가 오류로 인한 것임을 의미합니다. 그 신뢰성 지수 는 경험적 점수와 실제 점수 사이의 상관 관계입니다. 신뢰성 지수 = 신뢰성 지수는 신뢰도 계수의 제곱근과 같습니다.

두 가지 평행 형태의 시험이 개발되면, 분산 분석 절차가 적용되어 분산의 균질성과 측정치의 차이를 확인합니다. 차이가 균질하다면, 평균의 차이는 크지 않으며 두 형태는 같은 유형의 요소와 심리학 적 내용으로 구성되며, 평행하다고 말할 수 있습니다. 그렇지 않다면, 그 (것)들이 일 때까지 당신은 그 (것)들을 개혁해야한다. 신뢰성 부족은 rxx 값으로 식별됩니다.´= 0 4.- 전형적인 측정 오차 : 경험적 점수와 실제 점수의 차이는 측정 오차 라 불리는 무작위 오차입니다. 측정 오류의 표준 편차를 일반적인 측정 오류라고합니다. 그 측정의 전형적인 오류 테스트의 절대적인 신뢰성, 즉 측정 오차가 스코어에 얼마나 영향을 미치는지를 추정 할 수 있습니다.

신뢰성과 길이 : 시험의 길이는 그 요소의 수를 말한다. 신뢰성은이 길이에 달려 있습니다. 시험이 세 가지 요소로 구성되어있는 경우 한 과목은 한 번 점수가 1 점, 다른 점 또는 평행선으로 점수를받을 수 있습니다

한번은 점수가 한 점씩 달라졌습니다. 세 이상은 33 %의 차이로 높은 편차를 나타냅니다. 피실험자가이 유형의 무작위 변형을 얻으면 시험의 자체 또는 두 가지 평행 형태의 시험과의 상관 관계가 크게 줄어들고 높을 수 없습니다. 검사가 훨씬 길면, 예를 들어 100 개의 항목이있는 경우 한 번에 70 점, 평행으로 67 점을 얻을 수 있습니다. 한 점에서 다른 점까지 3 점이 변경되었습니다. 전체 테스트와 관련하여 상대적으로 작은 차이, 특히 3 %입니다. 이러한 크기의 작은 변화는 피험자의 점수에서 하나의 형식에서 평행으로 갈 때 상대적으로 중요하지 않으며 두 가지 사이의 상관 관계가 줄어들지 않을 것입니다.

신뢰성 계수는 ​​이전의 경우보다 훨씬 높을 것입니다. Spearman-Brown 방정식은 신뢰성과 길이 사이의 관계를 나타냅니다. 길이가 0 일 때 테스트의 정밀도는 0이고, 길이가 증가함에 따라 테스트의 정밀도는 증가합니다. 비록 부분의 길이가 클수록 증가량은 상대적으로 더 작지만. 즉, 처음에는 정밀도가 크게 증가하고 나중에는 상대적으로 덜 정확합니다. 길이가 무한대로 변할 때, 신뢰성 계수는

테스트의 길이를 늘리면 오류 분산보다 높은 비율로 실제 분산을 증가시키기 때문에 정확도가 높아집니다. 이는 오류로 인한 분산의 비율이 감소하기 때문에 테스트의 정확도가 높아진다는 것을 의미합니다. Rulon의 수식과 Flanagan 및 Guttman의 수식은 특히 두 반쪽의 방법으로 신뢰도를 계산할 때 적용 할 수 있습니다. 신뢰성 계수를 계산하는 공식입니다..

신뢰성과 일관성 : 신뢰성 계수는 ​​다른 방법으로도 발견 할 수 있습니다. 알파 계수 o 일반화 가능성 또는 대표성 계수 (Cronbach). 이 알파 계수는 일부 항목이 성격이나 행동의 측면을 측정하는 정확성을 나타냅니다. 다음과 같이 해석 할 수 있습니다. 특정 측면에서 가능한 모든 항목의 평균 상관 관계 추정. 일관성 또는 내부 일관성 (요소 간 상호 관계, 테스트 요소가 모두 동일하게 측정되는 정도) 및 길이에 따라 테스트의 정확성을 측정 한 값. 시험의 대표성, 즉 그것을 구성하는 항목의 표본이 동일한 유형 및 심리학 적 내용의 가능한 항목의 모집단을 대표하는 양. 그 알파 계수 주로 테스트의 정밀도에있어 두 가지 기본 개념을 반영합니다. 1. 요소 간의 상관 관계 : 모든 요소가 동일한 것을 측정하는 정도.

검사의 길이 : 표본의 수를 늘리고 체계적인 오류가 제거되면 표본은 모집단을 추출한 것보다 더 잘 나타내므로 실수로 인한 오류가 더 적을 가능성은 낮습니다. 테스트 항목이 이항 (예 또는 아니오, 1 또는 0, 일치 또는 불일치 등) 인 경우 알파 계수의 수식이 단순화되어 다음과 같은 방정식이 발생합니다. Kuder-Richardson (KR20 및 KR21). 특정 수의 항목이 주어지면보다 균질성이있는 테스트가 더욱 안정적으로 수행됩니다. 알파 계수는 시험 요소의 균질성 및 일관성 또는 내부 일관성을 나타낼 때 안정성을 나타냅니다..

표준 및 신뢰성 기준

항목의 샘플 공간 모델에 따르면, 테스트의 목적은 샘플 공간의 모든 항목을 사용한 경우에 얻을 수있는 측정 값을 추정하는 것입니다. 이 측정 값은 실제 측정 값이 대략적인 근사치 인 실제 스코어가됩니다. 항목의 샘플이 실제 점수와 얼마나 관련이 있는지에 따라 테스트는 다소 신뢰성이 있습니다. 이 모델에서는 샘플 공간의 모든 항목 간의 상관 관계 행렬이 중심이며,이 샘플 모델은 내부 일관성을보다 직접적으로 주장하며 실현되는 한 간접적으로 안정성을 보장합니다..

선형 테스트 모델은 점수의 안정성을 더 강조하며, 안정성을 달성 할 때까지는 간접적으로 내부 일관성을 선호합니다. 우리가 개별적인 진단과 예측을 확립하기위한 테스트를 적용 할 경우, 신뢰성 계수는 ​​0.90 증가해야합니다. 예측 및 집단 분류에서는 0'90에서 0'80으로 크게 벗어나기는 쉽지 않지만 그렇게 많은 요구 사항은 아닙니다..

때로는 성격 검사와 같은 특정 종류의 검사에서 0.70 이상의 계수를 얻는 것이 어렵습니다. 평행 한 형태 또는 평행 반을 다소간 큰 간격으로 적용하면 알파 계수에 영향을주는 실수보다 실수가 더 많이 발생할 수 있습니다. 상관 관계를 줄이는 것은 테스트에 고유 한 무작위 오류뿐만 아니라 알파 계수를 고려하는 단일 상황 일뿐만 아니라 두 가지 상황에서 발생할 수있는 모든 오류에도 영향을 미치기 때문입니다 수많은 세부 사항에서 다를 수 있습니다. 따라서 알파 계수는 일반적으로 다른 계수보다 큽니다..

동일한 테스트를 반복하여 찾은 계수를 제외하고는 첫 번째 응용 프로그램의 무작위 오류가 두 번째 응용 프로그램에서 반복 될 확률이 더 높아지고 둘 사이의 상관 관계를 줄이는 대신 확률이 높아집니다. 두 번째 응용 프로그램이 첫 번째 응용 프로그램과 완전히 독립적이어야합니다. 우리가 이것을 달성한다면, 이것은 가장 쉽고 가장 저렴한 방법 일 것이고, 특히 오랜 기간 동안 복잡한 테스트를 통해 점수의 안정성을 평가하려고 할 때 권장됩니다. > 다음 : 테스트의 유효성

이 글은 순전히 유익한 정보이며 온라인 심리학에서는 진단을하거나 치료를 권할 교수가 없습니다. 귀하의 사례를 특별히 치료하기 위해 심리학자에게 귀하를 초대합니다..

비슷한 기사를 더 읽고 싶다면 고전 시험 이론, Experimental Psychology 카테고리에 들어가기를 권장합니다..