항목에 대한 반응 이론 - 응용 및 시험

항목에 대한 반응 이론 - 응용 및 시험 / 실험 심리학

분야 내 심리적 측정 이론 현재 "Item Response의 이론"(F.M. Lord, 1980)이라는 이름을 가진 여러 종파가 출현했습니다. 이 교단은 고전적 모델과 관련하여 몇 가지 차이점을 제시한다. 1. 대상의 점수의 기대 값과 특성 (가치에 대한 책임 특성) 간의 관계는 일반적으로 선형 적이 지 않다. 2. 규범 적 그룹의 특성을 언급하지 않고도 개별 예측을하는 것을 목표로 함..

당신은 또한에 관심이있을 수 있습니다 : 고전 테스트 이론 색인
  1. 시험 이론에서 잠재적 인 특성의 항목 또는 모델에 대한 반응의 이론
  2. 항목 응답 이론 (tri)의 모델
  3. 매개 변수 추정
  4. 테스트 건설
  5. 항목 응답 이론의 응용
  6. 점수의 해석

시험 이론에서 잠재적 인 특성의 항목 또는 모델에 대한 반응의 이론

이 항목에 대한 응답의이 이론은 개인뿐만 아니라 항목을 개별적으로 설명 할 수있는 가능성을 제공합니다. 또한 주제에 의해 주어진 응답이 고려 된 범위에있는 기술의 수준에 달려 있다고 간주합니다. 이 모델의 기원은 라자르 스펠트 (Lazarsfeld, 1950)가 "잠재 성 (latent trait)"이라는 용어를 도입 한 데서 기인한다. .

여기에서 각 개체는 특성의 특성을 담당하는 개별 매개 변수 ( "특성"이라고도 함)가 있다고 간주됩니다. 이 기능은 직접 측정 할 수 없으므로 개별 매개 변수를 잠재 변수라고합니다. 테스트를 적용 할 때 실제 점수와 체력 척도의 두 가지 다른 점을 얻을 수 있습니다. 같은 그룹에 대해 동일한 적합성에 대해 두 번의 테스트를 통과하면.

잠복 성의 이론 또는 항목에 대한 반응 이론 진정한 점수는 관찰 된 점수에서 기대되는 가치입니다. 주님에 따르면, 진정한 점수와 적합성은 같은 것이지만 측정의 다른 척도로 표현됩니다..

항목 응답 이론 (tri)의 모델

이항 오차 모형 (Binomial Error Models) : Lord (1965)에 의해 소개되었는데, 관찰 된 점수는 시험에서 얻은 정답의 수와 일치한다고 가정한다. 그 항목은 모두 같은 어려움을 겪고 있고 지역 독립성을 가지고있다. 즉, 어떤 항목에 올바르게 응답하는 것은 다른 항목에 주어진 답의 영향을받지 않는다).

푸 아송 모델:이 모델은 많은 수의 항목이 있고 올바른 답이나 틀린 답의 확률이 작은 테스트에 적합합니다. 이 그룹 내에서 차례로, 우리는 다른 모델을 가지고 :

  1. 래쉬의 포아송 모델, 각 테스트는 지역적으로 독립적 인 다수의 바이너리 항목을 가지고있다. 각 항목의 오류 확률은 작습니다. 피험자가 오류를 만들 가능성은 두 가지로 테스트의 어려움과 피험자의 적성에 달려 있습니다. 하나의 시험에서 2 개의 동등한 시험을 섞은 결과로 이해되는 어려움의 가중 성은 두 가지 초기 시험의 어려움을 합한 것입니다.
  2. 속도를 평가하는 포아송 모델 : 이 모델은 또한 Rasch에 의해 제안되었으며 테스트의 실행 속도가 고려 되었기 때문에 특징이 있습니다. 모델은 커밋 된 오류 수와 시간 단위로 읽은 단어 수를 계산하는 두 가지 방법으로 제안 할 수 있습니다. 커밋 된 오류 수와 텍스트 읽기를 완료하는 데 걸린 시간을 계산하십시오. 시험 (i)에서 시간 (t) 동안 대상 (j)에 의해 특정 수의 단어가 실현 될 확률
  3. Ojiva 일반 모델: Lord (1968)에 의해 제안 된 모형으로, 이분법 항목과 하나의 변수만으로 공통적으로 사용되는 그래프이다.이 그래프는 다음과 같다 :이 모델을 특징 짓는 기본 가정은 다음과 같다 :
  • 잠재 변형의 공간은 1 차원 (k = 1)이고,.
  • intems 사이의 지역 독립성.
  • 잠재 변수에 대한 메트릭은 각 항목의 곡선이 정상 탄두가되도록 선택 될 수있다.

물류 모델; 그것은 이전 모델과 매우 유사한 모델이지만 그것의 수학적 처리에 비해 더 많은 장점을 가지고 있습니다. Logistic 함수는 다음과 같은 형식을 취합니다. 매개 변수의 수에 따라 다른 물류 모델이 있습니다.

  • 2 매개 변수 물류 모델, Birnbaum 1968 년, 그것의 특성 중 우리는 1 차원이다, 현지 독립이있다, 성분은 dichotomous, 등등이다.
  • 3 매개 변수 물류 모델, 주님은 점에 의한 타격의 가능성이 시험의 수행에 영향을 줄 수있는 요소이기 때문에 특징 지워집니다. 4.3. 4 매개 변수 물류 모델 : 1981 년 McDonald 1967 및 Barton-Lord에서 제안한 모델로 높은 적합도를 가진 피험자가 항목에 올바르게 응답하지 않는 경우를 설명하기위한 것입니다.
  • Rasch의 물류 모델 : 이 모델은 단점을 가지고 있음에도 불구하고 가장 많은 수의 일자리를 창출 한 모델입니다. 실제 데이터에 대한 조정이 더 어렵 기 때문입니다. 그러나 이와 대조적으로이 모델은 커다란 작업이 필요하지 않습니다. 조정을위한 샘플 크기.

매개 변수 추정

가장 많이 사용 된 방법은 Maximum Likelihood이며,이 방법 옆에 Newton-Raphson 및 Scoring (Rao)과 같은 수치 근사 절차가 사용됩니다. Maximum Likelihood Method는 상기 샘플들을 얻을 확률을 최대화하는 미지의 파라미터들의 추정기를 얻는 원리에 기초한다. 최대 우도 (Maximum Likelihood) 외에도 베이 즈 정리 (Bayes Theorem)에 기초한 베이지안 추정 (Bayesian Estimation)도 사용됩니다. 베이 즈 정리는 추론을하는 과정과 관련된 모든 알려진 정보를 선행 적으로 통합합니다. 적합성 매개 변수의 추정을위한 베이지안 방법에 대한 더 심층적 인 연구는 Birnbaum (1996)과 Owen (1975)의 방법이다. .

정보 기능

구축 할 수있는 가장 좋은 테스트는 잠복성에 관한 가장 많은 정보를 제공하는 테스트입니다. 이 정보의 정량화는 "정보 기능"을 통해 수행됩니다. 정보 기능의 공식 Birnbaum 1968은 다음과 같다 : 테스트에서 얻은 정보는 각 항목의 정보의 합계이며, 각 항목의 기여도는 나머지 항목에 의존하지 않는다는 것을 고려해야한다 테스트를 구성합니다. 일반적으로 모든 모델에서 정보를 말할 수 있습니다.

  • 체력 수준에 따라 다르다..
  • 곡선의 기울기가 클수록 더 많은 정보.
  • 점수의 차이에 따라 다르지만, 점수가 높을수록 정보가 적습니다..

테스트 건설

첫 번째 과제 테스트를 구성 할 때 가장 중요한 요소 중 하나는 테스트 할 기능을 정의해야하는 이론적 가정의 이전 코드입니다. 개념 "항목 분석"은 최종적으로 테스트를 구성 할 항목을 선택하기 위해 수행되는 일련의 공식 절차를 나타냅니다. 항목과 관련성이 가장 높은 것으로 간주되는 정보는 다음과 같습니다.

  1. 항목의 난이도, 답변 한 개인의 비율.
  2. 차별, 테스트에서 총점과 각 항목의 상관 관계.
  3. distractors 또는 오류 분석, 그 영향력은 관련이 있으며, 항목의 어려움에 영향을 미치고 차별의 가치를 과소 평가하게합니다.

다른 지표의 지표를 수립 할 때 통계 또는 지표가 일반적으로 사용되며 다음이 가장 많이 사용됩니다.

색인 난이도 색인 차별 신뢰성 색인 유효 색인 유효성 검사를 구성 할 항목을 선택할 때 반드시 알아야하는 알려진 색인으로 시험 구성에 필요한 단계를 알 수 있습니다.

  1. 문제 사양.
  2. 광범위한 항목을 강조 표시하고 디버깅합니다..
  3. 모델의 선택.
  4. 사전 선택된 항목 테스트.
  5. 최고의 항목 선택.
  6. 시험의 특성을 연구하십시오.
  7. 얻은 최종 시험의 해석 규범 수립.

이전의 점에서 모형의 선택, 3 항은 시험이 추구하는 목표, 자료의 특성과 품질, 그리고 이용 가능한 자원에 달려 있음을 주목해야한다. 모델을 선택하면 적용 할 수있는 이론적 인 조건을 고려할 때 그 미덕에도 불구하고 각각의 경우와 특정 상황에서 분석해야합니다. 해당 모델에 속하는 속성은 항목에 대한 반응 이론 (TRI), 그들은 다음에 의해 영향을받을 수 있습니다 :

  • 테스트의 차원은 컴퓨터 자원의 샘플 부족의 희소성 여부 하나 또는 다른 모델을 사용할 때 여러 가지 기본 설정이 있습니다. 일반적인 탄두 모델은 일반적으로 응용 프로그램에서 사용되지 않으며 그 값은 이론적입니다..
  • Rasch : 수평 비교에 적합합니다 (비슷한 적합도 분포를 가진 난이도의 비교 가능한 테스트). 같은 테스트의 다른 형태를 가지고 있습니다. * 2 및 3 매개 변수 : 다양한 문제에 가장 잘 맞는 매개 변수입니다..
  • 잘못된 응답 패턴을 감지 할 수 있습니다. 테스트의 수직 균등화 (어려움의 각기 다른 수준의 테스트와 피트니스의 다른 분포를 비교).

1 및 2 매개 변수 :

  • 단일 규모를 구축하기에 적합하여 다양한 수준의 기술을 비교할 수 있습니다..

추구하는 목적 외에도 모델의 선택은 표본의 크기에 영향을받을 수 있습니다. 표본이 크고 대표적인 경우에는 고전적 모델이나 잠정적 특성에 문제가 없습니다. 그러나 TRI ( 항목 응답 이론 ) 작은 샘플은 적은 수의 매개 변수를 가진 모델을 선택하도록 강요합니다. 심지어 단일 매개 변수 모델.

항목 응답 이론의 응용

가장 일반적인 응용 프로그램을 살펴 보겠습니다. a) 여러 개의 테스트에서 얻은 점수와 두 가지 가능한 목적을 관련시켜야하는 테스트의 균등화 :

  • 수평 이퀄라이제이션: 그것은 동일한 시험의 다른 형태를 얻으려고 노력한다..
  • 수직 이퀄라이제이션: 목표는 어려움의 수준에 따라 적성의 단일 규모를 구축하는 것입니다. 매칭 테스트에 관해서는, (1980)는 각각의 주 피사체에 대한 두 가지 테스트가 교환과 도포 적합성 하나의 레벨을 변경하지 않을 다른 하나는 추정 할 수있는 "공정성"의 개념을 도입 주제에.

항목 바이어스에 대한 연구는 평균적으로 동일한 집단의 일부인 것으로 가정 된 특정 그룹에서 점수가 크게 다를 때 비뚤어진 다.

적응 된 테스트 또는 평균 , TRI를 통해 문제의 특성에 대한 정확한 값을보다 정확하게 추론 할 수있는 개별 테스트를 구성 할 수 있습니다. 항목은 순차적으로 관리되며 항목 또는 속성의 사전 설정은 위에 제공된 답변에 따라 달라집니다. 적응 형 테스트에는 여러 유형이 있으며, 다음 사항을 지적합니다.

  • 2 단계 절차, 1971 년 주; Bertz and Weiss 1973 - 1974. 하나의 검사가 먼저 통과되고 결과에 따라 두 번째 검사가 시행됩니다.
  • 몇 단계의 절차는 이전 단계와 동일하지만 더 많은 단계가 포함됩니다.
  • 고정 된 분기 모델, Lord 1970, 1971, 1974; Mussio 1973. 모든 주제가 동일한 항목을 해결하면 응답에 따라 일련의 항목이 해결됩니다..
  • 가변 분지 모델은 항목들과 최대 우도 추정량의 특성 사이의 독립성에 기반합니다.

상품 은행, 많은 수의 항목을 보유하면 테스트의 품질을 향상시킬 수 있지만 항목은 먼저 디버깅 프로세스를 거쳐야합니다. 항목을 분류하기 위해이 항목이 포함될 테스트를 측정하기위한 기능이 무엇인지 고려해야합니다.

점수의 해석

저울: 그 목적은 평가 된 특징의 상대적인 크기가 무엇인지를 질서, 분류 또는 알기위한 연속체를 제공하는 것이다. 이것은 우리가 그 특성과 관련하여 사람들에게 차이점과 유사점을 확립하는 것을 허용 할 것입니다. 심리학에서 사용되는 척도는 명목상, 서수상, 간격 및 이유입니다. 이러한 척도는 테스트 결과, "직접 점수"라는 결과, .

타이프 :이 점수가 그룹에 피사체의 위치를 ​​공개하고 우리가 내, 간 비교를 할 수 있도록 대표로 쉽게 해석 할 수있는 다른 사람에 원시 점수를 변환하는 것입니다 테스트를 설정합니다. 타이핑에는 두 가지 유형이 있습니다.

  1. 선형, 분포의 모양을 유지하고 상관 관계의 크기를 수정하지 않습니다..
  2. 비선형, 그들은 상관 관계의 분포 나 크기를 보존하지 않습니다. .

APTITUDE SCALE TRI에서 구축 된 축척은 체력 수준에 해당하는 축척입니다. 이 척도는 적성과 척도와 관련하여 추정과 참조가 직접 이루어지기 때문에 특징 지어집니다. 또한 추정되는 적성은 항목의 특성 곡선의 모양에 달려 있습니다. 가능한 가늠자 안에, 우리는 2을 나타낸다 :

  1. Scale, Woodcock (1978)에 의해 제안되었으며 다음 공식에 의해 정의된다 :
  2. Wright (1977)에 의해 제안 된 WITS 척도는이 척도가 이전 척도의 수정이며 다음과 같은 관계에 의해 주어진다 :

이 글은 순전히 유익한 정보이며 온라인 심리학에서는 진단을하거나 치료를 권할 교수가 없습니다. 귀하의 사례를 특별히 치료하기 위해 심리학자에게 귀하를 초대합니다..

비슷한 기사를 더 읽고 싶다면 항목에 대한 반응 이론 - 응용 및 시험, Experimental Psychology 카테고리에 들어가기를 권장합니다..