Principal Otro Teoría de la respuesta al ítem

Teoría de la respuesta al ítem

Descripción general

Software

Descripción

Sitios web

Lecturas

Cursos

Descripción general

La teoría de la respuesta al ítem (TRI), también conocida como la teoría de la respuesta latente, se refiere a una familia de modelos matemáticos que intentan explicar la relación entre los rasgos latentes (característica o atributo no observable) y sus manifestaciones (es decir, resultados, respuestas o desempeño observados). Establecen un vínculo entre las propiedades de los elementos de un instrumento, los individuos que responden a estos elementos y el rasgo subyacente que se mide. IRT asume que el constructo latente (por ejemplo, estrés, conocimiento, actitudes) y los elementos de una medida están organizados en un continuo no observable. Por lo tanto, su propósito principal se centra en establecer la posición del individuo en ese continuo.

Descripción

Teoría clásica de la prueba
La teoría clásica de los tests [Spearman, 1904, Novick, 1966] se centra en el mismo objetivo y antes de la conceptualización de la TRI; se utilizaba (y se sigue utilizando) para predecir el rasgo latente de un individuo en función de una puntuación total observada en un instrumento. En CTT, la puntuación real predice el nivel de la variable latente y la puntuación observada. El error se distribuye normalmente con una media de 0 y una DE de 1.

Teoría de la respuesta al ítem frente a la teoría clásica de las pruebas

Supuestos de IRT

1) Monotonicidad: el supuesto indica que a medida que aumenta el nivel del rasgo, también aumenta la probabilidad de una respuesta correcta 2) Unidimensionalidad: el modelo asume que se está midiendo un rasgo latente dominante y que este rasgo es la fuerza impulsora de las respuestas observadas para cada ítem de la medida 3) Independencia local - Las respuestas dadas a los ítems separados en una prueba son mutuamente independientes dado un cierto nivel de habilidad.4) Invarianza - Se nos permite estimar los parámetros del ítem desde cualquier posición en la curva de respuesta del ítem. En consecuencia, podemos estimar los parámetros de un ítem de cualquier grupo de sujetos que hayan respondido al ítem.

Si los supuestos se mantienen, las diferencias en la observación de las respuestas correctas entre los encuestados se deben a la variación en su rasgo latente.
Función de respuesta del artículo y curva característica del artículo (ICC)

Los modelos IRT predicen las respuestas de los encuestados a los ítems de un instrumento en función de su posición en el continuo de rasgos latentes y las características de los ítems, también conocidos como parámetros. La función de respuesta al ítem caracteriza esta asociación. El supuesto subyacente es que cada respuesta a un ítem en un instrumento proporciona cierta inclinación sobre el nivel del rasgo o habilidad latente del individuo. La capacidad de la persona (θ) en términos simples es la probabilidad de respaldar la respuesta correcta para ese ítem. Como tal, cuanto mayor es la capacidad del individuo, mayor es la probabilidad de una respuesta correcta. Esta relación se puede representar gráficamente y se conoce como la curva característica del elemento. Como se muestra en la figura, la curva tiene forma de S (Sigmoide / Ojiva). Además, la probabilidad de respaldar una respuesta correcta aumenta monótonamente a medida que aumenta la capacidad del encuestado. Cabe señalar que, teóricamente, la habilidad (θ) varía de -∞ a + ∞, sin embargo, en las aplicaciones, generalmente varía entre -3 y + 3.

Parámetros del artículo

datos interesantes sobre el ébola

A medida que varían las habilidades de las personas, su posición en el continuo del constructo latente cambia y está determinada por la muestra de encuestados y los parámetros de los elementos. Un ítem debe ser lo suficientemente sensible para calificar a los encuestados dentro del continuo no observable sugerido.


La dificultad del elemento (bi) es el parámetro que determina la forma en que el elemento se comporta a lo largo de la escala de habilidades. Se determina en el punto de probabilidad media, es decir, la capacidad en la que el 50% de los encuestados respalda la respuesta correcta. En la curva de características de un ítem, los ítems que son difíciles de respaldar se desplazan a la derecha de la escala, lo que indica la mayor capacidad de los encuestados que lo respaldan correctamente, mientras que los que son más fáciles se desplazan más a la izquierda de la escala de capacidad. .

La discriminación de objetos (ai) determina la velocidad a la que la probabilidad de aprobar un objeto correcto cambia determinados niveles de habilidad. Este parámetro es imperativo para diferenciar entre individuos que poseen niveles similares del constructo latente de interés. El propósito último, para diseñar una medida precisa, es incluir elementos con alta discriminación, para poder mapear a los individuos a lo largo del continuo del rasgo latente. Por otro lado, los investigadores deben tener cuidado si se observa que un elemento tiene una discriminación negativa porque la probabilidad de respaldar la respuesta correcta no debe disminuir a medida que aumenta la capacidad del encuestado. Por lo tanto, se debe realizar una revisión de estos elementos. La escala de discriminación de ítems, teóricamente, varía de -∞ a + ∞; y por lo general no excede de 2; por lo tanto, de manera realista oscila entre (0,2)

Adivinar (ci) Adivinar un elemento es el tercer parámetro que explica la adivinación de un elemento. Restringe la probabilidad de aprobar la respuesta correcta a medida que la capacidad se acerca a -∞.

Invarianza de la población En términos simples, los parámetros de los elementos se comportan de manera similar en diferentes poblaciones. Este no es el caso cuando se sigue el CTT en la medición. Como la unidad de análisis es el elemento en la TRI, la ubicación del elemento (dificultad) se puede estandarizar (experimentar una transformación lineal) entre poblaciones y, por lo tanto, los elementos se pueden comparar fácilmente. Una nota importante que agregar es que incluso después de la transformación lineal, las estimaciones de los parámetros derivadas de dos muestras no serán idénticas, la invariancia como el nombre indica se refiere a la invariancia de la población y, por lo tanto, se aplica solo a los parámetros de la población de elementos.

Tipos de modelos de IRT

Modelos unidimensionales Los modelos unidimensionales predicen la capacidad de los elementos que miden un rasgo latente dominante.
Modelos IRT dicotómicos
Los modelos IRT dicotómicos se utilizan cuando las respuestas a los elementos de una medida son dicotómicas (es decir, 0,1)

El modelo logístico de 1 parámetro

El modelo es la forma más simple de modelos IRT. Se compone de un parámetro que describe el rasgo latente (habilidad - θ) de la persona que responde a los ítems, así como otro parámetro para el ítem (dificultad). La siguiente ecuación representa su forma matemática:

El modelo representa la función de respuesta al ítem para el modelo logístico de 1 parámetro que predice la probabilidad de una respuesta correcta dada la capacidad del encuestado y la dificultad del ítem. En el modelo 1-PL, el parámetro de discriminación es fijo para todos los ítems y, en consecuencia, todas las curvas de características del ítem correspondientes a los diferentes ítems de la medida son paralelas a lo largo de la escala de capacidad. La figura muestra 5 ítems, el que está más a la derecha es el más difícil y probablemente estaría correctamente respaldado por aquellos con mayor capacidad.

Función de información de prueba

§ Es la suma de probabilidades de avalar la respuesta correcta para todos los ítems de la medida y, por tanto, estima la puntuación esperada de la prueba.
§ En esta figura, la línea roja representa la probabilidad conjunta de los 5 elementos (negro)

La función de información del artículo
Muestra la cantidad de información que proporciona cada ítem y se calcula multiplicando la probabilidad de respaldar una respuesta correcta por la probabilidad de responder incorrectamente.

Cabe señalar que la cantidad de información en un nivel de habilidad dado es la inversa de su varianza, por lo tanto, cuanto mayor sea la cantidad de información proporcionada por el ítem, mayor será la precisión de la medición. A medida que la información del elemento se representa en función de la capacidad, un gráfico revelador muestra la cantidad de información proporcionada por el elemento. Los elementos medidos con más precisión, brindan más información y se representan gráficamente para ser más largos y estrechos, en comparación con sus contrapartes que brindan menos información. El vértice de la curva se corresponde con el valor de bi: la capacidad en el punto de probabilidad media. La cantidad máxima de información proporcionada se daría cuando la probabilidad de contestar correcta o incorrectamente sea igual, es decir, 50%. Los ítems son más informativos entre los encuestados que representan todo el continuo latente y especialmente entre aquellos que tienen un 50% de posibilidades de responder de cualquier manera.

Estimación de la capacidad
El supuesto de independencia local establece que las respuestas a los ítems deben ser independientes y estar asociadas únicamente a través de la capacidad. Esto nos permite estimar la función de probabilidad del patrón de respuesta individual para la medida administrada mediante la multiplicación de las probabilidades de respuesta del ítem. A continuación, mediante un proceso iterativo, se calcula la estimación de máxima probabilidad de capacidad. Simplemente, la estimación de máxima verosimilitud nos proporciona las puntuaciones esperadas para cada individuo.

El modelo de Rasch frente a los modelos logísticos de 1 parámetro
Los modelos son matemáticamente iguales, sin embargo, el modelo de Rasch restringe la discriminación de elementos (ai) a 1, mientras que el modelo logístico de 1 parámetro se esfuerza por ajustar los datos tanto como sea posible y no limita el factor de discriminación a 1. En el modelo de Rasch Modelo, el modelo es superior, ya que se preocupa más por desarrollar la variable que se utiliza para medir la dimensión de interés. Por lo tanto, al construir un ajuste de instrumento, el modelo de Rasch sería el mejor, mejorando la precisión de los elementos.

El modelo logístico de 2 parámetros


El modelo logístico de dos parámetros predice la probabilidad de una respuesta exitosa usando dos parámetros (dificultad bi y discriminación ai).
Se permite que el parámetro de discriminación varíe entre elementos. En adelante, el ICC de los diferentes elementos puede cruzarse y tener diferentes pendientes. Cuanto más pronunciada sea la pendiente, mayor será la discriminación del ítem, ya que podrá detectar sutiles diferencias en la capacidad de los encuestados.

La función de información del artículo

Como es el caso del Modelo 1-PL, la información se calcula como el producto entre la probabilidad de una respuesta correcta e incorrecta. Sin embargo, el producto se multiplica por el cuadrado del parámetro de discriminación. La implicación es que, cuanto mayor sea el parámetro de discriminación, mayor será la información proporcionada por el ítem. Dado que se permite que el factor de discriminación varíe entre los elementos, los gráficos de la función de información del elemento también pueden verse diferentes.

Estimación de la capacidad
Con el modelo 2-PL, el supuesto de independencia local aún se mantiene y se utiliza la estimación de máxima verosimilitud de la capacidad. Aunque las probabilidades de los patrones de respuesta todavía se suman, ahora están ponderadas por el factor de discriminación de ítems para cada respuesta. Sus funciones de probabilidad, por lo tanto, pueden diferir entre sí y alcanzar un pico en diferentes niveles de θ.

El modelo logístico de 3 parámetros


El modelo predice la probabilidad de una respuesta correcta, de la misma manera que el modelo 1 - PL y el modelo 2 PL - pero está restringido por un tercer parámetro llamado parámetro de adivinación (también conocido como parámetro de pseudo azar), que restringe la probabilidad de respaldar una respuesta correcta cuando la capacidad del encuestado se acerca a -∞. A medida que los encuestados responden a un elemento adivinando, la cantidad de información proporcionada por ese elemento disminuye y la función del elemento de información alcanza su punto máximo a un nivel más bajo en comparación con otras funciones. Además, la dificultad ya no está demarcada en la probabilidad media. Los elementos respondidos con adivinanzas indican que la habilidad del encuestado es menor que su dificultad.

Ajuste del modelo
Una forma de elegir qué modelo encajar es evaluar el ajuste relativo del modelo a través de sus criterios de información. Se comparan las estimaciones de AIC y se elige el modelo con el AIC más bajo. Alternativamente, podemos utilizar la Chi-cuadrado (Desviación) y medir el cambio en la razón de loglikelihood 2 *. Como sigue una distribución de chi-cuadrado, podemos estimar si los dos modelos son estadísticamente diferentes entre sí.

Otros modelos de IRT

Incluya modelos que manejen datos politómicos, como el modelo de respuesta calificada y el modelo de crédito parcial. Estos modelos predicen la puntuación esperada para cada categoría de respuesta. Por otro lado, otros modelos de TRI, como los modelos de respuesta nominal, predicen las puntuaciones esperadas de los individuos que responden a elementos con categorías de respuesta desordenadas (por ejemplo, Sí, No, Quizás). En este breve resumen, nos enfocamos en modelos de TRI unidimensionales, relacionados con la medición de un rasgo latente; sin embargo, estos modelos no serían apropiados en la medición de más de un constructo o rasgo latente. En este último caso, se aconseja el uso de modelos de TRI multidimensionales. Consulte la lista de recursos a continuación para obtener más información sobre estos modelos.

programas smp con enlace

Aplicaciones

Los modelos IRT se pueden aplicar con éxito en muchos entornos que aplican evaluaciones (educación, psicología, investigación de resultados de salud, etc.). También se puede utilizar para diseñar y perfeccionar escalas / medidas al incluir elementos con alta discriminación que aumentan la precisión de la herramienta de medición y reducen la carga de responder cuestionarios largos. Como la unidad de análisis del modelo TRI es el elemento, se pueden utilizar para comparar elementos de diferentes medidas siempre que midan el mismo constructo latente. Además, se pueden utilizar en el funcionamiento diferencial de los ítems, con el fin de evaluar por qué los ítems que se calibran y prueban, todavía se comportan de manera diferente entre los grupos. Esto puede conducir a la investigación para identificar los agentes causales detrás de las diferencias en las respuestas y vincularlos con las características del grupo. Finalmente, se pueden utilizar en pruebas adaptativas computarizadas.

Lecturas

Libros de texto y capítulos

  • Hambleton, R. K. y Swaminathan, H. (1985). Principios y aplicaciones de la teoría de respuesta al ítem. Boston, MA: Editorial Kluwer-Nijhoff. Disponible aquí y aquí

  • Embretson, Susan E. y Steven P. Reise. Teoría de la respuesta al ítem. Prensa de psicología, 2013. Disponible aquí

  • Van der Linden, W. J. y Hambleton, R. K. (Eds.). (1997). Manual de teoría moderna de respuesta a ítems. Nueva York, NY: Springer. Disponible aquí

Estos tres libros (Principios y aplicaciones de la teoría de la respuesta al ítem, Teoría de la respuesta al ítem y Manual de la teoría moderna de la respuesta al ítem) proporcionan al lector los principios fundamentales de los modelos IRT. Sin embargo, no incluyen actualizaciones recientes ni paquetes de software IRT.

  • DeMars C. Teoría de la respuesta al ítem. Cary, Carolina del Norte, Estados Unidos: Oxford University Press, Estados Unidos; 2010. Disponible aquí y aquí

En 138 páginas, DeMars C. ha logrado producir un recurso sucinto pero extremadamente informativo que no deja de desmitificar el más difícil de los conceptos de IRT. El libro es un libro introductorio que aborda los supuestos, parámetros y requisitos del IRT y luego procede a explicar cómo se pueden describir los resultados en los informes y cómo los investigadores deben considerar el contexto de la administración de la prueba, la población de encuestados y el uso efectivo de las puntuaciones.

  • Ayala RJd. La teoría y la práctica de la teoría de la respuesta al ítem. (2009). Novedades sobre libros de referencia y de investigación, 24 (2). Disponible aquí

La teoría y la práctica de la teoría de la respuesta al ítem es un libro aplicado que está orientado al practicante. Proporciona una explicación detallada de los modelos IRT unideminsional y multidimensional, destacando el desarrollo conceptual y los supuestos de cada modelo. Luego procede a demostrar los principios subyacentes del modelo a través de ejemplos vívidos.

El libro se desarrolló pensando en los profesionales de la investigación del comportamiento. Les brinda ayuda para navegar por los métodos estadísticos que utilizan R. El capítulo 8 se centra en la teoría de la respuesta a los elementos y ofrece un conjunto de notas y una gran cantidad de ejemplos anotados.

  • Una guía visual de la teoría de la respuesta al ítem por Ivailo Partchev, Friedrich-Schiller-Universität Jena (2004)

Como sugiere el nombre, la guía proporciona una representación visual de los conceptos básicos de IRT. Los subprogramas de Java impregnan el texto y facilitan el seguimiento mientras se explican estos conceptos básicos. Excelente recurso, y recomendaría leerlo un par de veces y practicar con los applets.

  • Baker, Frank (2001). Los fundamentos de la teoría de la respuesta al ítem. ERIC Clearinghouse on Assessment and Evaluation, Universidad de Maryland, College Park, MD

Un libro único en su clase, que se centra en ofrecer al lector la alegría de adquirir los conceptos básicos de la teoría de la TRI sin profundizar en las complejidades matemáticas.

  • Thissen, D. y Wainer, H. (Eds.). (2001). Prueba de puntuación. Mahwah, Nueva Jersey: Lawrence Erlbaum. Disponible aquí y aquí

  • Señor, F.M. (1980). Aplicaciones de la teoría de la respuesta al ítem a problemas prácticos de prueba. Hillsdale, Nueva Jersey: Lawrence Erlbaum. Disponible aquí

  • Baker, F. B. y Kim, S. H. (2004). Teoría de la respuesta al ítem: técnicas de estimación de parámetros. Nueva York, NY: Marcel Dekker. Disponible aquí y aquí

Artículos metodológicos

  • Señor, F. M. (1983). Estimadores no sesgados de parámetros de capacidad, de su varianza y de su confiabilidad de formas paralelas. Psychometrika, 48, 233-245

  • Señor, F. M. (1986). Estimación de máxima verosimilitud y parámetros bayesianos en la teoría de respuesta al ítem. Revista de medición educativa 23 (2): 157-162

  • Stone CA. Recuperación de estimaciones marginales de máxima verosimilitud en el modelo de respuesta logística de dos parámetros: una evaluación de MULTILOG. Medición psicológica aplicada. 1992; 16 (1): 1-16

  • Green, D. R., Yen, W. M. y Burket, G. R. (1989). Experiencias en la aplicación de la teoría de respuesta al ítem en la construcción de pruebas. Medición aplicada en educación, 2 (4), 297-312

Artículos de aplicación

  • Da Rocha NS, Chachamovich E Fau - de Almeida Fleck MP, de Almeida Fleck Mp Fau - Tennant A, Tennant A: Introducción al análisis de Rasch para la práctica y la investigación psiquiátricas. (1879-1379)
    El objetivo principal del artículo es describir la teoría de pruebas moderna (específicamente el análisis de Rasch) en lo que respecta al diseño de instrumentos. El Inventario de Depresión de Beck (BDI) se utiliza como ejemplo donde los síntomas depresivos representan la variable latente en estudio.

  • Cocine KF, O'Malley KJ, Roddey TS. Evaluación dinámica de los resultados de salud: ¿es hora de sacar al CAT de la bolsa? Investigación en servicios de salud. 2005; 40 (5 Pt 2): 1694-711
    El objetivo principal del artículo es introducir las pruebas adaptativas por computadora en el contexto de la investigación de resultados de salud. También proporciona una descripción general simple pero efectiva de los conceptos básicos de los modelos IRT.

  • Edwards MC. Introducción a la teoría de la respuesta al ítem utilizando la escala de necesidad de cognición. Brújula de Psicología Social y de la Personalidad. 2009; 3 (4): 507-29
    El objetivo principal del artículo es revisar el modelo 2-PL y el modelo de respuesta gradual. El autor ilustra las diferentes características de ambos modelos a través de ejemplos utilizando la Need for Cognition Scale (NCS). También se discuten brevemente el funcionamiento diferencial de elementos (DIF) y las pruebas adaptativas computarizadas (CAT).

  • Choi SW, Swartz RJ. Comparación de los criterios de selección de elementos CAT para elementos politómicos. 2009 (0146-6216 (impresión)).
    El objetivo principal del artículo es investigar las propiedades del método de selección de elementos, en el contexto de las pruebas adaptativas por computadora y los elementos politómicos.

  • Rizopoulos, D. (2006). ltm: un paquete R para el modelado de variables latentes y los análisis de la teoría de la respuesta al ítem. Revista de software estadístico, 17 (5). 1-25
    El objetivo principal del artículo es presentar el paquete ltm en R, que es fundamental para ajustar los modelos IRT. El paquete ltm se centra tanto en datos dicotómicos como politómicos. El documento proporciona ilustraciones utilizando ejemplos de datos reales de la prueba de admisión a la facultad de derecho (LSAT) y de la sección de medio ambiente de la encuesta británica de actitudes sociales de 1990.

Software

Para obtener la lista completa, haga clic en el siguiente enlace: http://www.umass.edu/remp/software/CEA-652.ZH-IRTSoftware.pdf

ginsburg jane. C

Sitios web

Tutoriales de Youtube (extremadamente útiles e informativos)

Cursos

Cursos ofrecidos en Mailman School of Public Health

  • P8417 - Problemas seleccionados en la medición

  • P8158 - Modelado de ecuaciones estructurales y variables latentes para ciencias de la salud

Próximos cursos y talleres en línea

Cursos y materiales anteriores

  • Taller de verano de ICPSR 9 de julio de 2012 - 13 de julio de 2012. Dr. Jonathan Templin (Profesor asociado en el Departamento de Psicología e Investigación en Educación - Universidad de Kansas)

[PDF eliminados]

la edad es un factor que puede cambiar de un individuo a otro. la edad representa un

Artículos De Interés

La Elección Del Editor

Carpenter v. Estados Unidos
Carpenter v. Estados Unidos
Columbia Global Freedom of Expression busca promover la comprensión de las normas e instituciones nacionales e internacionales que mejor protegen el libre flujo de información y expresión en una comunidad global interconectada con importantes desafíos comunes que abordar. Para lograr su misión, Global Freedom of Expression emprende y encarga proyectos de investigación y políticas, organiza eventos y conferencias, y participa y contribuye a los debates globales sobre la protección de la libertad de expresión e información en el siglo XXI.
Física nuclear y de partículas de alta energía
Física nuclear y de partículas de alta energía
Kessler contra la ciudad de Charlottesville
Kessler contra la ciudad de Charlottesville
Columbia Global Freedom of Expression busca promover la comprensión de las normas e instituciones nacionales e internacionales que mejor protegen el libre flujo de información y expresión en una comunidad global interconectada con importantes desafíos comunes que abordar. Para lograr su misión, Global Freedom of Expression emprende y encarga proyectos de investigación y políticas, organiza eventos y conferencias, y participa y contribuye a los debates globales sobre la protección de la libertad de expresión e información en el siglo XXI.
Imágenes en movimiento
Imágenes en movimiento
Maestría en Ciencias
Maestría en Ciencias
El programa de Maestría en Ciencias se enfoca en el conocimiento especializado con un amplio alcance de salud pública para establecer carreras exitosas. Descubra cómo empezar hoy mismo.
Los pros y los contras que enfrenta Joe Biden en la candidatura presidencial
Los pros y los contras que enfrenta Joe Biden en la candidatura presidencial
Robert Shapiro, profesor y ex presidente del Departamento de Ciencias Políticas, enmarca el camino presidencial de Joe Biden hacia las elecciones de 2020.
Programa de idioma americano
Programa de idioma americano
Aprende inglés en el campus de una universidad de la Ivy League en uno de los programas de inglés más antiguos y respetados de EE. UU.