Estimación de Parámetros en Modelos de Respuesta al Ítem (IRT)
Clasificado en Matemáticas
Escrito el en español con un tamaño de 6,62 KB
La estimación de parámetros en los modelos de la Teoría de Respuesta al Ítem (IRT) se centra en determinar la probabilidad de respuesta correcta en función de la aptitud del examinado (θ) y los parámetros característicos del ítem. Los parámetros desconocidos (tanto del ítem como θ) se estiman a partir de las respuestas de los sujetos. El objetivo es buscar los valores que mejor se ajustan a los datos, utilizando métodos como la regresión lineal (mínimos cuadrados) y la máxima verosimilitud.
Máxima Verosimilitud
La estimación por máxima verosimilitud es un método computacional. Puesto que Pi (probabilidad de acierto) y Qi (probabilidad de error) son funciones de θ y de los parámetros del ítem, la función de verosimilitud (L) también será función de estos parámetros. El máximo de L (o de su logaritmo natural, nL) se alcanza cuando la pendiente de la curva es igual a 0. Esto implica determinar la primera derivada de la función e igualarla a 0 para encontrar los valores óptimos de los parámetros.
Estimación de la Aptitud (θ)
Para estimar la aptitud (θ) de un sujeto, se supone que los parámetros de los ítems ya se conocen. La estimación se realiza obteniendo un estimador de máxima verosimilitud (ML) de θ a partir de las respuestas del sujeto. Si, por el contrario, se desea estimar los parámetros del ítem cuando se conoce θ para los examinados, se administra el ítem de interés a un gran número de sujetos y se obtiene la función de verosimilitud para las respuestas de todos ellos al ítem.
Métodos de Estimación de Parámetros
La estimación de los parámetros se puede realizar mediante:
- Máxima Verosimilitud Conjunta (MVC): En este método, las puntuaciones totales son consideradas un estimador suficiente de la aptitud.
- Máxima Verosimilitud Marginal (MVM): Este método es generalmente implementado mediante software especializado.
Ajuste de Datos al Modelo
Para evaluar si los datos se ajustan adecuadamente al modelo IRT, se utilizan diversos tests estadísticos de ajuste:
- Q1: Considera la importancia del número de sujetos (N) y de la esperanza de la probabilidad de acierto (E(Pij)).
- Test de Razón de Verosimilitud: Sus grados de libertad (gl) se calculan como el número de intervalos (m) menos el número de parámetros de los ítems (k).
- Análisis de Residuos (Zij): Examina las diferencias entre las respuestas observadas y las esperadas por el modelo.
Escala de Habilidad (θ)
En la fase de estimación, se estima tanto la θ de los sujetos como la dificultad de los ítems. Es común establecer una escala típica (con media = 0 y desviación típica = 1) mediante una transformación lineal utilizando los parámetros α y β. Las fórmulas de transformación son:
θ* = αθ + β
b* = αb + β
a* = a/α
Curva Característica del Test (CCT)
La Curva Característica del Test (CCT) es, en general, una función monótona creciente de θ. Siempre tiende asintóticamente al número de ítems (n). Su forma específica depende de n, del modelo IRT utilizado, de la Curva Característica del Ítem (CCI) y de los valores de los parámetros de los ítems.
- El nivel de aptitud correspondiente al punto medio de la escala (n/2) localiza el test en la escala de aptitud.
- La pendiente de la CCT indica el grado en que el valor de la puntuación verdadera depende del nivel de aptitud.
- La CCT no tiene una forma explícita que use directamente los parámetros del ítem.
- En los modelos de 1 y 2 parámetros (1P y 2P), el lado izquierdo de la curva se aproxima a 0 a medida que la aptitud tiende a -∞. El límite superior se aproxima al número de ítems a medida que la aptitud tiende a +∞.
- En el modelo de 3 parámetros (3P), la cota inferior tiende a la suma de los parámetros 'c' (parámetro de adivinación) de los ítems en lugar de a 0. Esto implica que los sujetos con aptitud muy baja pueden tener puntuaciones verdaderas distintas de 0 solo por adivinación.
La CCT proporciona un procedimiento para transformar las puntuaciones de aptitud en puntuaciones verdaderas, lo cual es de gran influencia si un sujeto es incapaz de interpretar una puntuación de aptitud. La puntuación verdadera para un sujeto es la suma de las probabilidades de acierto de los ítems en ese nivel de θ.
Función de Información del Ítem
La información que un ítem proporciona varía para los diferentes niveles de θ. La forma de la función de información depende del modelo de la CCI, y se obtiene sustituyendo Pi(θ) por sus derivadas.
- Información Máxima (Bibarium): Un ítem proporciona información máxima en aquel valor de θ que coincide con el parámetro de dificultad en los modelos de 1 y 2 parámetros (1P y 2P). En el modelo de 3 parámetros (3P), se calcula mediante una fórmula específica.
- Si se utilizan tests de conjunto de ítems, es necesario conocer la cantidad de información que aportan.
- La información del test es ADITIVA: la información en un nivel de θ es la suma de las informaciones de sus ítems en ese nivel.
La función de información en un nivel θ es función de:
- La discriminación del ítem (directamente proporcional), representada por la pendiente 'a' en el punto θ. A mayor pendiente, más información.
- La desviación típica del ítem (inversamente proporcional), donde PiQi es la varianza.
- P'(θ) es la primera derivada de la CCI.
- La forma depende del modelo de la CCI (sustituir P por las derivadas D).
Errores de Medida
La función de información permite obtener el Error Típico (ET) de la medida. Es importante destacar que el error no es homocedástico, es decir, no es constante a lo largo de la escala de habilidad. Tiene una relación inversa con la función de información: a mayor información, menor error.
El error típico no es un índice único, ya que cambia con los valores de θ (existen tantos errores como niveles de θ). Permite construir Intervalos de Confianza (IC) para θ, lo que es crucial para la interpretación de las puntuaciones de aptitud.