Teorías psicométricas: TCT e IRT

Teorías psicométricas: TCT e IRT

Teorías psicométricas: TCT e IRT

La evaluación del paciente suele estar fuertemente influenciada por los resultados obtenidos de la prueba administrada. Pero, ¿cómo se formularon estas pruebas y cómo verificar su eficacia?

Las pruebas se administran como herramientas de evaluación psicológica. Así como usamos el medidor para medir longitudes, podríamos usar una prueba para medir la inteligencia, la memoria y los niveles de atención de una persona. Sin embargo, las pruebas no son tan fáciles de diseñar o aplicar. De este aspecto se trata de teorías psicométricas.

Del mismo modo, así como una sola medición no nos permite definir con precisión el volumen de un objeto, ni siquiera la administración de una sola prueba nos permite formular un diagnóstico preciso o proponer una intervención exacta. De ello se deduce que las pruebas son herramientas de evaluación útiles, pero no decisivas.

Aquí mismo toma el relevo el psicólogo, quien tiene la tarea de reelaborar los datos obtenidos en la prueba y de otras fuentes para hacer una valoración más precisa. En otras palabras, el especialista deberá integrar los resultados de las diferentes fuentes, posible gracias a las habilidades pero también a los años de experiencia.

Índice()

    Breve historia de las teorías psicométricas

    El origen de las pruebas psicométricas se remonta a las pruebas que los emperadores chinos administraron en el 3000 a. C. C. a los oficiales a su servicio. El objetivo era evaluar sus competencias profesionales. (1)

    Las pruebas más modernas tienen orígenes más recientes, como las pruebas realizadas por Galton (1822-1911) en su laboratorio. No obstante, fue James Cattell quien utilizó por primera vez el término "prueba psicológica" en 1890.

    Estas pruebas no fueron precisas en cuanto a las habilidades cognitivas del sujeto, por lo que los investigadores Binet y Simon (1905) introdujeron pruebas cognitivas para evaluar aspectos como el juicio, la comprensión y el razonamiento.

    Esto allanó el camino para una tradición de escalas de calificación individuales. Además de las pruebas cognitivas, ha habido un progreso considerable en el área de las pruebas de personalidad.

    ¿Para qué sirven las teorías psicométricas?

    A medida que las pruebas florecieron como herramientas de evaluación, también se desarrollaron varias teorías para evaluar su efectividad. Impulsada por la necesidad de desarrollar herramientas con el menor margen de error posible, surgió la psicometría. Las teorías psicométricas reclaman validez y confiabilidad de cualquier prueba o herramienta de medición como tal.

    Te recordamos que confiabilidad significa la estabilidad o consistencia de las mediciones durante la repetición de las mismas. En otras palabras, una prueba será tan confiable cuanto mayor sea la replicación de los mismos resultados obtenidos en diferentes ocasiones.

    Por otro lado, la validez se refiere al grado en que la evidencia empírica y la teoría apoyan la interpretación de la puntuación de la prueba (2).

    Existen dos teorías (o enfoques) psicométricos dirigidos a analizar y definir estas herramientas: teoría de prueba clásica (TCT) y teoría de respuesta al ítem (IRT).

    Teorías psicométricas

    Teoría clásica de la prueba (TCT)

    Esta es la teoría dominante en la construcción y análisis de pruebas. Sus orígenes se remontan a las obras de Spearman, a principios del siglo XX. Posteriormente, en 1968, los investigadores Lord y Novick reformularon esta teoría y allanaron el camino para un nuevo enfoque, el del IRT.

    Esta teoría se basa en el modelo lineal clásico propuesto por Spearman según el cual “la puntuación obtenida por una persona en una prueba -que llamaremos puntuación empírica y que suele indicarse con la letra X- está compuesta por dos elementos (2).

    Por un lado, encontramos la verdadera puntuación obtenida por el sujeto durante la prueba (V) y por otro lado el error (e). Se expresa con la siguiente fórmula: X = V + e ”.

    Spearman agrega tres postulados a esta teoría:

    • Definimos la puntuación real (V) como la expectativa matemática del puntaje empírico: este es el puntaje que una persona tendría que obtener en una prueba si la repitiera un número infinito de veces.
    • No existe relación entre la puntuación real y la magnitud de los errores.
    • los Los errores de medición de una prueba no están asociados con los de una prueba diferente.

    Finalmente, Spearman define las pruebas paralelas como aquellas que miden la misma variable, pero sobre la base de diferentes ítems.

    Teorías psicométricas: límites del enfoque clásico

    La primera de la teoría clásica es que las medidas no son invariantes con respecto al instrumento aplicado. Esto significa que si un psicólogo evaluara la inteligencia de tres personas con una prueba diferente para cada una, los resultados no serían comparables. ¿Pero por qué?

    Porque los resultados de las tres herramientas de medición no se basan en la misma escala de calificación. Para poder comparar la inteligencia de las tres personas, será necesario convierte tu puntuación a otra escala.

    El problema surge del hecho de que suponemos que los criterios normativos con los que se han elaborado las escalas de las distintas pruebas son comparables -misma media, misma desviación estándar-, lo cual es difícil de garantizar en la práctica. (1).

    Así, el nuevo enfoque de la RTI representó un gran avance en este sentido. De hecho, permite evaluar los resultados obtenidos a través de diferentes instrumentos en base a una misma escala.

    La segunda limitación de este enfoque es la ausencia de invariancia de las propiedades de la prueba. en comparación con los sujetos utilizados para la estimación. Este aspecto tiene una solución parcial en el enfoque RTI.

    La teoría de la respuesta al elemento (IRT)

    La Teoría de Respuesta al Ítem (IRT) fue creada para complementar la teoría de prueba clásica. IRT nos ofrece una herramienta mucho más equilibrada, el problema es que este paradigma se asocia a mayores costos y requiere la participación de personal especializado.

    El IRT prevé varios escenarios, pero la idea básica es que cualquier herramienta de medición tiene una relación funcional entre los valores de la variable que miden los ítems y las probabilidades que corresponden a la verdad. Esta función se denomina Curva característica del artículo (CCI). ¿Qué conclusiones podemos sacar?

    TCT no evalúa. Por ejemplo, los ítems más difíciles serían aquellos a los que solo responden los sujetos más inteligentes. Por otro lado, un ítem al que todos los sujetos respondan sería inútil, porque no tendría valor discriminatorio. Es decir, no ofrecería ninguna información.

    Para observar mejor las diferencias entre las teorías psicométricas descritas, podemos tomar como referencia la tabla de José Muñiz (2010):

    Tabla 1. Diferencias entre TCT e IRT (Muñiz, 2010)

    Espere TCT ESCRITO
    Modelo Lineal No lineal
    Hipótesis Débil (fácil de satisfacer con datos) Fuerte (difícil de complacer con los datos)
    Invarianza de medidas No Sip
    Invarianza de las propiedades de la prueba No Sip
    Escala de puntuación Entre 0 y la puntuación máxima de la prueba infinito
    Énfasis Prueba Articulo
    Relación elemento-prueba No especificable Curva característica del artículo
    Descripción del Artículo s de dificultad y discriminación Parametri a, b, c
    Errores de medida Errores de medición típicos, comunes a todas las muestras Funciones de información (varía según los niveles de aptitud)
    Tamaño de la muestra Trabajar potencialmente con muestras compuestas por un número que varía de 200 a 500 sujetos aproximadamente Se recomienda un número que supere los 500 sujetos

    Aunque son casi contemporáneos, parece claro que IRT nació como respuesta a las limitaciones o posibles problemas que presenta TCT. En cualquier caso, parece claro que la investigación psicométrica todavía tiene un largo camino por recorrer.

    1. Muñiz Fernández, J. (2010). Las teorías de los test: teoría clásica y teoría de respuesta a los ítems. Papeles del Psicólogo: Revista del Colegio Oficial de Psicólogos.
    2. Binet, A. y Simon, TH (1905). Nuevos métodos para el diagnóstico del nivel intelectual de personas anormales. El año psicológico, 11, 191-244.
    3. Lord, FM, y Novick, MR (1968). Teorías estadísticas de resultados de pruebas mentales. Nueva York: Addison-Wesley.

    Subir

    Si continuas utilizando este sitio aceptas el uso de cookies. Más Información