Espacio de Investigación: METODOLOGÍA DE RECOGIDA DE DATOS

TÉCNICAS DE RECOGIDA DE DATOS
Se entiende por recogida de datos aquellos medios técnicos que se utilizan para registrar las observaciones o facilitar el tratamiento experimental. En investigación educativa pueden considerarse los siguientes tipos primarios de técnicas de recogida de datos:

tests
cuestionarios
entrevistas
observación
otras técnicas

Tests

"Test" es un concepto cuya denominación se atribuye a Cattell, quien lo utilizó por primera vez hacia 1890, y que puede ser sinónimo de prueba. Para Anastasi (1967) un test psicológico constituye esencialmente una "medida objetiva o tipificada de una muestra de conducta".

Los test y las pruebas objetivas son, tal vez, los instrumentos de medición que permiten una máxima precisión en el dato obtenido. Probablemente sean las técnicas más frecuentemente utilizadas en la investigación educativa.

Cuestionarios

Los cuestionarios consisten en un conjunto más o menos amplio de preguntas o cuestiones que se consideran relevantes para el rasgo, característica o variables que son objeto de estudio. Hay dos tipos de cuestionarios: a) los aplicados en la medición y diagnóstico psicopedagógico; b) los utilizados en la recogida de datos en las encuestas.

Entrevista

La entrevista es un diálogo intencional orientado hacia unos objetivos. La entrevista puede cumplir diversas funciones: diagnóstica, orientadora, terapeútica e investigadora.

Observación
La observación puede tener distintos sentidos fundamentales:
a) Como técnica de recogida de datos dentro del proceso de investigación,
b) Como método de investigación.
En el primer caso nos podemos referir a la observación sistemática, la observación directa, instrumentos de registro de las observaciones, etc. En el segundo caso es un tipo especial de investigación, que utiliza alguna de las técnicas de observación en la fase de recogida de datos.

Otras técnicas e instrumentos
Algunas variantes híbridas entre las técnicas anteriores pueden ser formularios, inventarios, listas de control, escalas de estimación, escalas de diferencial semántico, técnica Q, sociometría, análisis de tareas realizadas por el alumno, escalas de producción escolar, registros anecdóticos.

Los instrumentos de recogida de datos pueden incluir ciertos apartados, como el magnetófono, espejo unidireccional, el circuito cerrado de televisión (CCTV), video, etc. En algunos casos se utiliza instrumental experimental, que son aparatos ad hoc para ciertos tipos de investigación. Estos instrumentos son más frecuentes en psicología experimental, donde se aplica más la investigación de laboratorio. Por ejemplo: dinamómetro, electromiógrafo, taquistoscopio, cronoscopio, psicogalvanómetro, rotor de prosecución, etc.

En el informe de investigación debe quedar claro qué técnicas, instrumentos o aparatos se han utilizado. Cuando sean desconocidos o de uso poco frecuente, se dará una descripción detallada de los mismos.

Medición y evaluación.
Medir consiste en asignar números a objetos hechos de acuerdo con unas reglas (Stevens, 1951). La medición tiene una importancia primordial en la investigaci´´on experimental y en la ciencia en general. Es curioso observar como las distintas ciencias han progresado a partir del momento en que han dispuesto de buenos instrumentos de medición. Recordemos al respecto la física, geografía y astronomía, que avanzaron a partir del momento en que se crearon instrumentos de medición precisos. Si las variables no han sido bien medidas la investigación carece de valor.

La medición en educación a veces es difícil. Los fenómenos que se quieren medir no siempre son observables. Aquí podemos recordar el célebre aforismo que anunció Thorndike en 1914: “Si una cosa existe, existe en alguna cantidad; si existe en alguna cantidad, puede medirse”. Sus palabras sirvieron de estímulo al naciente movimiento de investigación pedagógica, alentando a la utilización de métodos cuantitativos.

Esto remite a lo que hemos expuesto a propósito de los constructos y las variables. En la práctica lo que se hace es medir variables latentes inobservables por medio de indicadores. No podemos medir directamente la inteligencia, la actitud, la ansiedad o la motivación. Lo que se hace es inferir estas propiedades a partir de la observación de unos supuestos indicadores del comportamiento que se desea medir. Un indicador es un instrumentos que pone de manifiesto alguna característica no observable directamente. Muchos instrumentos de recogida de datos en investigación educativa son indicadores de las variables que se pretende analizar. Los test y las pruebas objetivas son indicadores. Johnstone (1988) expone la problemática actual de los indicadores en el campo de la educación.
Los modelos de rasgo latente han ocupado el interés de los investigadores. Estos modelos consisten en una ecuación matemática que relaciona las habilidades de un sujeto con ciertos ítems. Una característica atractiva de estos modelos reside en que una vez estimado el nivel de habilidad de un sujeto, se puede determinar la probabilidad de éxito en una tarea. Los modelos de Rasch (1980) y de Lord (1980) se encuentran entre los ejemplos más conocidos. Douglas (1988) presenta una exposición de síntesis sobre los modelos de medida del rasgo latente. Langeheine y Rost (1988) presentan una colección de informes sobre los nuevos desarrollos en el modelado del rasgo latente y sus relaciones con los constructos latentes. La teoría del rasgo latente a veces se conoce como IRT (item response theory).
La medición objetiva depende de los instrumentos de medida, los cuales funcionan independientemente de los objetos medidos. Para posibilitar una medición objetiva y precisa se requiere un modelo que permita distinguir entre los efectos del instrumento y el objeto medido. Una aportación relevante en esta dirección son los modelos de medida Rasch, desarrollados por el matemático danés Georg Rasch entre 1951 y 1959, y que son un tipo de modelo de rasgo latente, que en cierta forma puede considerarse como una extensión probabilística de las escalas de Guttman. En estos modelos, el comportamiento de un sujeto en una tarea se contabiliza mediante ciertas características personales, denominadas rasgos, y ciertas características de tarea, ignorando un componente aleatorio. La relación entre la respuesta del sujeto, sus rasgos y las características de la tarea varía de acuerdo con el modelo de rasgo latente utilizado. Si se utiliza el modelo de Rasch, la probabilidad de éxito en una tarea determinada para un sujeto dado es una función de sólo dos parámetros: a) parámetro de tarea: medida de dificultad; b) parámetro del sujeto: medida de habilidad. Estos modelos constituyen, según Wright (1988:286), el avance más importante en psicometría desde la Ley de Juicio Compatativo de Thurstone de 1927, del cual se derivaron las conocidas “escalas de Thurstone”.
Debido a la dificultad en observar muchas variables directamente, muchos instrumentos de medición en educación no son totalmente satisfactorios. Esto, junto con otros motivos de orden teórico, ha provocado duras críticas a la medición psicopedagógica. Muchas de ellas justificables desde el punto de vista metodológico e histórico (Thorndike y Hagen, 1978: 23-25). En este sentido conviene esforzarse en seguir la regla de Galileo: “medir lo inmedible e intentar hacer medible lo que aún no lo es”. Esto cobra importancia si se acepta el principio de H. Poincaré según el cual “lo que no se mide no puede ser objeto de ciencia”.
La evaluación supone atribuir juicios de valor a las mediciones realizadas. La evaluación nos interesa en dos direcciones: a) evaluación educativa; b) investigación evaluativa. La primera se asocia con los instrumentos de medición para evaluar los distintos aspectos del rendimiento educativo. La segunda se refiere a un determinado tipo de investigación. La medición y evaluación educativa constituye una rama importante dentro de las Ciencias de la Educación.

Características de los instrumentos de medición
Los instrumentos de medición deben reunir una serie de requisitos. Los más importantes son validez y confiabilidad. Otras características son sensibilidad, adecuación, objetividad y viabilidad. Los factores que intervienen en la utilidad práctica de un instrumento revisten especial importancia: economía y facilidad, tanto en la administración, corrección e interpretación.

Validez
Se denomina validez de un test al grado en que mide lo que pretende medir. La mayoría de autores se refieren a la validez de los instrumentos, coincidiendo en señalar diversos tipos de validez, con unos procedimientos adecuados para estimarla en cada caso. Los principales son:
Validez de constructor: refleja los principios de una teoría válida sobre el tópico que se pretende medir. Cuanto mejor se comprende el constructo que se pretende medir, mejor se podrán construir pruebas adecuadas.
Validez de contenido: determina el grado en que los ítems son una muestra representativa de todo el contenido a medir. Es propia de los test de rendimiento. Debe asegurarse “a priori” mediante una cuidadosa planificación en la elaboración de la prueba.
Validez de criterio: correlación entre el test y otras pruebas que se supone miden lo mismo. A veces otras pruebas se les denomina criterio. Presenta dos posibilidades: a) validez concurrente: el criterio se mide al mismo tiempo que se aplica el test; b) validez predictiva: el criterio se mide mucho tiempo después de la aplicación del test. Esta última se considera como la auténtica validez, ya que permite predecir una realización futura.
Aparte de estos tipos fundamentales de validez hay otros que pueden interesar en determinados casos. Así, tenemos la validez aparente (face validity) que es el grado según el cual una medida “parece” medir lo que pretende medir. La validez instructiva es la congruencia entre evaluación y proceso de instrucción. Es decir, un instrumento tiene validez instructiva cuando se evalúa lo que realmente se ha enseñado.
El “efecto del método” se refiere a que las puntuaciones reflejan no sólo lo que se pretende medir, sino también el efecto del método de medida. Es decir, un test consiste en: a) rasgo medido; y b) método de medida. Para valorar la contribución relativa del rasgo y del método en la puntuación, dos o más rasgos deben medirse como mínimo de dos métodos diferentes. De ahí el concepto de “multirasgo-multimétodo”.
Un procedimiento para investigar la validez de constructor es mediante la matriz multirasgo-multimétodo propuesta por Campbell y Fiske (1976).

Fiabilidad
La fiabilidad se refiere al grado de consistencia del instrumento de medida. El grado de fiabilidad de una prueba se expresa mediante un coeficiente de correlación, generalmente de Pearson.
Existen varios métodos para hallar el coeficiente de fiabilidad. Los más usuales son:
Test-retest: se administra la misma prueba dos veces a los mismo sujetos, con un intervalo de tiempo entre las aplicaciones. La correlación entre ambas aplicaciones es una estimación del coeficiente de fiabilidad.
Formas paralelas: algunas pruebas tienen dos o más formas equivalentes. La correlación entre ambas ofrece un índice de la fiabilidad.
Dos mitades (splits-halves): una vez que se ha aplicado el test, se divide en dos mitades, generalmente ítems pares e impares (odd-even), siendo la correlación entre ellas el coeficiente de fiabilidad.
Consistencia interna: es un análisis estadístico utilizando la alfa de Cronbach o las fórmulas de Kuder-Richardson.

Error de medida
El error de medida es la desviación típica de la distribución teórica de todas las puntuaciones para un sujeto, si fuera posible aplicarle el test muchas veces. El error típico de medida se relaciona con el coeficiente de fiablidad: alta fiabilidad producirá desviaciones típicas muy bajas y viceversa. El error típico de medida permite interpretar los resultados de un test dentro de un intervalo de probabilidad.

Generalizabilidad
Recientemente ha surgido la teoría de la generalizabilidad como alternativa al concepto clásico de fiabilidad. La medida de un comportamiento particular es una muestra de una población de observaciones posibles. Como consecuencia se da un error de medida, cuya naturaleza es multidimensional. Entre las posibles fuentes de error están las que provienen del observador, el momento, el fenómeno, etc. La teoría de la generalizabilidad pretende caracterizar una medida de acuerdo con las posibles fuentes de error de cara a mejorar el diseño de medición.
Según la teoría de la generalizabilidad se calculan unos coeficientes, denominados coeficientes de generalizabilidad. Estos coeficientes pueden cambiar cuando cambia la población de referencia. En la concepción clásica de la teoría de la medición se habla de una puntuación observada, compuesta por una puntuación verdadera más un error. En teoría de la generalizabilidad se habla de una puntuación universo y unos componentes de error.
La mayor contribución de la teoría de la generalizabilidad consiste en permitir al investigador analizar las fuentes de error de medida. De esta forma se puede aumentar el número de observaciones hasta conseguir un error promedio. Por ejemplo, si la variación debida a los momentos de observación es grande, mientras que es baja la variación debida al profesor, se pueden aumentar las observaciones de los momentos para reducir el error, y por consiguiente elevar el coeficiente de generalizabilidad.
En la teoría de la generalizabilidad el investigador puede estimar cuantas condiciones de cada faceta son necesarias para obtener un cierto nivel de generalizabilidad.

Clases de tests
Existen muchas clases de test. Diversos autores han intentado clasificarlos de acuerdo con distintos criterios. Los principales tipos de test pueden agruparse en las categorías siguientes:
rendimiento académico

inteligencia
aptitudes diferenciales
aptitudes especiales
personalidad
proyectivos
autoconcepto
cuestionarios de intereses
escalas de actitudes
valores
sociométricos
creatividad

Desde otro punto de vista, dentro de los test de rendimiento se distingue entre test referidos a la norma y test referidos al criterio. Los test tradicionales son test referidos a la norma, que establecen unas normas relativas a un grupo normativo. Las normas se establecen a posteriori. Los test referidos al criterio se usan para determinar el status de un individuo respecto a un dominio de comportamiento bien definido. La evaluación se establece respecto de la conducta esperada de cada individuo y no respecto de la conducta observada en el grupo. Son test centrados sobre objetivos que establecen normas a priori, de acuerdo con los criterios de los especialistas en la materia. Son normas absolutas.

lunes, 28 de septiembre de 2009

METODOLOGÍA DE RECOGIDA DE DATOS

1 comentario:

Espacio de Investigación

Seguidores

Archivo del blog

Datos personales