Para responder a preguntas con datos se requiere una exploración inicial de estos, una vez que la integridad de los datos ha sido revisada.
El análisis exploratorio permite:
- Describir las características de las distribuciones de las variables.
- Identificar datos ausentes y tomar decisiones sobre su manejo: omitirlos o imputación.
- Identificar datos atípicos, los que se alejan del conjunto de datos y distorsiona la distribución de los valores y afecta cálculos descriptivos e inferenciales.
- Comprobar supuestos acerca de las distribuciones de las variables, con base a lo cual se toman decisiones acerca de técnicas estadísticas a aplicar y sobre la transformación de los valores.
Los elementos que se emplean para el análisis exploratorio de datos son:
- Organización de los datos en tablas de frecuencia para variables categóricas (nominales u ordinales).
- Tablas con los descriptivos de posición, de tendencia central, de variabilidad y de forma.
- Gráficos que permitan visualizar las distribuciones de las variables.
En el análisis exploratorio de datos se siguen dos caminos:
- Univariados: Que suele emplearse en la descripción de variables sociodemográficas y en la comprobación de los supuestos.
- Bivariados o multivariados: Que suelen emplearse luego de los univariados y como paso previo al uso de técnicas estadísticas inferenciales o de contraste de hipótesis.
He señalado dos aproximaciones en el análisis de datos: Una descriptiva y otra inferencial. En el primer caso se trata de explorar los datos mientras que en el segundo se busca contrastar hipótesis que vendrían a ser las respuestas tentativas que se tienen a las preguntas que han llevado a realizar el análisis.
En síntesis, el análisis de datos descriptivo o exploratorio persigue hacerse una clara idea de cómo se distribuyen las variables y con base a ello, tomar decisiones de qué técnicas de análisis inferencial emplear.
Deja una respuesta