Análisis Exploratorio de datos – EDA

Realiza en un EDA (Análisis Exploratorio de Datos): Limpieza y tratamiento de Inconsistencias

En el mundo del Business Intelligence (BI) y de la analítica avanzada, el Análisis Exploratorio de Datos (EDA, por sus siglas en inglés) se ha convertido en una de las fases más importantes dentro de cualquier proyecto de ciencia de datos. No importa cuán sofisticado sea el modelo predictivo o el dashboard que quieras construir: si los datos no están limpios, el resultado será poco fiable.

¿Qué es un EDA?

El EDA es el conjunto de técnicas y procesos iniciales que permiten conocer, entender y preparar los datos antes de cualquier modelado o análisis profundo. Su objetivo principal es detectar patrones, identificar anomalías, comprobar supuestos y, sobre todo, garantizar la calidad de la información.

En términos simples: el EDA es como la “revisión médica” que se le hace a los datos antes de comenzar a entrenar un modelo de Machine Learning o antes de tomar decisiones estratégicas basadas en ellos.

¿Para qué se utiliza?

  • Detección de valores nulos y duplicados que pueden distorsionar los resultados.
  • Identificación de outliers (valores extremos) que pueden sesgar el análisis.
  • Entendimiento de distribuciones y correlaciones entre variables.
  • Verificación de consistencia: comprobar si los datos siguen la lógica del negocio.

En Business Intelligence, el EDA es fundamental para garantizar que los KPIs y dashboards reflejen la realidad y no “ruido” generado por inconsistencias en la fuente de datos.

Limpieza de datos en el EDA

Uno de los pasos críticos del EDA es la limpieza y transformación de los datos. Aquí se incluyen acciones como:

  • Eliminar datos que no aportan valor: columnas irrelevantes para el objetivo de análisis (por ejemplo, identificadores redundantes).
  • Sustituir inconsistencias: rellenar valores nulos con la moda o la media, unificar categorías mal escritas (“España”, “Espana”, “ES”), normalizar unidades de medida, etc.
  • Crear nuevas variables más útiles: por ejemplo, convertir la fecha de contratación en “años de antigüedad en la empresa”.
import pandas as pd
df = pd.read_csv('AbandonoEmpleados.csv', sep = ';', index_col= 'id', na_values='#N/D')
df.info()
df.isna().sum().sort_values(ascending = False)
df.drop(columns = ['anos_en_puesto','conciliacion'], inplace = True)
df.isna().sum().sort_values(ascending = False)
df['sexo'] = df['sexo'].fillna('Desconocido')

# Imputación por moda para cada columna
df['educacion'] = df['educacion'].fillna(df['educacion'].mode()[0])
df['satisfaccion_trabajo'] = df['satisfaccion_trabajo'].fillna(df['satisfaccion_trabajo'].mode()[0])
df['implicacion'] = df['implicacion'].fillna(df['implicacion'].mode()[0])

df.isna().sum().sort_values(ascending = False)
df.to_csv('AbandonoEmpleados_EDA.csv', index=False, encoding="utf-8")

¿Cómo aplicar el EDA en Business Intelligence?

En un proyecto de BI, los datos suelen provenir de múltiples fuentes: ERP, CRM, hojas de cálculo, bases de datos externas… Antes de integrarlos en un Data Warehouse o construir un dashboard en herramientas como Power BI, Looker Studio o Tableau, es imprescindible realizar un EDA.

Aplicar un buen EDA permite:

  • Evitar reportes con errores de cálculo.
  • Ahorrar tiempo en la fase de modelado al tener datos homogéneos.
  • Incrementar la confianza de la dirección en las decisiones basadas en datos.

El EDA es la base de cualquier análisis de datos sólido. Sin esta etapa, las decisiones tomadas pueden estar basadas en información incompleta o errónea. Al eliminar datos que no aportan valor y sustituir inconsistencias, se obtiene un dataset más robusto que servirá de fundamento para todo el proceso de Business Intelligence y Data Science.

Juande Marín

Profesor de Marketing digital, divulgador de inteligencia artificial y neuroeducación. Especializado en posicionamiento en buscadores y diseño web. Autor de varios libros relacionados con el comercio electrónico y el marketing digital (McGraw Hill, Paraninfo,…) Juande2marin

¿Quién me pone el ROL de profesor?

El profesor o profesora debe seguir el mismo proceso de automatriculación del alumnado, y una vez completado el proceso debe solicitar que el gestor del campus le cambie el rol para que pueda acceder al contenido exclusivo del profesor. No se hace de forma automatizada para evitar filtraciones. Puede solicitar el cambio de ROL al mail: infor@comercioymarketing.es

¿Cómo doy de alta al alumnado?

Cada alumno puede darse de alta accediendo al Instituto y al módulo desde el el CAMPUS.comercioymarketing.es Durante el proceso tendrá que rellenar un formulario y al finalizar deberá introducir la clave de matriculación que se facilitará al profesor a través de correo electrónico: info@comercioymarketing.es

Presentación del campus.

¿Puedo descargar el ebook?

Todo el material está protegido por los derechos de autor y la Ley de Propiedad Intelectual. No se puede descargar ni difundir total o parcialmente. No obstante si algún alumno desea el material en formato papel podrá adquirirlo en la editorial LULU.com

Para localizar los libros se puede hacer una búsqueda en la propia web por título o autor: Juan de Dios Marín Peñas. Los libros en papel suelen estar promocionados para el alumnado matriculado (75% de descuento).

¿Se adapta a normativa?

Todo el material didáctico está adaptado al Real Decreto del Ciclo Formativo y responde a los Resultados de Aprendizaje que se deben alcanzar.

Para facilitar la evaluación se facilita un cuadro de actividades y su relación con los criterios de evaluación y RA.

¿Cómo se paga?

Los alumnos y alumnas pueden pagar directamente ingresando o transfiriendo el importe de la matrícula a la cuenta facilitada por el gestor del campus (info@comercioymarketing.es).

Para facilitar la identificación de los pagos se aconseja que se hagan de forma agrupada por clase y se identifique el Instituto cuando se haga el ingreso.

 

¿Cuánto cuesta?

El coste es de 7€ al año por cada uno de los módulos que contrate el alumno. El profesor y el Instituto no pagan nada. Estos 7€ da derecho a 9 meses de matriculación con acceso al material didáctico, vídeos, actividades, hosting, etc.


¿Quieres un material didáctico adaptado y actualizado?

Si estás buscando herramientas didácticas adaptadas a las nuevas tecnologías, si quieres utilizar la inteligencia artificial de forma didáctica aportando valor y quieres dinamizar tus clases; nuestra plataforma didáctica interactiva es la solución. Facilitamos material didáctico actualizado, dinámico, interactivo, práctico, editable y motivador.

Contactanos


Categorías


Entradas del Blog

Material didáctico

Descubre un material moderno y adaptado a ciclos formativos.