Análisis de la Base de Datos de Prospectos de Oceanica¶
El objetivo de este análisis es proporcionar una visión comprensible sobre la base de datos de prospectos del centro de rehabilitación, identificar patrones y tendencias, y ofrecer sugerencias útiles para mejorar la gestión y la toma de decisiones.
1. Importación y Preprocesamiento de los Datos¶
- Visualizar las primeras filas del conjunto de datos
| # | TK | Empresa | Correo | Móvil | Teléfono | Teléfono alternativo | Puesto | Fase | Objetivo | ... | Título | estatus egreso | Estatus Egreso New | Fecha de nacimiento | Fecha de Egreso | estatus clínico | Estatus Clínico New | código px | clave personal | Contacto por | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | 1 | P-E275E6B8-15EE-4EF7-809B-F8A69028A43F | - | - | \t+15756216679 | - | - | - | Cliente nuevo | - | ... | - | - | TRATAMIENTO CONCLUIDO SATISFACTORIAMENTE | - | 30-Nov-24 | - | ABSTINENTE | 8663 | 32199 | Llamada por callweb, Whatsapp |
| 1 | 2 | P-95D89EA1-5D04-4E66-83DB-9C3CE2DFC3E3 | - | carlos.mezam@hotmail.com | \t+526311253699 | - | - | - | Cliente nuevo | - | ... | - | - | - | - | - | - | 32208 | - | ||
| 2 | 3 | P-1FFB8953-AAE2-4928-8022-7D862CE54E86 | - | edith.figueroa@icloud.com | \t+525527292777 | - | - | - | Cliente nuevo | - | ... | - | - | - | - | - | - | 32225 | - | ||
| 3 | 4 | P-8A45F248-76EE-44BF-83F8-83E60D68010F | - | - | \t+529612626386 | - | \t+52961 111 6109 | - | Cliente nuevo | - | ... | - | TRATAMIENTO CONCLUIDO SATISFACTORIAMENTE | TRATAMIENTO CONCLUIDO SATISFACTORIAMENTE | - | 13/Dic/2024 | ABSTINENTE | ABSTINENTE | 8669 | 32206 | Llamada por callweb, Whatsapp |
| 4 | 5 | P-4BD55533-4CE7-44B6-BFA8-35E08CE9FBD8 | - | franrincon12@gmail.com | \t+526671610448 | - | - | - | Cliente nuevo | - | ... | - | - | - | - | - | - | 32645 | - |
5 rows × 56 columns
Limpieza de la base de datos:¶
- Manejo de valores nulos (eliminación o imputación, dependiendo del contexto).
- Corrección de datos inconsistentes o erróneos.
- Eliminación de duplicados
| Correo | Móvil | Teléfono | Teléfono alternativo | Fase | Origen | Compras acumuladas | Anticipo | Saldo | Saldo vencido | ... | Primer interacción | Etiquetas | estatus egreso | Estatus Egreso New | Fecha de Egreso | estatus clínico | Estatus Clínico New | código px | clave personal | Contacto por | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 0 | NaN | +1 (575) 621-6679 | Número no válido | Número no válido | Cliente nuevo | Postratamiento | 0.0 | 0.0 | 0 | 0 | ... | 03/Dic/2024 | Oceánica-Conecta | NaN | TRATAMIENTO CONCLUIDO SATISFACTORIAMENTE | 30-Nov-24 | NaN | ABSTINENTE | 8663 | 32199 | Llamada por callweb, Whatsapp |
| 1 | carlos.mezam@hotmail.com | +52 (631) 125-3699 | Número no válido | Número no válido | Cliente nuevo | Postratamiento | 0.0 | 0.0 | 0 | 0 | ... | 03/Dic/2024 | NaN | NaN | NaN | NaN | NaN | NaN | NaN | 32208 | NaN |
| 2 | edith.figueroa@icloud.com | +52 (552) 729-2777 | Número no válido | Número no válido | Cliente nuevo | Postratamiento | 0.0 | 0.0 | 0 | 0 | ... | 30/Dic/2024 | Oceánica-Conecta,postratamiento | NaN | NaN | NaN | NaN | NaN | NaN | 32225 | NaN |
| 3 | NaN | +52 (961) 262-6386 | Número no válido | +52 (961) 111-6109 | Cliente nuevo | Postratamiento | 0.0 | 0.0 | 0 | 0 | ... | 12/Dic/2024 | Oceánica-Conecta,postratamiento | TRATAMIENTO CONCLUIDO SATISFACTORIAMENTE | TRATAMIENTO CONCLUIDO SATISFACTORIAMENTE | 13/Dic/2024 | ABSTINENTE | ABSTINENTE | 8669 | 32206 | Llamada por callweb, Whatsapp |
| 4 | franrincon12@gmail.com | +52 (667) 161-0448 | Número no válido | Número no válido | Cliente nuevo | Postratamiento | 0.0 | 0.0 | 0 | 0 | ... | 28/Ene/2025 | FB V_Pacifica,postratamiento | NaN | NaN | NaN | NaN | NaN | NaN | 32645 | NaN |
5 rows × 42 columns
Datos Generales
- Porcentaje de datos completos: 54.63%
- Porcentaje de datos faltantes: 45.37%
Columnas Incompletas y sin Valor Aportado
Las siguientes columnas tienen un porcentaje elevado de datos faltantes y no aportan valor significativo a la base de datos:
- Empresa
- Puesto
- Objetivo
- Corporativo
- Industria
- Municipio
- Código postal
- Descartado el
- Descartado por
- '# Empleados
- Título
- Fecha de nacimiento
Informacion por columna:
Columnas con al menos 100% de datos: ['Móvil', 'Teléfono', 'Teléfono alternativo', 'Fase', 'Origen', 'Compras acumuladas', 'Anticipo', 'Saldo', 'Saldo vencido', 'Monto promedio', '# Transacciones', 'Días sin comprar', 'Fecha de último contacto', 'Último contacto', 'País', 'Fecha de creación', 'Última modificación del contacto', 'Ejecutivo', 'Iniciales ', 'Correo del ejecutivo', 'Situación', 'Situación.1', 'Situación.2', 'clave personal'] Columnas con al menos 90% de datos: ['Género', 'Estado/Región'] Columnas con al menos 80% de datos: [] Columnas con al menos 70% de datos: [] Columnas con al menos 60% de datos: ['Primer compra', 'Última compra', 'Primer interacción'] Columnas con al menos 50% de datos: [] Columnas con al menos 40% de datos: ['Calle', 'Etiquetas'] Columnas con al menos 30% de datos: ['Correo', 'Colonia'] Columnas con al menos 20% de datos: ['Próximo seguimiento'] Columnas con al menos 10% de datos: ['Fecha de Egreso', 'código px', 'Contacto por'] Columnas con al menos 0% de datos: ['Ciudad', 'estatus egreso', 'Estatus Egreso New', 'estatus clínico', 'Estatus Clínico New']
- Problemas Detectados en la Base de Datos
2.1 Columnas con Alto Porcentaje de Datos Faltantes
Se identificaron varias columnas con un alto porcentaje de valores nulos, lo que sugiere que no están siendo capturadas correctamente o no son relevantes en la operativa del negocio. Entre ellas:
Empresa, Puesto, Objetivo, Corporativo, Industria, Municipio, Código Postal, Descartado el, Descartado por, # Empleados, Título, Fecha de Nacimiento. Estas variables tienen una cantidad significativa de valores nulos, lo que sugiere que no están bien registradas o que no aportan valor relevante en el proceso de conversión de prospectos.
2.2 Problemas con la Calidad de los Datos
Teléfonos y correos electrónicos: Existen múltiples registros con datos no válidos en los campos de contacto, lo que puede afectar las estrategias de seguimiento. Formato inconsistente en fechas: Se encontraron diferentes formatos de fechas (dd/mm/yyyy, dd-mmm-yy), lo que dificulta su procesamiento automatizado. Doble almacenamiento de variables: Algunas columnas parecen duplicadas o tienen versiones alternativas (Estatus Egreso / Estatus Egreso New, estatus clínico / Estatus Clínico New).
2.3 Distribución de Datos por Completitud
Columnas con 100% de datos completos: Información como móvil, teléfono, fase, origen, compras acumuladas y clave personal están bien registradas y pueden ser útiles para análisis. Columnas con 50%-90% de datos: Algunas variables claves como género y estado/región tienen registros parcialmente completos, lo que permite hacer un análisis segmentado. Columnas con menos del 20% de datos: Variables como fecha de egreso, código px y contacto por tienen muy poca información registrada, lo que limita su utilidad.
- Conclusiones Preliminares
- Columnas Poco Útiles para el Análisis:
Se recomienda eliminar o redefinir las columnas con más del 80% de datos faltantes, a menos que sean críticas para el negocio.
- Datos Financieros con Nulos:
Variables como Saldo y Saldo vencido tienen valores faltantes en su totalidad, lo que impide un análisis financiero confiable. Se debe revisar su origen.
- Problemas en la Información de Contacto:
Una gran parte de los registros tiene correos o teléfonos no válidos, lo que puede afectar la comunicación con los prospectos.
- Duplicidad de Campos:
Se identificaron variables similares (Estatus Egreso / Estatus Egreso New). Se recomienda unificar estos campos para evitar redundancias.
2. Análisis Descriptivo¶
La base de datos tiene un total de 49 filas y 42 columnas.
| Nombres | Data_Types | Valor más frecuente | Valor menos frecuente | Missing_Values | Present_Values | Unique_Values | Min | Max | Importance_Percentage | |
|---|---|---|---|---|---|---|---|---|---|---|
| Correo | Correo | object | carlos.mezam@hotmail.com | carlos.mezam@hotmail.com | 31 | 18 | 18 | NaN | NaN | 0.723272 |
| Móvil | Móvil | object | +52 (999) 344-6059 | +1 (575) 621-6679 | 0 | 49 | 48 | NaN | NaN | 0.966790 |
| Teléfono | Teléfono | object | Número no válido | +52 (595) 122-0458 | 0 | 49 | 4 | NaN | NaN | 0.074466 |
| Teléfono alternativo | Teléfono alternativo | object | Número no válido | +52 (961) 111-6109 | 0 | 49 | 4 | NaN | NaN | 0.074466 |
| Fase | Fase | object | Cliente nuevo | Cliente nuevo | 0 | 49 | 1 | NaN | NaN | -0.000000 |
| Origen | Origen | object | Postratamiento | Llam Facebook | 0 | 49 | 12 | NaN | NaN | 0.476255 |
| Compras acumuladas | Compras acumuladas | float64 | NaN | NaN | 0 | 49 | 28 | 0.0 | 430704.0 | 18.374720 |
| Anticipo | Anticipo | float64 | NaN | NaN | 0 | 49 | 28 | 0.0 | 430704.0 | 18.374720 |
| Saldo | Saldo | int64 | NaN | NaN | 0 | 49 | 1 | 0.0 | 0.0 | 0.000000 |
| Saldo vencido | Saldo vencido | int64 | NaN | NaN | 0 | 49 | 1 | 0.0 | 0.0 | 0.000000 |
| Monto promedio | Monto promedio | float64 | NaN | NaN | 0 | 49 | 28 | 0.0 | 430704.0 | 18.584866 |
| # Transacciones | # Transacciones | int64 | NaN | NaN | 0 | 49 | 5 | 0.0 | 4.0 | 15.951880 |
| Primer compra | Primer compra | object | 22/Ene/2025 | 13/Dic/2024 | 15 | 34 | 27 | NaN | NaN | 0.810998 |
| Última compra | Última compra | object | 22/Ene/2025 | 28/Dic/2024 | 15 | 34 | 28 | NaN | NaN | 0.817350 |
| Días sin comprar | Días sin comprar | int64 | NaN | NaN | 0 | 49 | 29 | 0.0 | 72.0 | 15.368637 |
| Género | Género | object | Hombre | Mujer | 3 | 46 | 2 | NaN | NaN | 0.157992 |
| Fecha de último contacto | Fecha de último contacto | object | 12-Feb-25 | 24/Ene/2025 | 0 | 49 | 27 | NaN | NaN | 0.776440 |
| Último contacto | Último contacto | object | Hace 6 días [CC] - Un nuevo recordatorio agend... | Hace 3 días [CC] - alumna reagenda cita con ár... | 0 | 49 | 43 | NaN | NaN | 0.924313 |
| Calle | Calle | object | 3424 winterhaven | 3424 winterhaven | 29 | 20 | 20 | NaN | NaN | 0.749637 |
| Colonia | Colonia | object | cumbres del campestre | kennedy | 31 | 18 | 17 | NaN | NaN | 0.704000 |
| Ciudad | Ciudad | object | los mochis | los mochis | 48 | 1 | 1 | NaN | NaN | -0.000000 |
| Estado/Región | Estado/Región | object | Sinaloa | New Mexico | 1 | 48 | 18 | NaN | NaN | 0.612858 |
| País | País | object | México | Guatemala | 0 | 49 | 3 | NaN | NaN | 0.082238 |
| Próximo seguimiento | Próximo seguimiento | object | 19/02/2025 seguimiento-llamar | 18/02/2025 seguimiento-llamar | 35 | 14 | 5 | NaN | NaN | 0.367878 |
| Fecha de creación | Fecha de creación | object | 16/Ene/2025 | 03/Dic/2024 | 0 | 49 | 31 | NaN | NaN | 0.819501 |
| Última modificación del contacto | Última modificación del contacto | object | 13-Feb-25 | 3-Feb-25 | 0 | 49 | 24 | NaN | NaN | 0.745096 |
| Ejecutivo | Ejecutivo | object | Cuidado Continuo | ROCIO GUADALUPE SOTO CALLEROS | 0 | 49 | 10 | NaN | NaN | 0.459711 |
| Iniciales | Iniciales | object | CC | RGSC | 0 | 49 | 10 | NaN | NaN | 0.459711 |
| Correo del ejecutivo | Correo del ejecutivo | object | terapeutacc@oceanica.com.mx | promsalud04@oceanica.com.mx | 0 | 49 | 10 | NaN | NaN | 0.459711 |
| Situación | Situación | object | Descartado | Descartado | 0 | 49 | 1 | NaN | NaN | -0.000000 |
| Situación.1 | Situación.1 | object | Archivado | Archivado | 0 | 49 | 1 | NaN | NaN | -0.000000 |
| Situación.2 | Situación.2 | object | Activo | Activo | 0 | 49 | 1 | NaN | NaN | -0.000000 |
| Primer interacción | Primer interacción | object | 03/Dic/2024 | 12/Dic/2024 | 17 | 32 | 26 | NaN | NaN | 0.794021 |
| Etiquetas | Etiquetas | object | Oceánica-Conecta,postratamiento | FB V_Pacifica,postratamiento | 25 | 24 | 8 | NaN | NaN | 0.408728 |
| estatus egreso | estatus egreso | object | TRATAMIENTO CONCLUIDO SATISFACTORIAMENTE | TRATAMIENTO CONCLUIDO SATISFACTORIAMENTE | 46 | 3 | 1 | NaN | NaN | -0.000000 |
| Estatus Egreso New | Estatus Egreso New | object | TRATAMIENTO CONCLUIDO SATISFACTORIAMENTE | TRATAMIENTO CONCLUIDO SATISFACTORIAMENTE | 46 | 3 | 1 | NaN | NaN | -0.000000 |
| Fecha de Egreso | Fecha de Egreso | object | 30-Nov-24 | 30-Nov-24 | 44 | 5 | 5 | NaN | NaN | 0.402738 |
| estatus clínico | estatus clínico | object | ABSTINENTE | ABSTINENTE | 46 | 3 | 1 | NaN | NaN | -0.000000 |
| Estatus Clínico New | Estatus Clínico New | object | ABSTINENTE | ABSTINENTE | 46 | 3 | 1 | NaN | NaN | -0.000000 |
| código px | código px | object | 8663 | 8663 | 44 | 5 | 5 | NaN | NaN | 0.402738 |
| clave personal | clave personal | int64 | NaN | NaN | 0 | 49 | 46 | 32174.0 | 32696.0 | 0.074270 |
| Contacto por | Contacto por | object | Llamada por callweb, Whatsapp | Llamada por callweb, Whatsapp | 43 | 6 | 1 | NaN | NaN | -0.000000 |
Estadísticas descriptivas: Calcular medidas estadísticas básicas para cada columna numérica, como la media, mediana, desviación estándar, etc.
Resumen estadístico de la base de datos
| Compras acumuladas | Anticipo | Saldo | Saldo vencido | Monto promedio | # Transacciones | Días sin comprar | clave personal | |
|---|---|---|---|---|---|---|---|---|
| count | 49.000000 | 49.000000 | 49.0 | 49.0 | 49.000000 | 49.000000 | 49.000000 | 49.000000 |
| mean | 136827.730612 | 136827.730612 | 0.0 | 0.0 | 135975.485714 | 0.877551 | 24.795918 | 32300.367347 |
| std | 144951.041973 | 144951.041973 | 0.0 | 0.0 | 145695.631642 | 0.807069 | 21.970605 | 138.307431 |
| min | 0.000000 | 0.000000 | 0.0 | 0.0 | 0.000000 | 0.000000 | 0.000000 | 32174.000000 |
| 25% | 0.000000 | 0.000000 | 0.0 | 0.0 | 0.000000 | 0.000000 | 0.000000 | 32208.000000 |
| 50% | 24820.000000 | 24820.000000 | 0.0 | 0.0 | 15600.000000 | 1.000000 | 26.000000 | 32266.000000 |
| 75% | 280500.000000 | 280500.000000 | 0.0 | 0.0 | 280500.000000 | 1.000000 | 40.000000 | 32309.000000 |
| max | 430704.000000 | 430704.000000 | 0.0 | 0.0 | 430704.000000 | 4.000000 | 72.000000 | 32696.000000 |
Distribución de las variables: Crear gráficos de distribución (histogramas, gráficos de caja) para entender cómo se distribuyen las variables clave (por ejemplo, edad, tiempo de rehabilitación, tipo de tratamiento, etc.).
Identificación de patrones:
Matriz de correlación:
| Compras acumuladas | Anticipo | Saldo | Saldo vencido | Monto promedio | # Transacciones | Días sin comprar | clave personal | |
|---|---|---|---|---|---|---|---|---|
| Compras acumuladas | 1.000000 | 1.000000 | NaN | NaN | 0.999827 | 0.165830 | 0.562185 | -0.191608 |
| Anticipo | 1.000000 | 1.000000 | NaN | NaN | 0.999827 | 0.165830 | 0.562185 | -0.191608 |
| Saldo | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
| Saldo vencido | NaN | NaN | NaN | NaN | NaN | NaN | NaN | NaN |
| Monto promedio | 0.999827 | 0.999827 | NaN | NaN | 1.000000 | 0.151947 | 0.562155 | -0.195782 |
| # Transacciones | 0.165830 | 0.165830 | NaN | NaN | 0.151947 | 1.000000 | 0.340461 | 0.151589 |
| Días sin comprar | 0.562185 | 0.562185 | NaN | NaN | 0.562155 | 0.340461 | 1.000000 | -0.200966 |
| clave personal | -0.191608 | -0.191608 | NaN | NaN | -0.195782 | 0.151589 | -0.200966 | 1.000000 |
Análisis de Outliers (valores atípicos detectados):
| Outliers | |
|---|---|
| Compras acumuladas | 0 |
| Anticipo | 0 |
| Saldo | 0 |
| Saldo vencido | 0 |
| Monto promedio | 0 |
| # Transacciones | 1 |
| Días sin comprar | 0 |
| clave personal | 0 |
3. Segmentación de Prospectos¶
- Clasificación por tipo de tratamiento o diagnóstico: Solamente se tiene información de 3 personas que cumplieron con todo el proceso.
| Correo | Móvil | Teléfono | Teléfono alternativo | Fase | Origen | Compras acumuladas | Anticipo | Saldo | Saldo vencido | ... | Primer interacción | Etiquetas | estatus egreso | Estatus Egreso New | Fecha de Egreso | estatus clínico | Estatus Clínico New | código px | clave personal | Contacto por | |
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 3 | NaN | +52 (961) 262-6386 | Número no válido | +52 (961) 111-6109 | Cliente nuevo | Postratamiento | 0.0 | 0.0 | 0 | 0 | ... | 12/Dic/2024 | Oceánica-Conecta,postratamiento | TRATAMIENTO CONCLUIDO SATISFACTORIAMENTE | TRATAMIENTO CONCLUIDO SATISFACTORIAMENTE | 13/Dic/2024 | ABSTINENTE | ABSTINENTE | 8669 | 32206 | Llamada por callweb, Whatsapp |
| 5 | leosfermin@gmail.com | +52 (477) 240-7292 | Número no válido | Número no válido | Cliente nuevo | Postratamiento | 0.0 | 0.0 | 0 | 0 | ... | 27/Ene/2025 | Oceánica-Conecta,postratamiento | TRATAMIENTO CONCLUIDO SATISFACTORIAMENTE | NaN | 24/Ene/2025 | ABSTINENTE | NaN | 8681 | 32573 | Llamada por callweb, Whatsapp |
| 14 | federicovf.vega@gmail.com | +52 (999) 344-6059 | Número no válido | Número no válido | Cliente nuevo | Postratamiento | 0.0 | 0.0 | 0 | 0 | ... | 17/Ene/2025 | Oceánica-Conecta,postratamiento | TRATAMIENTO CONCLUIDO SATISFACTORIAMENTE | NaN | 17/Ene/2025 | ABSTINENTE | NaN | 8680 | 32283 | Llamada por callweb, Whatsapp |
3 rows × 42 columns
- Segmentación por grupo de edad: No se tiene información detallada del prospecto
Segmentación por tiempo estimado de rehabilitación:Las fechas no cooncuerdan para hacer una estimación.
Análisis de la frecuencia de contacto: No cuentan con con una secuencia de seguimiento para evaluar el desempeño del seguimiento.
4. Análisis de Conversión¶
No contamos con la información suficente para llegar a una conclusion sobre el tiempo de verncierion de un lead a un cliete.
Conclusiones Finales sobre la Base de Datos de Prospectos¶
1. Falta de Información sobre los Prospectos¶
- No se cuenta con información detallada sobre los prospectos, solo su país y estado de origen.
- No hay datos sobre dirección, edad, género u otras características clave que permitan una segmentación efectiva.
➡ Impacto:
- Sin detalles demográficos o socioeconómicos, es difícil hacer un análisis profundo sobre el perfil de los prospectos.
- No se pueden identificar patrones en la conversión de clientes.
2. Inconsistencias en las Fechas de Conversión¶
- Se registraron fechas de egreso previas a la primera interacción, lo cual es un error lógico en los datos.
- Solo hay 3 personas registradas como clientes, lo que limita la capacidad de análisis de la tasa de conversión.
➡ Impacto:
- No se puede calcular la tasa de conversión de prospectos a clientes con datos incorrectos.
- No se pueden analizar tiempos promedio de conversión o identificar cuellos de botella en el proceso.
3. Falta de Registro en el Seguimiento de Prospectos¶
- No hay un registro estructurado de los tiempos y métodos de seguimiento de los leads.
- No se sabe cuántos contactos se realizaron antes de que un prospecto decidiera ingresar.
➡ Impacto:
- No se puede evaluar la efectividad del proceso de captación.
- Es imposible identificar qué estrategias de contacto funcionan mejor.
Recomendaciones para Mejorar la Base de Datos¶
1. Estandarizar y Completar la Información¶
✅ Corregir las fechas inconsistentes en los registros de ingreso y egreso.
✅ Asegurar que todos los prospectos tengan al menos una fecha de interacción inicial válida.
✅ Capturar información clave de los prospectos desde el inicio (edad, género, tipo de adicción, historial médico relevante).
2. Registrar el Seguimiento de los Leads¶
✅ Implementar un sistema donde se registren todas las interacciones con cada prospecto (llamadas, correos, WhatsApp, reuniones).
✅ Agregar un campo para la fecha de cada contacto y el medio utilizado.
✅ Evaluar la efectividad de cada tipo de contacto en la conversión de prospectos.
3. Mejorar la Trazabilidad del Proceso¶
✅ Implementar un flujo de seguimiento que registre las siguientes métricas:
- Fecha de primera interacción.
- Fecha de cada seguimiento.
- Fecha de conversión (si aplica).
- Fecha de egreso con validación lógica.
✅ Agregar campos que permitan calcular métricas como tiempo promedio de conversión y tasa de éxito.
4. Implementar un Proceso de Validación de Datos¶
✅ Evitar errores de captura con reglas en el sistema de registro (ejemplo: no permitir fechas de egreso antes de la fecha de ingreso).
✅ Implementar una validación automática de formatos para teléfonos y correos electrónicos.
Conclusión Final¶
🔴 Actualmente, la base de datos no permite medir correctamente la tasa de conversión ni la efectividad del proceso de captación de prospectos, ni poder clasificar los tipos de prospectos que llegan.
🟢 Con las mejoras recomendadas, se podrá tener una base de datos funcional que permita tomar decisiones basadas en datos reales y corregir ineficiencias en el proceso de conversión de prospectos.
La Importancia de una Base de Datos Completa: Un Caso para el Análisis de Datos¶
Imagina que estás a cargo de un centro de rehabilitación y quieres entender mejor a tus prospectos y clientes. Buscas responder preguntas clave como:
- ¿De dónde provienen nuestros clientes?
- ¿Cuánto tiempo tardan en decidirse por el tratamiento?
- ¿Qué características tienen los prospectos que realmente se convierten en clientes?
- ¿Podemos predecir la demanda futura para estar mejor preparados?
Para responder estas preguntas con ciencia de datos, no basta con tener unos cuantos registros dispersos. Necesitamos una base de datos estructurada, con información suficiente y de calidad.
¿Cuántos datos son necesarios para hacer análisis efectivos?¶
Para realizar análisis estadísticos, correlaciones y predicciones confiables, debemos contar con:
1. Suficiente Volumen de Datos¶
2. Datos Claves para el Análisis¶
3. Coherencia y Calidad en los Datos¶
¿Qué se puede lograr con una base de datos bien estructurada?¶
Si logramos registrar y limpiar los datos correctamente, podemos hacer análisis como:
📊 Identificar los canales más efectivos para captar clientes.
📈 Predecir la demanda para prepararnos mejor en cada temporada.
🔍 Optimizar los seguimientos y mejorar la conversión de prospectos a clientes.
🤖 Aplicar modelos de Machine Learning para estimar cuánto tiempo tardará un cliente en tomar una decisión.
Conclusión¶
Si queremos aprovechar la ciencia de datos, mientras más datos tengas, mejor. Pero siempre es más importante la calidad que la cantidad
"No se puede mejorar lo que no se mide."
Diccionario de Datos¶
- Origen: Medio por el cual llegó el lead.
- Compras acumuladas: Monto total de compra.
- Anticipo: Anticipo al paquete que va a adquirir.
- Monto promedio: No se tiene claridad sobre su significado.
- # Transacciones: No se tiene claridad sobre su significado.
- Primer compra: Fecha de la primera compra (falta registrar datos).
- Última compra: Fecha de la última compra.
- Días sin comprar: Días que tiene el cliente sin comprar.
- Calle: Calle del cliente (falta registrar datos).
- Colonia: Colonia del cliente (falta registrar datos).
- Estado/Región: Estado de la república.
- País: País del lead.
- Próximo seguimiento: Fecha del próximo seguimiento y forma de contacto (falta registrar datos).
- Fecha de creación: Fecha en la que ingresó el lead.
- Última modificación del contacto: Fecha en la que parece que se interactuó con el cliente.
- Ejecutivo: Persona que atendió al lead. (¿Quién es "Cuidado Continuo"?)
- Iniciales: Iniciales del ejecutivo.
- Correo del ejecutivo: Correo del ejecutivo.
- Situación: ¿Qué significa? (Todos aparecen como "Descartados").
- Situación.1: ¿Qué significa? (Aparece "Archivado").
- Situación.2: ¿Qué significa? (Aparece "Activado").
- Primer interacción: Fecha del primer contacto.
- Etiquetas: ¿Qué representa? (Faltan datos por registrar).
- Estatus egreso: Cómo concluyó el tratamiento (falta registrar datos).
- Estatus Egreso New: ¿Es lo mismo que "Estatus egreso"?
- Fecha de nacimiento: Fecha en la que nació el lead.
- Fecha de egreso: Fecha en la que ingresó el lead (¿error en la nomenclatura?).
- Estatus clínico: Estatus en el que está el paciente al ingreso.
- Estatus Clínico New: ¿Es lo mismo que "Estatus clínico"?
- Código px: ¿Qué significa?
- Clave personal: ¿Qué significa?
- Contacto por: ¿Qué representa? (Faltan muchos datos por registrar).