# Analitica Creditos Otorgados en M√©xico



Bibliografias: https://sniiv.sedatu.gob.mx/Reporte/Datos_abiertos



In [1]:
# Importar las librerias con las que vamos a trabajar 
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

In [2]:
# Importas los datos
data_2024 = pd.read_csv('financiamientos_2024.csv', encoding='ISO-8859-1')
data_2023= pd.read_csv('financiamientos_2023.csv', encoding='ISO-8859-1')
data_2022 = pd.read_csv('financiamientos_2022.csv', encoding='ISO-8859-1')
data_2021 = pd.read_csv('financiamientos_2021.csv', encoding='ISO-8859-1')
data_2020 = pd.read_csv('financiamientos_2020.csv', encoding='ISO-8859-1')
data_2019 = pd.read_csv('financiamientos_2019.csv', encoding='ISO-8859-1')
data_2018 = pd.read_csv('financiamientos_2018.csv', encoding='ISO-8859-1')
data_2017 = pd.read_csv('financiamientos_2017.csv', encoding='ISO-8859-1')
data_2016 = pd.read_csv('financiamientos_2016.csv', encoding='ISO-8859-1')
data_2015 = pd.read_csv('financiamientos_2015.csv', encoding='ISO-8859-1')
data_2014 = pd.read_csv('financiamientos_2014.csv', encoding='ISO-8859-1')
data_2013 = pd.read_csv('financiamientos_2013.csv', encoding='ISO-8859-1')


In [3]:
#Base de datos que se pueden unificar
# Crear una lista con todas las bases de datos y sus nombres
dataframes = {
    "data_2024": data_2024, "data_2023": data_2023, "data_2022": data_2022, "data_2021": data_2021,
    "data_2020": data_2020, "data_2019": data_2019, "data_2018": data_2018, "data_2017": data_2017,
    "data_2016": data_2016, "data_2015": data_2015, "data_2014": data_2014, "data_2013": data_2013
}

# Obtener las columnas de la primera base como referencia
columnas_base = set(data_2024.columns)

# Crear listas para bases que coinciden y las que no
iguales = []
diferentes = {}

# Revisar cada base de datos
for nombre, df in dataframes.items():
    if set(df.columns) == columnas_base:
        iguales.append(nombre)
    else:
        diferentes[nombre] = list(set(df.columns) - columnas_base)  # Mostrar columnas distintas

# Mostrar resultados
print("‚úÖ Bases con las mismas columnas:", iguales)

if diferentes:
    print("\n‚ùå Bases con columnas diferentes:")
    for nombre, cols in diferentes.items():
        print(f"{nombre}: {cols}")


‚úÖ Bases con las mismas columnas: ['data_2024', 'data_2023', 'data_2022', 'data_2021', 'data_2020', 'data_2019', 'data_2018']

‚ùå Bases con columnas diferentes:
data_2017: ['minicipio']
data_2016: ['minicipio']
data_2015: ['minicipio']
data_2014: ['minicipio']
data_2013: ['minicipio']


In [4]:
iguales = [data_2024, data_2023, data_2022, data_2021, data_2020, 
              data_2019, data_2018]
data_total = pd.concat(iguales, ignore_index=True)
data = data_total.copy()
print("üìä Base de datos unificada con un total de", data_total.shape[0], "registros.")

üìä Base de datos unificada con un total de 2514052 registros.


## Filtrar por Estado y municipio

In [5]:
# Nombre del estado y municipio para filtrar
estado = 'Guanajuato'
muni = 'Le√≥n'

data_estado= data[data['entidad']==estado]
data_muni = data_estado[data_estado['municipio']==muni]
data_muni = data_muni[['a√±o', 'mes', 'municipio', 'organismo','modalidad', 'destino', 'tipo', 'sexo', 'edad_rango', 'ingresos_rango','vivienda_valor', 'acciones', 'monto']]


## Total de creditos hipotecarios otorgados 

In [6]:
# Historico de creditos hipotecarios  
creditos_year = data_muni.groupby('a√±o')['acciones'].sum()

# Convertir en DataFrame
creditos_year = creditos_year.reset_index()

# Renombrar columnas
creditos_year.columns = ["A√±o", "Cantidad"]

# Ordenar
creditos_year = creditos_year.sort_values(by="A√±o", ascending=False)

# Mostrar resultado
creditos_year

Unnamed: 0,A√±o,Cantidad
6,2024,16545.0
5,2023,14446.0
4,2022,14493.0
3,2021,18709.0
2,2020,16248.0
1,2019,16996.0
0,2018,17800.0


In [None]:
# Crear el CSV de la base de datos filtrados 
creditos_year.to_csv(f"Historico de creditos hipotecarios en municipio de {muni} 2018-2024.csv", index=False, encoding='ISO-8859-1')



## Vivienda Nueva 

In [7]:
# Historico de creditos otorgados para vivienda nuevas 
creditos_vivi_nueva_year = data_muni[data_muni['modalidad'] == 1]

# Historico de creditos hipotecarios  
creditos_vivi_nueva_year = creditos_vivi_nueva_year.groupby('a√±o')['acciones'].sum()

# Convertir en DataFrame
creditos_vivi_nueva_year = creditos_vivi_nueva_year.reset_index()

# Renombrar columnas
creditos_vivi_nueva_year.columns = ["A√±o", "Cantidad"]

# Ordenar
creditos_vivi_nueva_year = creditos_vivi_nueva_year.sort_values(by="A√±o", ascending=False)

# Mostrar resultado
creditos_vivi_nueva_year

Unnamed: 0,A√±o,Cantidad
6,2024,5516.0
5,2023,6259.0
4,2022,6394.0
3,2021,7345.0
2,2020,8052.0
1,2019,7994.0
0,2018,9010.0


In [None]:
# Crear el CSV de la base de datos filtrados 
creditos_vivi_nueva_year.to_csv(f"Historico de creditos hipotecarios en el municipio de {muni} para la adquicion de vivienda nueva 2018-2024.csv", index=False, encoding='ISO-8859-1')

### Tipo de vivienda nueva que se adquirio por a√±o

In [11]:
# Tipo de vivienda nueva que se adquirio 
'''
    Econ√≥mica. Superficie construida en promedio: 40m2, costo promedio: 118 UMAs cuentan con 1 ba√±o, cocina, √°rea de usos m√∫ltiples.
    Popular. Superficie construida en promedio: 50m2, costo promedio: de 118.1 a 200 UMAs cuentan con 1 ba√±o, cocina, estancia, comedor, de 1 a 2 rec√°maras y 1 caj√≥n de estacionamiento.
    Tradicional. Superficie construida en promedio: 71m2, costo promedio: de 200.1 a 350 UMAs cuentan con 1 y ¬Ω ba√±os, cocina, estancia-comedor, de 2 a 3 rec√°maras, 1 caj√≥n de estacionamiento.
    Media. Superficie construida en promedio: 102m2, costo promedio: de 350.1 a 750 UMAs cuentan con 2 ba√±os, cocina, sala, comedor, de 2 a 3 rec√°maras, cuarto de servicio y 1 a 2 cajones de estacionamiento.
    Residencial. Superficie construida en promedio: 156m2, costo promedio: de 750.1 a 1,500 UMAs cuentan con 3 a 4 ba√±os, cocina, sala, comedor, de 3 a 4 rec√°maras, cuarto de servicio, sala familiar y 2 o 3 cajones de estacionamiento.
    Residencial plus. Superficie construida en promedio: m√°s de 156m2, costo promedio: m√°s de 750.1 a 1,500 UMAs cuentan con m√°s de 4 a√±os, cocina, sala, comedor, m√°s de 4 rec√°maras, cuarto de servicio, sala familiar y m√°s de 3 cajones de estacionamiento
'''

reemplazos = {
    
    1: "Econ√≥mica",
    2: "Popular",
    3: "Tradicional",
    4: "Media",
    5: "Residencial",
    6: "Residencial plus"
}
# Filtrar solo las viviendas con modalidad 1
vivi_nuv = data_muni[data_muni['modalidad'] == 1].copy()

# Reemplazar los valores en 'vivienda_valor'
vivi_nuv["vivienda_valor"] = vivi_nuv["vivienda_valor"].replace(reemplazos)


# Agrupar por a√±o y tipo de vivienda, y sumar acciones
conteo_por_a√±o = (
    vivi_nuv
    .groupby(["a√±o", "vivienda_valor"])["acciones"]
    .sum()
    .unstack()
    .fillna(0)
    .astype(int)  # opcional: convertir a enteros
)

# Mostrar el resultado como DataFrame
df_conteo = pd.DataFrame(conteo_por_a√±o)
df_conteo

vivienda_valor,Econ√≥mica,Media,Popular,Residencial,Residencial plus,Tradicional
a√±o,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1
2018,39,1856,4267,830,132,1885
2019,44,2585,2304,873,180,2008
2020,5,2541,2488,1056,198,1764
2021,10,2452,2095,1199,301,1260
2022,3,2225,1781,1103,273,1009
2023,2,2215,1611,1200,243,988
2024,1,2644,538,1116,212,1005


In [None]:
# Crear el CSV de la base de datos filtrados 
df_conteo.to_csv(f"Tipo de vivienda que se adquirio nueva por a√±o en el municipio de {muni} 2018-2024.csv", encoding='ISO-8859-1')

### Promedio de precios por el tipo de vivienda nueva que se adquirio con un credito hipotecario

In [None]:
# Calcular el promedio de 'monto' agrupando por 'a√±o' y 'vivienda_valor'
promedios_monto = vivi_nuv.groupby(["a√±o", "vivienda_valor"])["monto"].mean().unstack()

# Formatear los valores con separadores de miles y dos decimales
promedios_monto = promedios_monto.map(lambda x: f"{x:,.2f}" if pd.notnull(x) else "-")

# Ordenar de m√°s reciente a m√°s antiguo
promedios_monto = promedios_monto.sort_index(ascending=False)

# Mostrar el DataFrame
promedios_monto


In [None]:
# Crear el CSV de la base de datos filtrados 
promedios_monto.to_csv(f"Valor de la vivienda nueva promedio que se adquiriro con credito hipotecario en el municipio de {muni} 2018-2024.csv", encoding='ISO-8859-1')

Diccionario del rango de salarios establecidos por UMA¬¥s

In [None]:
# Valor de la UMA en 2024
UMA_MENSUAL = 3300.53

# Definir los rangos de ingreso en UMAs
rangos_UMA = {
    1: 2.6,
    2: (2.61 + 4.00) / 2,
    3: (4.01 + 6.00) / 2,
    4: (6.01 + 9.00) / 2,
    5: (9.01 + 12.00) / 2,
    6: 12  # Tomamos 12 como m√≠nimo para "M√°s de 12"
}

# Convertir los valores a pesos
rangos_pesos = {clave: valor * UMA_MENSUAL for clave, valor in rangos_UMA.items()}

# Crear el DataFrame
df_ingresos = pd.DataFrame(list(rangos_pesos.items()), columns=["Rango de Ingresos", "Equivalente en Pesos"])

# Formatear los valores en pesos
df_ingresos["Equivalente en Pesos"] = df_ingresos["Equivalente en Pesos"].apply(lambda x: f"${x:,.2f}")

# Mostrar el DataFrame
df_ingresos


### Rango de salio de las personas que adquirieron una vivienda nueva con un credito hipotecario en 2024 por tipo de vivienda

In [None]:
# Contar la frecuencia de cada 'ingreso_rango' dentro de cada tipo de vivienda

'''
Rango de ingresos de los acreditados expresados en Unidades de Medida y Actualizaci√≥n (UMAs) mensuales
La Unidad de Medida y Actualizaci√≥n (UMA) en 2024 tiene un valor de $108.57 pesos diarios o $3,300.53 pesos mensuales.

1	2.6 o menos  
2	2.61 a 4.00 
3	4.01 a 6.00
4	6.01 a 9.00
5	9.01 a 12.00 
6	M√°s de 12   

'''
vivi_nuv_2024 = vivi_nuv[vivi_nuv['a√±o']==2024]
ingresos_por_vivienda = vivi_nuv_2024.groupby("vivienda_valor")["ingresos_rango"].value_counts().unstack().fillna(0)
# Diccionario de reemplazo
reemplazo_ingresos = {
    1.0: "8K",
    2.0: "10K",
    3.0: "16K",
    4.0: "24K",
    5.0: "34K",
    6.0: "39K"
}

# Renombrar las columnas del DataFrame
ingresos_por_vivienda.rename(columns=reemplazo_ingresos, inplace=True)


# Mostrar el DataFrame resultante
ingresos_por_vivienda


In [None]:

# Configurar el tama√±o del gr√°fico
plt.figure(figsize=(10,6))

# Crear el mapa de calor# Crear el mapa de calor con la paleta 'Reds'
sns.heatmap(ingresos_por_vivienda, annot=True, fmt=".0f", cmap="Reds", linewidths=0.5, cbar=True)

# Etiquetas y t√≠tulo
plt.xlabel("Rango de Ingresos", fontsize=12)
plt.ylabel("Tipo de Vivienda", fontsize=12)
plt.title("Mapa de Calor: Distribuci√≥n de Ingresos por Tipo de Vivienda", fontsize=14)

# Mostrar el gr√°fico
plt.show()

### Organismo que otro los creditos por tipo de vivienda 2024

In [None]:
# Organismo mque otrogo el credito
organismos_por_vivienda = vivi_nuv_2024.groupby("vivienda_valor")["organismo"].value_counts().unstack().fillna(0)

organismo_dict = {
    1: "INFONAVIT",
    2: "CNBV",
    3: "FOVISSSTE",
    4: "SHF",
    5: "CONAVI",
    6: "INVI",
    7: "Banjercito",
    8: "H√°bitat M√©xico",
    9: "CFE",
    10: "ISSFAM",
    11: "PEMEX",
    12: "FONHAPO",
    13: "PDZP SEDESOL",
    14: "SOFOLES AMFE",
    15: "ISSSTELEON",
    16: "INDIVI",
    17: "COVEG",
    18: "COESVI",
    19: "IMEVIS",
    20: "IVEM",
    21: "ITAVU",
    22: "IVNL",
    23: "INVIVIENDA",
    24: "IVEY",
    25: "INFOVIR",
    26: "INSUS"  
    
}    
# Instituto Nacional del Suelo Sustentable

# Renombrar las columnas del DataFrame
organismos_por_vivienda.rename(columns=organismo_dict, inplace=True)

# Mostrar el DataFrame resultante
organismos_por_vivienda

In [None]:
# Crear el CSV de la base de datos filtrados 
organismos_por_vivienda.to_csv(f"Cantidad de creditos hipotecarios para vivienda nueva que otorgaron las instituciones por tipo de vivienda en el municipio de {muni} 2024.csv", encoding='ISO-8859-1')

### Sexo de la persona que se le otrogo el credito por tipo de vivienda 2024

In [None]:
# Sexo
sexo_por_vivienda = vivi_nuv_2024.groupby("vivienda_valor")["sexo"].value_counts().unstack().fillna(0)
# Diccionario de reemplazo
reemplazo_sex = {
    1.0: "H",
    2.0: "M",
  
    
}

# Renombrar las columnas del DataFrame
sexo_por_vivienda.rename(columns=reemplazo_sex, inplace=True)

# Mostrar el DataFrame resultante
sexo_por_vivienda

### Rango de edad de las personas que se le otrogo el crediot por el tipo de vivienda 2024

In [None]:
# Rango edad
edad_por_vivienda = vivi_nuv_2024.groupby("vivienda_valor")["edad_rango"].value_counts().unstack().fillna(0)
# Diccionario de reemplazo
reemplazo_edad = {
    1.0: "29",
    2.0: "30-59",
    3.0: "60",
    
}

# Renombrar las columnas del DataFrame
edad_por_vivienda.rename(columns=reemplazo_edad, inplace=True)


# Mostrar el DataFrame resultante
edad_por_vivienda

## Vivienda Usada Reventa 

In [None]:
# Historico de creditos otorgados para vivienda nuevas en Mazatl√°n 
creditos_vivi_usada_year = data_muni[data_muni['modalidad'] == 3]
creditos_vivi_usada_year = creditos_vivi_usada_year["a√±o"].value_counts().reset_index()
creditos_vivi_usada_year.columns = ["A√±o", "Cantidad"]
creditos_vivi_usada_year = creditos_vivi_usada_year.sort_values(by="A√±o", ascending=False)
creditos_vivi_usada_year

In [None]:
# Crear el CSV de la base de datos filtrados 
creditos_vivi_usada_year.to_csv(f"Historico de creditos hipotecarios en el municipio de {muni} para la adquicion de vivienda usada 2018-2024.csv", index=False, encoding='ISO-8859-1')

In [None]:
# Filtrar solo las viviendas con modalidad 1
vivi_usa = data_muni[data_muni['modalidad'] == 3].copy()

# Reemplazar los valores en 'vivienda_valor'
vivi_usa["vivienda_valor"] = vivi_usa["vivienda_valor"].replace(reemplazos)


# Agrupar por a√±o y contar los valores de 'vivienda_valor'
conteo_por_a√±o = vivi_usa.groupby(["a√±o", "vivienda_valor"]).size().unstack().fillna(0)

# Convertir a DataFrame y mostrar
df_conteo = pd.DataFrame(conteo_por_a√±o)

# Mostrar el DataFrame
df_conteo

In [None]:
# Crear el CSV de la base de datos filtrados 
df_conteo.to_csv(f"Tipo de vivienda que se adquirio usada por a√±o en el municio de {muni} 2018-2024.csv", encoding='ISO-8859-1')

In [None]:
# Calcular el promedio de 'monto' agrupando por 'a√±o' y 'vivienda_valor'
promedios_monto = vivi_usa.groupby(["a√±o", "vivienda_valor"])["monto"].mean().unstack()

# Formatear los valores con separadores de miles y dos decimales
promedios_monto = promedios_monto.map(lambda x: f"{x:,.2f}" if pd.notnull(x) else "-")

# Ordenar de m√°s reciente a m√°s antiguo
promedios_monto = promedios_monto.sort_index(ascending=False)

# Mostrar el DataFrame
promedios_monto


In [None]:
# Crear el CSV de la base de datos filtrados 
promedios_monto.to_csv(f"Valor de la vivienda usada promedio que se adquiriro con credito hipotecario en el municipio de {muni} 2018-2024.csv", encoding='ISO-8859-1')

In [None]:
vivi_usa_2024 = vivi_usa[vivi_usa['a√±o']==2024]
# Organismo mque otrogo el credito
organismos_por_vivienda = vivi_usa_2024.groupby("vivienda_valor")["organismo"].value_counts().unstack().fillna(0)


# Renombrar las columnas del DataFrame
organismos_por_vivienda.rename(columns=organismo_dict, inplace=True)

# Mostrar el DataFrame resultante
organismos_por_vivienda

In [None]:
# Crear el CSV de la base de datos filtrados 
organismos_por_vivienda.to_csv(f"Cantidad de creditos hipotecarios para vivienda usada que otorgaron las instituciones por tipo de vivienda en el municipio de {muni} 2018-2024.csv", encoding='ISO-8859-1')

In [None]:
vivi_usa = data_muni[data_muni['modalidad'] == 3]
# Reemplazar los valores en la columna 'vivienda_valor'

vivi_usa["vivienda_valor"] = vivi_usa["vivienda_valor"].replace(reemplazos)

vivi_usa['vivienda_valor'].value_counts()

In [None]:
# Calcular el promedio de 'monto' por cada tipo de 'vivienda_valor'
promedios_monto = vivi_usa.groupby("vivienda_valor")["monto"].mean().reset_index()

# Renombrar columnas
promedios_monto.columns = ["Tipo de Vivienda", "Monto Promedio"]

# Formatear n√∫meros con separadores de miles y dos decimales
promedios_monto["Monto Promedio"] = promedios_monto["Monto Promedio"].apply(lambda x: f"{x:,.2f}")

# Mostrar el DataFrame
promedios_monto

In [None]:
ingresos_por_vivienda_usa = vivi_usa.groupby("vivienda_valor")["ingresos_rango"].value_counts().unstack().fillna(0)

# Renombrar las columnas del DataFrame
ingresos_por_vivienda_usa.rename(columns=reemplazo_ingresos, inplace=True)


# Mostrar el DataFrame resultante
ingresos_por_vivienda_usa

In [None]:

plt.figure(figsize=(10,6))

# Crear el mapa de calor# Crear el mapa de calor con la paleta 'Reds'
sns.heatmap(ingresos_por_vivienda_usa, annot=True, fmt=".0f", cmap="Reds", linewidths=0.5, cbar=True)

# Etiquetas y t√≠tulo
plt.xlabel("Rango de Ingresos", fontsize=12)
plt.ylabel("Tipo de Vivienda", fontsize=12)
plt.title("Mapa de Calor: Distribuci√≥n de Ingresos por Tipo de Vivienda", fontsize=14)

# Mostrar el gr√°fico
plt.show()

In [None]:
organismos_por_vivienda_usa = vivi_usa.groupby("vivienda_valor")["organismo"].value_counts().unstack().fillna(0)

# Mostrar el DataFrame resultante
organismos_por_vivienda_usa

In [None]:
# Filtrar solo los organismos que aparecen en el DataFrame
organismos_presentes_usa = [organismo_dict[i] for i in list(vivi_usa['organismo'].unique())]

# Mostrar la lista resultante
organismos_presentes_usa

In [None]:
sexo_por_vivienda_usa = vivi_usa.groupby("vivienda_valor")["sexo"].value_counts().unstack().fillna(0)
# Diccionario de reemplazo
reemplazo_sex = {
    1.0: "H",
    2.0: "M",
  
    
}

# Renombrar las columnas del DataFrame
sexo_por_vivienda_usa.rename(columns=reemplazo_sex, inplace=True)

# Mostrar el DataFrame resultante
sexo_por_vivienda_usa

In [None]:
edad_por_vivienda_usa = vivi_usa.groupby("vivienda_valor")["edad_rango"].value_counts().unstack().fillna(0)


# Renombrar las columnas del DataFrame
edad_por_vivienda_usa.rename(columns=reemplazo_edad, inplace=True)


# Mostrar el DataFrame resultante
edad_por_vivienda_usa