# Análisis de variables macroeconómicas y microeconómicas que afectan la demanda inmobiliaria en zonas turísticas de playa en México

**Autores:**  
**Julio Olaf González Guzmán** — Científico de Datos  
Correo electrónico: julio@ideasfrescas.com.mx  
**Fernando Fuente Villa** — CEO, Ideas Frescas  

---

## Resumen (Abstract)

*Párrafo de 150–300 palabras que resume:*

---

## Objetivo general

Construir un modelo cuantitativo que permita **identificar las variables más influyentes en la demanda del sector inmobiliario** en una ciudad, integrando tanto indicadores macroeconómicos como factores microeconómicos y sectoriales.

## Objetivos específicos

- Recopilar un conjunto representativo de variables macroeconómicas, microeconómicas y del mercado inmobiliario local.  
- Formular hipótesis sobre el impacto potencial de cada variable en la demanda de vivienda.  
- Normalizar y estructurar los datos para su análisis cuantitativo.  
- Aplicar técnicas estadísticas y modelos de selección de variables (*feature selection*) para priorizar las más influyentes.  
- Generar visualizaciones y reportes que expliquen los hallazgos de forma clara y fundamentada.

---

## Justificación

En un entorno donde las decisiones inmobiliarias implican altos riesgos financieros, la identificación precisa de las variables que condicionan la demanda se vuelve un elemento clave para la planificación, la inversión estratégica y la evaluación de proyectos. Este estudio busca contribuir con una herramienta de análisis robusta, adaptable a distintos contextos urbanos y capaz de fundamentar decisiones tanto del sector público como privado.

---

# Introducción

El estudio de la demanda inmobiliaria se ha vuelto cada vez más complejo en un entorno económico caracterizado por alta volatilidad, transformación digital y cambios en los patrones de movilidad urbana y social. Comprender los factores que determinan esta demanda no solo permite identificar oportunidades de inversión, sino también planificar políticas públicas y proyectos inmobiliarios con base en evidencia cuantitativa.

En este contexto, el presente trabajo de investigación busca **identificar, recopilar y analizar un conjunto amplio de variables macroeconómicas, microeconómicas y sectoriales** que influyen directa o indirectamente en la demanda del sector inmobiliario en una ciudad determinada. A través de la construcción de una base de datos integral y el uso de técnicas de modelado matemático, se pretende determinar **cuáles son las variables más relevantes y cómo se correlacionan con el comportamiento del mercado inmobiliario**.

Diversos estudios han señalado la influencia que factores como el crecimiento económico (PIB), la inflación, el desempleo y las tasas de interés tienen sobre el mercado de vivienda (Taltavull & White, 2020; Glaeser et al., 2008). No obstante, en economías abiertas y destinos turísticos, también cobran especial importancia variables como el turismo, la renta vacacional, el flujo de vuelos internacionales, así como la percepción de seguridad y la disponibilidad de servicios básicos.

Este enfoque mixto —que combina variables macroeconómicas estructurales con variables microeconómicas específicas del territorio— permitirá construir un modelo explicativo más robusto y sensible a las particularidades locales. A su vez, el análisis multivariable buscará identificar patrones no evidentes a simple vista y priorizar aquellas variables que tengan un impacto significativo en el comportamiento de la demanda inmobiliaria.

---

## Palabras clave (Keywords)

*De 3 a 6 palabras clave que representen el contenido temático.*

---

## Revisión de la literatura (Marco teórico)

### ¿Qué es la demanda?

La **demanda** es un concepto central en economía que representa la **cantidad de bienes o servicios que los consumidores están dispuestos y son capaces de adquirir a distintos precios durante un periodo determinado**.

Para que exista demanda, deben cumplirse los siguientes elementos:

- **Deseo:** El consumidor debe querer el bien o servicio.
- **Capacidad de pago:** No basta con desearlo; debe tener recursos económicos para adquirirlo.
- **Relación con el precio:** Existe una relación inversa entre precio y cantidad demandada (Ley de la demanda).
- **Periodo de tiempo:** Siempre se analiza en un marco temporal específico (ej. demanda mensual, anual).

#### Tipos de demanda

Es importante distinguir los distintos enfoques desde los cuales puede analizarse la demanda:

- **Demanda individual:** Cantidad que un solo consumidor estaría dispuesto a comprar.
- **Demanda agregada o de mercado:** Suma de las demandas individuales en un mercado específico.
- **Demanda efectiva:** Aquella que se concreta en una transacción real (ventas).
- **Demanda potencial:** Interés latente que podría convertirse en efectiva si cambian ciertas condiciones (por ejemplo, mejora de acceso al crédito, disminución de precios o aumento de ingresos).

#### Determinantes de la demanda

La demanda no depende solo del precio; existen múltiples factores que la afectan:

1. **Ingreso del consumidor:** A mayor ingreso, suele aumentar la demanda de bienes normales (como viviendas); para bienes inferiores, puede disminuir.
2. **Precio del bien:** Un aumento en el precio generalmente reduce la demanda (ley de la demanda).
3. **Precios de bienes relacionados:**
   - **Sustitutos:** Si sube el precio de un sustituto (ej. rentas vacacionales), puede aumentar la demanda de viviendas.
   - **Complementarios:** Si sube el precio de un bien complementario (ej. hipotecas), puede reducirse la demanda.
4. **Gustos y preferencias:** Cambios culturales, demográficos o de estilo de vida pueden modificar la demanda.
5. **Expectativas futuras:** Si se espera un alza de precios, los consumidores pueden adelantar compras.
6. **Población:** A mayor número de habitantes o visitantes (como en ciudades turísticas), mayor demanda potencial de vivienda.

#### Aplicación al mercado inmobiliario en zonas turísticas

En el contexto de zonas turísticas como Mazatlán:

- La **demanda efectiva** se observa en el número de ventas o absorciones mensuales.
- La **demanda potencial** incluye inversionistas o turistas interesados, pero que aún no han comprado.
- Los determinantes pueden incluir también:
  - Afluencia de turismo nacional e internacional.
  - Oferta de crédito hipotecario para extranjeros.
  - Seguridad y percepción del destino.
  - Políticas de desarrollo urbano y fiscal.
---

# Metodología

### 1. Tipo de enfoque

Se trata de un problema de **regresión supervisada**, ya que:

- Se cuenta con variables independientes (*features*) y una variable dependiente (ventas).  
- El objetivo es predecir valores numéricos continuos.  
- Se busca entender qué variables explican mejor las ventas (*feature importance* y análisis de sensibilidad).

### 2. Algoritmos recomendados

**Fase exploratoria – Modelos interpretables base:**

- **Regresión Lineal Múltiple**  
  ✔ Interpretable  
  ✔ Fácil de explicar a *stakeholders*

**Modelos más robustos – No lineales:**

- **Gradient Boosting Regressor** (XGBoost, LightGBM)  
  ✔ Alta precisión predictiva  
  ✔ Captura interacciones no lineales  
  ✔ Permite análisis SHAP para interpretación

- **Random Forest Regressor**  
  ✔ Robusto al ruido  
  ✔ Útil para ensamble y comparación  
  ✔ Fácil de ajustar

- **k-Nearest Neighbors (k-NN)**  
  ✔ Útil como *benchmark* no paramétrico  
  ✔ Capta tendencias locales

**Modelos opcionales avanzados:**

- **Redes Neuronales Profundas (DNN)**  
  ➤ Aplicable si se cuenta con grandes volúmenes de datos  
  ➤ Menor interpretabilidad

### 3. Herramientas y tecnologías

**Lenguaje:**  
Python (por su flexibilidad y ecosistema científico)

**Librerías:**  
- `pandas`, `numpy` → procesamiento de datos  
- `scikit-learn` → regresión lineal, random forest, k-NN  
- `xgboost`, `lightgbm` → modelos de *boosting*  
- `shap` → interpretación de modelos  
- `matplotlib`, `seaborn`, `plotly` → visualización  
- `danfo.js` (si se usa en frontend con JavaScript/TypeScript)

---

## Hipótesis

> Si el entorno macroeconómico presenta:
> - Crecimiento del PIB nacional  
> - Tasa de interés de referencia baja  
> - Tasa de desempleo decreciente  
>
> Y las condiciones locales reflejan:
> - Incremento del PIB municipal/turístico de Mazatlán  
> - Buena percepción de seguridad  
> - Aumento de rentas vacacionales  
> - Crecimiento en la inversión extranjera directa  
> - Ausencia de desastres naturales significativos  
>
> Entonces, **las ventas inmobiliarias tenderán a incrementarse** en Mazatlán.

---

## Estrategia de datos para la estructura del análisis

### Variables dependientes
- Ventas Inmobiliarias Totales (mensuales/trimestrales)

#### Dimensiones analíticas y variables consideradas

Esta tabla organiza las variables independientes del análisis de la demanda inmobiliaria en zonas turísticas de playa, agrupándolas por dimensión temática. Cada variable incluye su fuente sugerida, frecuencia de actualización y el impacto teórico esperado sobre la demanda.

### Variables a Considerar para el análisis del mercado inmobiliario y su contexto


| Dimensión         | Nombre profesional                                | Descripción breve                                     | Descripción detallada                                                                                                           |
|------------------|----------------------------------------------------|-------------------------------------------------------|----------------------------------------------------------------------------------------------------------------------------------|
| Oferta           | Inventario histórico total de vivienda nueva       | Total acumulado de viviendas nuevas en inventario     | Corresponde al total histórico de unidades de vivienda nueva disponibles en el mercado, sin haberse vendido, por periodo.      |
|                  | Precio promedio final por unidad nueva ofertada    | Precio promedio de venta ofertado por unidad          | Precio de lista promedio final de las viviendas nuevas ofertadas, considerando descuentos, bonificaciones o promociones.       |
|                  | Precio promedio por metro cuadrado de vivienda nueva | Valor promedio por m² de viviendas ofertadas         | Promedio del precio por metro cuadrado de las viviendas nuevas en venta, con base en el área construida.                       |
|                  | Inventario histórico de vivienda vertical nueva    | Total histórico de viviendas verticales sin vender    | Unidades acumuladas en inventario de vivienda vertical (edificios) no vendidas desde su incorporación al mercado.              |
|                  | Inventario histórico de vivienda horizontal nueva  | Total histórico de viviendas horizontales sin vender  | Unidades de vivienda tipo casa en inventario, acumuladas históricamente sin haber sido vendidas.                               |
|                  | Reventas de vivienda                               | Total histórico de viviendas usadas en reventa        | Total acumulado de unidades de vivienda que han sido revendidas tras su primera adquisición.                                   |
|                  | Viviendas en remate bancario histórico             | Acumulado de viviendas ofertadas por instituciones    | Total de viviendas ofertadas como remates bancarios debido a incumplimientos crediticios.                                      |
|                  | Oferta total acumulada                             | Oferta histórica de viviendas nuevas y usadas         | Suma del inventario acumulado de viviendas nuevas, reventas y remates disponibles históricamente.                             |
|                  | Proyectos inmobiliarios históricos                 | Total acumulado de desarrollos registrados            | Cantidad de desarrollos inmobiliarios residenciales registrados a lo largo del tiempo.                                         |
|                  | Desarrolladores inmobiliarios históricos           | Total acumulado de desarrolladores activos            | Total de empresas o personas físicas que han desarrollado proyectos inmobiliarios.                                              |
|                  | Marcas comerciales de desarrolladores              | Cantidad de marcas de desarrolladores                 | Total de nombres o marcas comerciales utilizadas por desarrolladores.                                                           |
|                  | Promedio de proyectos por empresa desarrolladora   | Número promedio de desarrollos por desarrollador      | Relación promedio entre desarrollos totales y desarrolladores registrados.                                                      |
|                  | Meses de inventario de vivienda                    | Tiempo estimado de venta del inventario actual        | Estima cuánto tiempo duraría el inventario disponible al ritmo actual de ventas.                                                |
| Demanda          | Ventas de vivienda                                 | Total de unidades vendidas en un periodo              | Cantidad de unidades habitacionales vendidas efectivamente durante un periodo determinado.                                      |
|                  | Absorción promedio por desarrollo                  | Ventas mensuales promedio por desarrollo              | Promedio mensual de unidades vendidas por desarrollo, mide velocidad de ventas.                                                 |
|                  | Créditos para adquisición de vivienda nueva        | Créditos hipotecarios para vivienda nueva             | Financiamientos otorgados para compra de vivienda nueva.                                                                        |
|                  | Créditos para reventa de vivienda                  | Créditos hipotecarios para vivienda usada             | Financiamientos otorgados para adquirir vivienda usada o en reventa.                                                            |
|                  | Demanda potencial local de vivienda                | Personas locales con intención de compra              | Estimación de personas residentes con interés en adquirir vivienda pero que aún no concretan su compra.                        |
|                  | Demanda potencial foránea                          | Personas externas con intención de compra             | Estimación de nacionales o extranjeros interesados en comprar vivienda en la zona.                                              |
| Macroeconómicas  | Producto Interno Bruto nacional real               | Medida del crecimiento económico nacional             | Valor generado por el país a precios constantes (base 2018), excluyendo inflación.                                              |
|                  | Tasa de interés de referencia                      | Costo base del dinero                                 | Tasa fijada por el banco central que influye en el costo del crédito.                                                           |
|                  | Tasa de desempleo                                  | Porcentaje de población activa sin empleo             | Indicador de personas activas laboralmente que no encuentran empleo.                                                            |
|                  | Índice Nacional de Precios al Consumidor (INPC)    | Variación general de precios                          | Porcentaje de incremento en precios de bienes y servicios de consumo general.                                                   |
|                  | Índice de Precios al Consumidor                    | Nivel general de precios                              | Refleja precios de una canasta representativa de bienes y servicios.                                                            |
|                  | Índice de precios en materiales de construcción    | Evolución del precio de insumos                       | Mide variación en precios de insumos como acero, concreto, etc.                                                                 |
|                  | Actividad Económica Estatal (ITAEE)                | Dinamismo económico regional                          | Mide la actividad económica trimestral por entidad federativa.                                                                  |
|                  | Recaudación estatal por ISAIE                      | Ingresos por adquisición de inmuebles                 | Total recaudado por el impuesto sobre adquisición de inmuebles.                                                                 |
|                  | Unidades económicas activas (DENUE)               | Empresas y negocios registrados                       | Total de unidades económicas activas registradas en el país.                                                                    |
| Turismo          | Producto Interno Bruto turístico estimado          | Valor económico generado por turismo                  | Estimación basada en turistas, estadía promedio y gasto diario.                                                                 |
|                  | Llegadas aéreas de turistas                        | Turistas que ingresan por vía aérea                   | Número de personas que llegan mediante transporte aéreo.                                                                        |
|                  | Llegadas terrestres de turistas                    | Turistas que ingresan por vía terrestre               | Visitantes que acceden mediante carreteras o autobuses.                                                                         |
|                  | Llegadas totales de turistas                       | Total de turistas                                     | Acumulado de turistas, independientemente del medio de transporte.                                                              |
|                  | Turistas internacionales                           | Visitantes extranjeros                                | Personas de otros países que visitan por turismo.                                                                               |
|                  | Turistas nacionales                                | Visitantes nacionales                                 | Personas de otras regiones del país.                                                                                            |
|                  | Estadía promedio de turistas extranjeros           | Días promedio de estancia (extranjeros)               | Duración media de la visita de turistas extranjeros.                                                                            |
|                  | Estadía promedio de turistas nacionales            | Días promedio de estancia (nacionales)                | Duración media de la visita de turistas nacionales.                                                                             |
|                  | Estadía promedio general                           | Promedio general de estadía                           | Duración promedio considerando turistas nacionales y extranjeros.                                                               |
|                  | Gasto diario promedio por turista extranjero       | Gasto promedio diario (extranjero)                    | Estimación del gasto diario de un turista extranjero.                                                                           |
|                  | Gasto diario promedio por turista nacional         | Gasto promedio diario (nacional)                      | Estimación del gasto diario de un turista nacional.                                                                             |
|                  | Inversión extranjera directa en turismo e inmuebles| Capital extranjero destinado al sector                | Flujo de capital extranjero hacia desarrollos turísticos e inmobiliarios.                                                       |
| Hotelería        | Inventario de hoteles                              | Total de hoteles registrados                          | Cantidad de hoteles activos registrados.                                                                                        |
|                  | Habitaciones hoteleras totales                     | Habitaciones construidas                              | Total de habitaciones ofertadas en el sector hotelero.                                                                          |
|                  | Habitaciones disponibles en hoteles                | Habitaciones listas para renta                        | Habitaciones disponibles para ser ocupadas.                                                                                     |
|                  | Habitaciones ocupadas                              | Habitaciones rentadas                                 | Número de habitaciones efectivamente utilizadas.                                                                                 |
|                  | Porcentaje de ocupación hotelera                   | Nivel de ocupación en hoteles                         | Relación entre habitaciones ocupadas y disponibles.                                                                             |
|                  | Huéspedes totales en hoteles                       | Personas hospedadas                                   | Total de personas que se alojaron en hoteles.                                                                                   |
|                  | Promedio de ocupantes por habitación hotelera      | Media de huéspedes por habitación                     | Promedio de personas hospedadas por habitación ocupada.                                                                         |
| Renta turística  | Inventario total de viviendas vacacionales         | Propiedades en renta temporal                         | Total de propiedades disponibles en plataformas como Airbnb, Vrbo, etc.                                                         |
|                  | Disponibilidad de viviendas vacacionales           | Propiedades listadas activamente                      | Viviendas activas y disponibles para renta en el periodo.                                                                       |
|                  | Ocupación de viviendas vacacionales                | Viviendas efectivamente rentadas                      | Número de viviendas que registraron al menos una renta efectiva.                                                                |
|                  | Porcentaje de ocupación en viviendas vacacionales  | Tasa de ocupación en propiedades vacacionales         | Relación entre propiedades ocupadas y disponibles.                                                                              |
|                  | Huéspedes en viviendas vacacionales                | Personas hospedadas en propiedades vacacionales       | Total de turistas alojados en viviendas turísticas.                                                                             |
|                  | Ocupantes promedio por unidad vacacional           | Promedio de personas por vivienda rentada             | Media de turistas por cada unidad ocupada en el periodo.                                                                        |

**A continuación se describen las entidades clave utilizadas en el modelo predictivo y sus principales atributos:**

1. Proyectos inmobiliarios

    - development_id, nombre_proyecto
    - tipo_proyecto (vertical, horizontal, lotificación)
    - ubicación (estado, municipio, zona)
    - unidades_totales, unidades_disponibles, metros_cuadrados, precio_m2
    - estatus_de_venta, fecha_inicio, meses_en_el_mercado

2. Ventas históricas

    - fecha, ventas_vertical, ventas_horizontal
    - precio_promedio_venta, absorpciòn_mensual, tipo_vivienda

3. Indicadores macroeconómicos

    - tasa_interés_referencia (Banxico)
    - tasa_desempleo, inflación, PIB estatal
    - remesas_recibidas, tipo_de_cambio

4. Turismo y movilidad

    - llegadas_aéreas_turistas, cruceros, pasajeros_totales
    - estacionalidad_turística (alta/baja)

5. Inventario e inicio de obra
    
    - nuevas_unidades_registradas, inicio_de_construcción, remates_bancarios
    - número_de_proyectos_nuevos

6. Demografía y vivienda

    - población_urbana, crecimiento_demográfico
    - promedio_personas_por_vivienda, número_viviendas_nuevas, viviendas_temporales

**¿Cuáles son las estrategias para la recopilación, instrumentación, preprocesamiento y protección de los datos?**

1. Recopilación de datos

    - Fuentes públicas: INEGI, Banxico, Sectur, Conavi, RUV, DATATUR, INAI
    - Bases propias: Inventarios inmobiliarios internos, bases de ventas, precios por m²
    - Scraping inteligente: Precios e inventarios en portales (Inmuebles24, Lamudi, MercadoLibre Inmuebles)
    - APIs: Google Flights / SerpAPI (turismo), Indicadores Banxico

2. Instrumentación del pipeline

    - Automatización con scripts Python / Danfo.js
    - Carga centralizada con manifest.json y validación de estructura
    - Flujo orquestado desde función runAnalysisFromLocalData() en la app
    - Logs de auditoría para rastrear cada ejecución del análisis

3. Preprocesamiento de datos

    - Imputación de valores faltantes (media, interpolación temporal, regresión)
    - Normalización / escalado (MinMaxScaler o StandardScaler)
    - Creación de features derivados (ej. absorción = ventas / inventario)
    - Control de multicolinealidad (VIF, PCA)
    - Validación cruzada temporal (TimeSeriesSplit)

4. Protección y seguridad de los datos

    - Anonimización: No se manejan datos personales ni identificadores sensibles
    - Control de acceso: Roles diferenciados (admin, capturista, viewer)
    - Base de datos segura: MongoDB Atlas o Firebase Firestore con reglas de acceso
    - Logs de auditoría: Todas las consultas y cargas se registran
    - Backups regulares: en servidores seguros o servicios cloud

---

## Supuestos del modelo

1. Todas las variables independientes afectan **causalmente** el comportamiento de las ventas inmobiliarias.  
2. No hay intervención gubernamental extraordinaria que distorsione el mercado.  
3. Los datos disponibles son representativos y suficientemente detallados en frecuencia temporal.  
4. El ciclo económico nacional y local impacta directa o indirectamente la disposición a invertir en propiedades turísticas.  
5. Las ventas inmobiliarias son un buen **proxy de la demanda efectiva**.

---

## Próximos pasos

- Recolección y limpieza de las bases de datos mencionadas.  
- Análisis exploratorio y generación de visualizaciones por variable.  
- Modelado econométrico (regresión múltiple, modelos ARIMA, árboles de decisión).  
- Validación de hipótesis y construcción de indicadores predictivos.


8. Resultados
Presentación clara de los hallazgos.

Tablas, gráficas, mapas, estadísticas.

# Recolección y limpieza de las bases de datos

In [2]:
# -------Librerias -------#

import requests
import pandas as pd
import dateparser
import sys
import numpy as np

# Add the directory containing your "Funciones" folder to the system path.
sys.path.append(r"C:\Users\julio\OneDrive\Documentos\Trabajo\Ideas Frescas")

# Now you can import the "Funciones" module (which is the folder)
# and then access the "leer_archivo" function.
from Funciones.Funciones import leer_archivo

In [3]:
# ------ Datos Softec -------- #
# Ventas anuales

{
    Ventas:[
        ventas_2014: [
            {
                RP: 129,
                R: 119,
                M: 357,
                E: 1056,
                S: 934
            }
        ],
        ventas_2015: [
            {
                RP: 139,
                R: 153,
                M: 427,
                E: 809,
                S: 1033
            }
        ],
        ventas_2016: [
            {
                RP: 108,
                R: 200
                M: 456,
                E: 292,
                S: 880
            }
        ],
        ventas_2017: [
            {
                RP: 151,
                R: 366,
                M: 469,
                E: 615,
                S: 454
            }
        ],
        ventas_2014: [
            {
                RP: 129,
                R:119,
                M: 357,
                E: 1056,
                S: 934
            }
        ],

    ]
}

SyntaxError: invalid syntax (3370775463.py, line 6)

## Oferta

**Precio promedio final de las unidades en preventa**

Representa el precio de lista promedio anual de las viviendas nuevas en preventa, considerando el monto final ofertado en el mercado tras aplicar descuentos, bonificaciones o promociones. Refleja el valor real al que se están comercializando las unidades disponibles durante el año. Fuente: Ideas Frescas

**Precio promedio final de las unidades en preventa horizontal**

Representa el precio de lista promedio anual de las viviendas nuevas en preventa horizontal, considerando el monto final ofertado en el mercado tras aplicar descuentos, bonificaciones o promociones. Refleja el valor real al que se están comercializando las unidades disponibles durante el año. Fuente: Ideas Frescas

**Precio promedio final de las unidades en preventa vertical**

Representa el precio de lista promedio anual de las viviendas nuevas en preventa vertical, considerando el monto final ofertado en el mercado tras aplicar descuentos, bonificaciones o promociones. Refleja el valor real al que se están comercializando las unidades disponibles durante el año. Fuente: Ideas Frescas

In [4]:

# Crear DataFrame
data_precios = {
    "fecha": [
        "Ene 2020", "Jul 2020", "Nov 2020", "Mar 2021", "Ago 2021", "Dic 2021",
        "Mar 2022", "Ago 2022", "Nov 2022", "Feb 2023", "May 2023", "Ago 2023",
        "Nov 2023", "Feb 2024", "May 2024", "Ago 2024", "Nov 2024", "Feb 2025", "May 2025"
    ],
    "Precio_promedio_final_de_las_unidades_en_preventa_horizontal": [
        2562015, 1834715, 2884501, 2442493, 2756257, 2812127,
        2518970, 2394729, 2319731, 2705412, 3477620, 3602268,
        3446037, 3521113, 3499479, 3606924, 3692115, 3623229, 3650369
    ],
    "Precio_promedio_final_de_las_unidades_en_preventa_vertical": [
        2983366, 3202131, 3419073, 3630662, 3468021, 4655617,
        3960604, 4090146, 3959076, 4132570, 4259204, 4461061,
        4719311, 4899906, 4949497, 5026845, 5033246, 4901951, 4901951
    ]
}

df_precios = pd.DataFrame(data_precios)

# Extraer año de la columna 'fecha'
df_precios["año"] = df_precios["fecha"].str.extract(r'(\d{4})').astype(int)

# Calcular el precio promedio total
df_precios["Precio_promedio_final_de_las_unidades_en_preventa"] = (
    df_precios["Precio_promedio_final_de_las_unidades_en_preventa_horizontal"] + df_precios["Precio_promedio_final_de_las_unidades_en_preventa_vertical"]
) / 2

# Agrupar por año y calcular el promedio
df_anual = df_precios.groupby("año").agg({
    "Precio_promedio_final_de_las_unidades_en_preventa_horizontal": "mean",
    "Precio_promedio_final_de_las_unidades_en_preventa_vertical": "mean",
    "Precio_promedio_final_de_las_unidades_en_preventa": "mean"
}).round(0).reset_index()


df_anual_t = df_anual.copy()
df_anual_t.rename(columns={"año": "date"}, inplace=True)
df_anual_t.to_csv("Data/Precio_promedio_final_de_las_unidades_en_preventa.csv", index=False)
df_anual_t

Unnamed: 0,date,Precio_promedio_final_de_las_unidades_en_preventa_horizontal,Precio_promedio_final_de_las_unidades_en_preventa_vertical,Precio_promedio_final_de_las_unidades_en_preventa
0,2020,2427077.0,3201523.0,2814300.0
1,2021,2670292.0,3918100.0,3294196.0
2,2022,2411143.0,4003275.0,3207209.0
3,2023,3307834.0,4393036.0,3850435.0
4,2024,3579908.0,4977374.0,4278641.0
5,2025,3636799.0,4901951.0,4269375.0


**Precio promedio por metro cuadrado de vivienda preventa (horizontal y vertical)**

Promedio anual del precio por metro cuadrado de las viviendas preventa ofertadas en el mercado, calculado con base en el área construida de cada unidad. Este indicador incluye tanto desarrollos verticales como horizontales y refleja el valor general del mercado primario por unidad de superficie construida. Fuente: Ideas Frescas

**Precio promedio por metro cuadrado de vivienda vertical preventa**

Promedio anual del precio por metro cuadrado de las unidades habitacionales verticales en el mercado de vivienda preventa, calculado con base en su área construida. Este indicador refleja el valor de oferta efectivo por unidad de superficie en desarrollos verticales durante el año. Fuente: Ideas Frescas

**Precio promedio por metro cuadrado de vivienda horizontal nueva**


Promedio anual del precio por metro cuadrado de las viviendas horizontales nuevas ofertadas, calculado con base en el área construida de cada unidad. Este indicador refleja el valor de mercado por unidad de superficie en desarrollos de tipo horizontal durante el año. Fuente: Ideas Frescas

In [5]:

# Datos

# Datos
data_m2 = {
    "fecha": [
        "Ene 2020", "Jul 2020", "Nov 2020", "Mar 2021", "Ago 2021", "Dic 2021",
        "Mar 2022", "Ago 2022", "Nov 2022", "Feb 2023", "May 2023", "Ago 2023",
        "Nov 2023", "Feb 2024", "May 2024", "Ago 2024", "Nov 2024", "Feb 2025", "May 2025"
    ],
    "precio_prom_m2_vertical": [
        29088, 29654, 29707, 30478, 32333, 34941,
        38071, 40475, 43200, 47628, 47315, 50016,
        51569, 54254, 56759, 55385, 56287, 56444, 56191
    ],
    "precio_prom_m2_horizontal": [
        16989, 18501, 18917, 19053, 20000, 22597,
        21057, 22065, 20439, 21550, 24882, 25067,
        26320, 26918, 27403, 27861, 29543, 29909, 30116
    ]
}

# Crear DataFrame
df_m2 = pd.DataFrame(data_m2)

# Extraer año de la fecha
df_m2["año"] = df_m2["fecha"].str.extract(r'(\d{4})').astype(int)

# Calcular promedio total
df_m2["precio_prom_m2_total"] = (df_m2["precio_prom_m2_vertical"] + df_m2["precio_prom_m2_horizontal"]) / 2

# Agrupar por año y calcular promedios
df_m2_anual = df_m2.groupby("año").agg({
    "precio_prom_m2_vertical": "mean",
    "precio_prom_m2_horizontal": "mean",
    "precio_prom_m2_total": "mean"
}).round(0).reset_index()


df_m2_anual
# 6. Guardar como CSV
df_anual_m_t = df_m2_anual.copy()
df_anual_m_t.rename(columns={"año": "date"}, inplace=True)
df_anual_m_t.to_csv("Data/precio_prom_m2_.csv", index=False)
df_anual_m_t

Unnamed: 0,date,precio_prom_m2_vertical,precio_prom_m2_horizontal,precio_prom_m2_total
0,2020,29483.0,18136.0,23809.0
1,2021,32584.0,20550.0,26567.0
2,2022,40582.0,21187.0,30884.0
3,2023,49132.0,24455.0,36793.0
4,2024,55671.0,27931.0,41801.0
5,2025,56318.0,30012.0,43165.0


**Inventario histórico de viviendas en preventa**

Total acumulado de unidades habitacionales nuevas en preventa que permanecen disponibles en el mercado durante cada periodo de referencia. Representa el stock no vendido en el segmento de vivienda nueva, útil para analizar saturación, rotación o presión de oferta a lo largo del tiempo. Fuente: Ideas Frescas

**Inventario histórico de vivienda vertical preventa**

Total acumulado de unidades habitacionales verticales (en edificios) que permanecen disponibles en el mercado desde su incorporación como oferta. Refleja el stock de vivienda nueva no vendida en desarrollos verticales, útil para evaluar la absorción y saturación del segmento a lo largo del tiempo. Fuente: Ideas Frescas

**Inventario histórico de vivienda horizontal nueva**

Total acumulado de unidades habitacionales horizontales (tipo casa) que permanecen disponibles en el mercado desde su incorporación como oferta. Representa el inventario histórico de vivienda nueva no vendida en desarrollos horizontales, útil para analizar la dinámica de absorción y presión de oferta en este segmento.

In [6]:

# Crear DataFrame
data = {
    "fecha": [
        "Ene 2020", "Jul 2020", "Nov 2020", "Mar 2021", "Ago 2021", "Dic 2021",
        "Mar 2022", "Ago 2022", "Nov 2022", "Feb 2023", "May 2023", "Ago 2023",
        "Nov 2023", "Feb 2024", "May 2024", "Ago 2024", "Nov 2024", "Feb 2025", "May 2025"
    ],
    "Inventario histórico de vivienda vertical preventa": [
        1164, 1436, 1374, 1477, 1595, 1735,
        3061, 2616, 2378, 2580, 2654, 2712,
        2920, 3329, 3510, 3739, 3706, 3837, 4298
    ],
    "Inventario histórico de vivienda horizontal nueva": [
        1136, 719, 431, 667, 578, 571,
        908, 1274, 1078, 920, 905, 911,
        895, 776, 818, 758, 822, 830, 746
    ]
}

df = pd.DataFrame(data)

# Calcular total de viviendas por fila
df["Inventario histórico de viviendas en preventa"] = df["Inventario histórico de vivienda vertical preventa"] + df["Inventario histórico de vivienda horizontal nueva"]

# Extraer año
df["año"] = df["fecha"].str.extract(r'(\d{4})').astype(int)

# Agrupar por año y sumar viviendas
df_viviendas_anual = df.groupby("año").agg({
    "Inventario histórico de vivienda vertical preventa": "sum",
    "Inventario histórico de vivienda horizontal nueva": "sum",
    "Inventario histórico de viviendas en preventa": "sum"
}).reset_index()

df_viviendas_anual_t = df_viviendas_anual.copy()
df_viviendas_anual_t.rename(columns={"año": "date"}, inplace=True)
df_viviendas_anual_t.to_csv("Data/Inventario histórico de viviendas en preventa.csv", index=False)
df_viviendas_anual_t


Unnamed: 0,date,Inventario histórico de vivienda vertical preventa,Inventario histórico de vivienda horizontal nueva,Inventario histórico de viviendas en preventa
0,2020,3974,2286,6260
1,2021,4807,1816,6623
2,2022,8055,3260,11315
3,2023,10866,3631,14497
4,2024,14284,3174,17458
5,2025,8135,1576,9711


**Reventa de viviendas**

Total acumulado de unidades de vivienda que se están vendiendo tras su primera adquisición.

**Viviendas en remate bancario histórico**

Total de viviendas que son ofertadas como remates bancarios debido a incumplimientos crediticios.

**Oferta total acumulada**

Suma total del inventario acumulado de viviendas nuevas, reventas y remates disponibles a lo largo del tiempo.

**Histórico de proyectos inmobiliarios residenciales**


Cantidad acumulada de desarrollos inmobiliarios residenciales registrados en el mercado a lo largo del tiempo. Este indicador permite analizar la evolución de la oferta de nuevos proyectos habitacionales, así como identificar tendencias de expansión, concentración o desaceleración del sector. Fuente: Ideas Frescas

**Histórico de proyectos inmobiliarios verticales**


Cantidad acumulada de desarrollos habitacionales verticales (torres de departamentos) registrados en el mercado a lo largo del tiempo. Este indicador refleja la evolución de la oferta de proyectos verticales, útil para analizar la densificación urbana, la verticalización del suelo y las tendencias del sector residencial en altura.Fuente: Ideas Fresca

**Histórico de proyectos inmobiliarios horizontales**


Cantidad acumulada de desarrollos habitacionales horizontales (tipo casa o fraccionamiento) registrados en el mercado a lo largo del tiempo. Este indicador permite analizar la evolución de la oferta de vivienda de baja densidad, así como las dinámicas de expansión urbana en zonas periféricas o suburbanas.Fuente: Ideas Fresca

In [7]:

# Datos
data_proyectos = {
    "fecha": [
        "Ene 2020", "Jul 2020", "Nov 2020", "Mar 2021", "Ago 2021", "Dic 2021",
        "Mar 2022", "Ago 2022", "Nov 2022", "Feb 2023", "May 2023", "Ago 2023",
        "Nov 2023", "Feb 2024", "May 2024", "Ago 2024", "Nov 2024", "Feb 2025", "May 2025"
    ],
    "proyectos_vertical": [
        60, 74, 75, 92, 93, 90,
        91, 88, 89, 99, 107, 111,
        116, 120, 121, 127, 139, 139, 142
    ],
    "proyectos_horizontal": [
        17, 17, 15, 16, 16, 17,
        18, 19, 19, 23, 26, 26,
        25, 21, 20, 20, 23, 22, 21
    ]
}


# Crear DataFrame
df_proyectos = pd.DataFrame(data_proyectos)

# Calcular total por fila
df_proyectos["proyectos_totales"] = (
    df_proyectos["proyectos_vertical"] + df_proyectos["proyectos_horizontal"]
)

# Extraer año de la fecha
df_proyectos["año"] = df_proyectos["fecha"].str.extract(r'(\d{4})').astype(int)

# Agrupar por año y calcular promedios
df_proyectos_anual = df_proyectos.groupby("año").agg({
    "proyectos_vertical": "sum",
    "proyectos_horizontal": "sum",
    "proyectos_totales": "sum"
}).round(1).reset_index()

# Mostrar resultados
df_proyectos_anual_t = df_proyectos_anual.copy()
df_proyectos_anual_t.rename(columns={"año": "date"}, inplace=True)
df_proyectos_anual_t.to_csv("Data/proyectos_inmobiliarios.csv", index=False)
df_proyectos_anual_t

Unnamed: 0,date,proyectos_vertical,proyectos_horizontal,proyectos_totales
0,2020,209,49,258
1,2021,275,49,324
2,2022,268,56,324
3,2023,433,100,533
4,2024,507,84,591
5,2025,281,43,324


**Desarrolladores inmobiliarios histórico**

**Marcas comerciales de desarrolladores**

**Promedio de proyectos por empresa desarrolladora**

**Meses de inventario de vivienda**


---

## Demanda

**Ventas efectivas de vivienda en preventa**

Cantidad de unidades habitacionales que han sido vendidas efectivamente durante un periodo determinado.Cantidad de unidades habitacionales que han sido vendidas efectivamente durante un periodo determinado mientras se encontraban en etapa de preventa. Este indicador refleja el comportamiento de absorción del mercado antes de la entrega física de las viviendas, siendo clave para medir el ritmo de colocación en fases tempranas del proyecto.

**Ventas efectivas de vivienda vertical en preventa**

Cantidad de unidades verticales habitacionales que han sido vendidas efectivamente durante un periodo determinado.Cantidad de unidades habitacionales que han sido vendidas efectivamente durante un periodo determinado mientras se encontraban en etapa de preventa. Este indicador refleja el comportamiento de absorción del mercado antes de la entrega física de las viviendas, siendo clave para medir el ritmo de colocación en fases tempranas del proyecto. Fuente: Ideas Frescas

**Ventas efectivas de vivienda horizontales en preventa**

Cantidad de unidades horizontales habitacionales que han sido vendidas efectivamente durante un periodo determinado.Cantidad de unidades habitacionales que han sido vendidas efectivamente durante un periodo determinado mientras se encontraban en etapa de preventa. Este indicador refleja el comportamiento de absorción del mercado antes de la entrega física de las viviendas, siendo clave para medir el ritmo de colocación en fases tempranas del proyecto. Fuente: Ideas Frescas

In [8]:

# Datos
data_ventas = {
    "fecha": [
        "Dic 2021", "Mar 2022", "Ago 2022", "Nov 2022",
        "Feb 2023", "May 2023", "Ago 2023", "Nov 2023",
        "Feb 2024", "May 2024", "Ago 2024", "Nov 2024",
        "Feb 2025", "May 2025"
    ],
    "Ventas efectivas de vivienda vertical en preventa": [
        129.1, 63.8, 131.7, 237.7,
        221.9, 251.3, 147.2, 210.6,
        178.0, 222.0, 197.0, 141.4,
        147.1, 131.8
    ],
    "Ventas efectivas de vivienda horizontales en preventa": [
        36.1, 21.3, 84.0, 64.8,
        70.8, 91.5, 42.5, 47.3,
        43.3, 19.0, 28.9, 79.3,
        40.3, 36.7
    ]
}

# Crear DataFrame
df_ventas = pd.DataFrame(data_ventas)

# Calcular ventas totales
df_ventas["Ventas efectivas de vivienda en preventa"] = df_ventas["Ventas efectivas de vivienda vertical en preventa"] + df_ventas["Ventas efectivas de vivienda horizontales en preventa"]

# Extraer el año
df_ventas["año"] = df_ventas["fecha"].str.extract(r'(\d{4})').astype(int)

# Agrupar por año y sumar ventas
df_ventas_anual = df_ventas.groupby("año").agg({
    "Ventas efectivas de vivienda vertical en preventa": "sum",
    "Ventas efectivas de vivienda horizontales en preventa": "sum",
    "Ventas efectivas de vivienda en preventa": "sum"
}).round(1).reset_index()

# Mostrar resultados
df_ventas_anual.rename(columns={"año": "date"}, inplace=True)
df_ventas_anual.to_csv("Data/Ventas efectivas de vivienda en preventa.csv", index=False)
df_ventas_anual



Unnamed: 0,date,Ventas efectivas de vivienda vertical en preventa,Ventas efectivas de vivienda horizontales en preventa,Ventas efectivas de vivienda en preventa
0,2021,129.1,36.1,165.2
1,2022,433.2,170.1,603.3
2,2023,831.0,252.1,1083.1
3,2024,738.4,170.5,908.9
4,2025,278.9,77.0,355.9


**Créditos hipotecarios para adquisición de vivienda nueva**

Cantidad de financiamientos hipotecarios otorgados para la compra de vivienda nueva. Este indicador se considera una aproximación confiable a las ventas formalizadas ante notario, ya que implica la firma de escritura y la formalización legal de la transacción a través de una institución financiera.



In [9]:


# Leer archivo
ventas_viv_nueva_creditos_maza = leer_archivo("C:/Users/julio/OneDrive/Documentos/Trabajo/Ideas Frescas/Data/crudos/Creditos/Mazatlan-Ventas-historicas-creditos.xlsx", hoja=1)

# Crear columna 'fecha'
ventas_viv_nueva_creditos_maza['fecha'] = ventas_viv_nueva_creditos_maza.apply(
    lambda row: dateparser.parse(f"{row['mes']} {row['año']}"), axis=1
)

# Redondear al inicio del trimestre
ventas_viv_nueva_creditos_maza['fecha'] = ventas_viv_nueva_creditos_maza['fecha'].dt.to_period('Q').dt.start_time

# Extraer año
ventas_viv_nueva_creditos_maza['año'] = ventas_viv_nueva_creditos_maza['fecha'].dt.year

# Filtrar solo columnas numéricas excluyendo 'año'
columnas_numericas = ventas_viv_nueva_creditos_maza.select_dtypes(include='number').columns.drop('año')

# Agrupar por año y sumar
ventas_anual_viv_nue = ventas_viv_nueva_creditos_maza.groupby('año')[columnas_numericas].sum().reset_index()

# Reordenar columnas (año primero)
columnas_ordenadas = ['año'] + [col for col in ventas_anual_viv_nue.columns if col != 'año']
ventas_anual_viv_nue = ventas_anual_viv_nue[columnas_ordenadas]

# Mostrar resultado
ventas_anual_viv_nue

Unnamed: 0,año,Económica,Media,No disponible,Popular,Residencial,Residencial plus,Tradicional
0,2012,137,112,272,2255,28,1,299
1,2013,13,218,280,2459,89,19,508
2,2014,3,457,64,2004,103,17,663
3,2015,1,579,3,2281,152,21,599
4,2016,2,599,0,2199,235,52,429
5,2017,0,430,0,2035,139,34,388
6,2018,124,485,0,1217,159,47,151
7,2019,34,773,0,1071,383,66,216
8,2020,1,580,0,1325,481,73,195
9,2021,3,575,0,412,630,123,580


**Créditos hipotecarios para adquisición de vivienda usada**


Cantidad de financiamientos hipotecarios otorgados para la compra de viviendas usadas o en reventa. Este indicador refleja las transacciones del mercado secundario que han sido formalizadas mediante crédito y escritura pública, permitiendo analizar el comportamiento de la demanda en viviendas previamente habitadas.


In [10]:

# Leer archivo (hoja por default = 0)
ventas_viv_exi_creditos_maza = leer_archivo('C:/Users/julio/OneDrive/Documentos/Trabajo/Ideas Frescas/Data/crudos/Creditos/Mazatlan-Ventas-historicas-creditos.xlsx')

# Crear columna 'fecha' combinando mes y año
ventas_viv_exi_creditos_maza['fecha'] = ventas_viv_exi_creditos_maza.apply(
    lambda row: dateparser.parse(f"{row['mes']} {row['año']}"), axis=1
)

# Redondear al inicio del trimestre
ventas_viv_exi_creditos_maza['fecha'] = ventas_viv_exi_creditos_maza['fecha'].dt.to_period('Q').dt.start_time

# Extraer año para agrupación
ventas_viv_exi_creditos_maza['año'] = ventas_viv_exi_creditos_maza['fecha'].dt.year

# Filtrar columnas numéricas, excluyendo 'año'
columnas_numericas = ventas_viv_exi_creditos_maza.select_dtypes(include='number').columns.drop('año')

# Agrupar por año y sumar
ventas_anual_viv_exi_maza = ventas_viv_exi_creditos_maza.groupby('año')[columnas_numericas].sum().reset_index()

# Reordenar columnas
columnas_ordenadas = ['año'] + [col for col in ventas_anual_viv_exi_maza.columns if col != 'año']
ventas_anual_viv_exi_maza = ventas_anual_viv_exi_maza[columnas_ordenadas]

# Mostrar resultado
ventas_anual_viv_exi_maza

Unnamed: 0,año,Económica,Media,No disponible,Popular,Residencial,Residencial plus,Tradicional
0,2012,44,37,64,405,7,0,398
1,2013,32,191,68,490,74,28,458
2,2014,12,250,34,626,69,16,423
3,2015,82,201,0,739,43,6,309
4,2016,87,195,0,636,28,13,368
5,2017,99,199,0,684,40,9,471
6,2018,379,340,0,647,107,32,359
7,2019,238,240,0,665,73,14,463
8,2020,182,287,0,643,86,30,519
9,2021,22,352,0,507,140,47,675


**Demanda efectiva de vivienda**


- Cantidad total de unidades habitacionales demandadas de forma efectiva durante un periodo determinado. Se compone de tres fuentes principales:
- Ventas en preventa: Unidades colocadas por desarrolladores antes de su entrega física, estimadas por registros de comercialización.
- Créditos para vivienda nueva: Transacciones formalizadas ante notario mediante financiamiento hipotecario para adquirir vivienda nueva.
- Créditos para vivienda usada: Ventas de unidades del mercado secundario adquiridas mediante crédito hipotecario.

Fuente: Ideas Frescas y SNIIV (vhttps://sniiv.sedatu.gob.mx/)

In [11]:
'''
# 1. Sumar ventas totales por fila en cada DataFrame
ventas_anual_total_1 = df_ventas_anual.copy()
ventas_anual_total_1["total_anual"] = ventas_anual_total_1[
    ["ventas_vertical", "ventas_horizontal"]
].sum(axis=1)
ventas_anual_total_1 = ventas_anual_total_1[["año", "total_anual"]]

ventas_anual_total_2 = ventas_anual_viv_nue.copy()
ventas_anual_total_2["total_anual"] = ventas_anual_total_2.drop(columns=["año"]).sum(axis=1)
ventas_anual_total_2 = ventas_anual_total_2[["año", "total_anual"]]

ventas_anual_total_3 = ventas_anual_viv_exi_maza.copy()
ventas_anual_total_3["total_anual"] = ventas_anual_total_3.drop(columns=["año"]).sum(axis=1)
ventas_anual_total_3 = ventas_anual_total_3[["año", "total_anual"]]

# 2. Renombrar para diferenciarlos
ventas_anual_total_1.rename(columns={"total_anual": "ventas_mensuales_total"}, inplace=True)
ventas_anual_total_2.rename(columns={"total_anual": "ventas_credito_nueva"}, inplace=True)
ventas_anual_total_3.rename(columns={"total_anual": "ventas_credito_existente"}, inplace=True)

# 3. Unir por año
df_ventas_combinadas = ventas_anual_total_1.merge(
    ventas_anual_total_2, on="año", how="outer"
).merge(
    ventas_anual_total_3, on="año", how="outer"
).sort_values("año")

# 4. Calcular total combinado
df_ventas_combinadas["value"] = df_ventas_combinadas[
    ["ventas_mensuales_total", "ventas_credito_nueva", "ventas_credito_existente"]
].sum(axis=1)

# 5. Renombrar columna 'año' a 'date'
df_ventas_combinadas.rename(columns={"año": "date"}, inplace=True)
df_ventas_combinadas = df_ventas_combinadas[["date","value"]].copy()

# 6. Guardar como CSV
df_ventas_combinadas.to_csv("Data/Demanda_efectiva_de_vivienda.csv", index=False)

# Mostrar resultado final
df_ventas_combinadas
'''

'\n# 1. Sumar ventas totales por fila en cada DataFrame\nventas_anual_total_1 = df_ventas_anual.copy()\nventas_anual_total_1["total_anual"] = ventas_anual_total_1[\n    ["ventas_vertical", "ventas_horizontal"]\n].sum(axis=1)\nventas_anual_total_1 = ventas_anual_total_1[["año", "total_anual"]]\n\nventas_anual_total_2 = ventas_anual_viv_nue.copy()\nventas_anual_total_2["total_anual"] = ventas_anual_total_2.drop(columns=["año"]).sum(axis=1)\nventas_anual_total_2 = ventas_anual_total_2[["año", "total_anual"]]\n\nventas_anual_total_3 = ventas_anual_viv_exi_maza.copy()\nventas_anual_total_3["total_anual"] = ventas_anual_total_3.drop(columns=["año"]).sum(axis=1)\nventas_anual_total_3 = ventas_anual_total_3[["año", "total_anual"]]\n\n# 2. Renombrar para diferenciarlos\nventas_anual_total_1.rename(columns={"total_anual": "ventas_mensuales_total"}, inplace=True)\nventas_anual_total_2.rename(columns={"total_anual": "ventas_credito_nueva"}, inplace=True)\nventas_anual_total_3.rename(columns={"tota

**Absorción promedio anual por desarrollo en preventa**

Promedio mensual de unidades habitacionales vendidas por desarrollo durante su etapa de preventa, calculado en un periodo anual. Este indicador refleja la velocidad de colocación de la oferta en proyectos activos, y permite estimar la eficiencia comercial y la rotación del inventario por desarrollo dentro del mercado primario. .Fuente: Ideas Fresca

**Absorción promedio anual por desarrollo vertical en preventa**


Promedio mensual de unidades vendidas por cada desarrollo habitacional vertical (torres de departamentos) en etapa de preventa, calculado a lo largo de un año. Este indicador mide la velocidad de colocación del inventario en proyectos verticales, y permite analizar la eficiencia comercial y la dinámica de absorción en el mercado de vivienda en altura .Fuente: Ideas Fresca



**Absorción promedio anual por desarrollo horizontal en preventa**


Promedio mensual de unidades vendidas por cada desarrollo habitacional horizontal (viviendas tipo casa) en etapa de preventa, calculado a lo largo de un año. Este indicador permite evaluar la velocidad de colocación del inventario en fraccionamientos o conjuntos residenciales de baja densidad, y es útil para analizar la eficiencia comercial en el segmento horizontal del mercado de vivienda nueva.  Fuente: Ideas Fresca


In [12]:

# Datos
data_prom_ventas = {
    "fecha": [
        "Dic 2021", "Mar 2022", "Ago 2022", "Nov 2022",
        "Feb 2023", "May 2023", "Ago 2023", "Nov 2023",
        "Feb 2024", "May 2024", "Ago 2024", "Nov 2024",
        "Feb 2025", "May 2025"
    ],
    "Absorción promedio anual por desarrollo vertical en preventa": [
        1.4, 0.7, 1.5, 2.7,
        2.2, 2.3, 1.3, 1.8,
        1.5, 1.8, 1.6, 1.0,
        1.1, 0.9
    ],
    "Absorción promedio anual por desarrollo horizontal en preventa": [
        2.0, 1.2, 4.4, 3.4,
        3.1, 3.5, 1.6, 1.9,
        2.1, 1.0, 1.4, 3.4,
        1.8, 1.7
    ]
}

# Crear DataFrame
df_prom_ventas = pd.DataFrame(data_prom_ventas)

# Extraer año de la fecha
df_prom_ventas["año"] = df_prom_ventas["fecha"].str.extract(r'(\d{4})').astype(int)

# Calcular promedio total por fila
df_prom_ventas["Absorción promedio anual por desarrollo en preventa"] = (
    df_prom_ventas["Absorción promedio anual por desarrollo vertical en preventa"] + df_prom_ventas["Absorción promedio anual por desarrollo horizontal en preventa"]
) / 2

# Agrupar por año y calcular el promedio anual
df_prom_ventas_anual = df_prom_ventas.groupby("año").agg({
    "Absorción promedio anual por desarrollo vertical en preventa": "mean",
    "Absorción promedio anual por desarrollo horizontal en preventa": "mean",
    "Absorción promedio anual por desarrollo en preventa": "mean"
}).round(2).reset_index()

# Mostrar resultados
df_prom_ventas_anual.rename(columns={"año": "date"},inplace=True)
df_prom_ventas_anual.to_csv("Data/Absorción promedio anual por desarrollo en preventa.csv", index=False)
df_prom_ventas_anual


Unnamed: 0,date,Absorción promedio anual por desarrollo vertical en preventa,Absorción promedio anual por desarrollo horizontal en preventa,Absorción promedio anual por desarrollo en preventa
0,2021,1.4,2.0,1.7
1,2022,1.63,3.0,2.32
2,2023,1.9,2.52,2.21
3,2024,1.48,1.98,1.72
4,2025,1.0,1.75,1.38


**Demanda potencial local de vivienda**


Estimación del número de personas residentes con interés o necesidad de adquirir una vivienda, pero que aún no han concretado la compra. Esta variable considera factores como crecimiento poblacional, estructura del hogar, nivel socioeconómico y participación en la actividad económica, y permite dimensionar el tamaño del mercado latente o insatisfecho a nivel local.

In [13]:


# PEA por año
pea_data = {
    "año": [1990, 2000, 2010, 2020, 2025, 2030, 2035],
    "pea": [89277, 128177, 168471, 226148, 268404, 310660, 366301]
}

# Personas por hogar según NSE
nse_data = {
    "nse": ["Alta", "Media alta", "Media", "Media baja", "Baja alta", "Baja", "Marginal"],
    "Distribucion NSE": [.07, .12, .17, .175, .165, .24, .06],
    "personas_por_hogar": [1, 1.2, 1.5, 1.7, 2, 2.2, 2.5]
}

# Convertir a DataFrames
df_pea = pd.DataFrame(pea_data)
df_nse = pd.DataFrame(nse_data)

# Calcular demanda potencial por NSE y año
resultados = []
for _, row in df_pea.iterrows():
    for _, nse_row in df_nse.iterrows():
        viviendas = (row["pea"] * nse_row["Distribucion NSE"]) / nse_row["personas_por_hogar"]
        resultados.append({
            "año": row["año"],
            "pea": row["pea"],
            "nse": nse_row["nse"],
            "nse % ": nse_row["Distribucion NSE"],
            "personas_por_hogar": nse_row["personas_por_hogar"],
            "demanda potencial": round(viviendas)
        })

# Crear DataFrame de resultados
df_demanda = pd.DataFrame(resultados)

# Mostrar resultados
df_demanda.tail()
#df_total_viviendas_por_anio = df_demanda.groupby("año")["demanda potencial"].sum().reset_index()
#df_total_viviendas_por_anio
# Agrupar para obtener demanda total por año
df_total_demanda = df_demanda.groupby("año")["demanda potencial"].sum().reset_index()

# Crear rango de años anual
rango_anual = pd.DataFrame({"año": range(1990, 2036)})

# Hacer merge con los años disponibles
df_total_demanda = pd.merge(rango_anual, df_total_demanda, on="año", how="left")

# Interpolación lineal
df_total_demanda["demanda potencial"] = df_total_demanda["demanda potencial"].interpolate(method="linear").round(0)
df_total_demanda.rename(columns={"año": "date", "demanda potencial": "value"}, inplace=True)
df_total_demanda.to_csv("Data/demanda_potencial_anual.csv", index=False)
df_total_demanda.tail(12)

Unnamed: 0,date,value
34,2024,156456.0
35,2025,161542.0
36,2026,166629.0
37,2027,171715.0
38,2028,176802.0
39,2029,181888.0
40,2030,186975.0
41,2031,193673.0
42,2032,200370.0
43,2033,207068.0


**Demanda potencial foránea**

Estimación de personas no residentes (nacionales o extranjeras) interesadas en adquirir vivienda.

**Necesidad de vivienda**

Estimación del número de viviendas requeridas para alojar adecuadamente a la población local, calculada a partir del tamaño poblacional y la densidad promedio de ocupación por vivienda (habitantes por hogar). Este indicador permite dimensionar la demanda estructural de vivienda a mediano y largo plazo, independientemente de las condiciones del mercado actual.

In [14]:

# Datos base
data = {
    "año": [1990, 1995, 2000, 2005, 2010, 2020, 2025],
    "poblacion": [262705, 302808, 327989, 352471, 381583, 441975, 488252],
    "habitantes_por_vivienda": [4.6, 4.2, 4.0, 3.7, 3.6, 3.3, 3.0]
}

# Crear DataFrame e interpolar
df_nece = pd.DataFrame(data).set_index("año")

# Crear índice anual desde 1990 hasta 2025
df_nece = df_nece.reindex(range(1990, 2026))

# Interpolar valores faltantes
df_nece["poblacion"] = df_nece["poblacion"].interpolate(method="linear")
df_nece["habitantes_por_vivienda"] = df_nece["habitantes_por_vivienda"].interpolate(method="linear")

# Calcular viviendas necesarias por año
df_nece["viviendas_necesarias"] = df_nece["poblacion"] / df_nece["habitantes_por_vivienda"]

# Opcional: redondear
df_nece["viviendas_necesarias"] = df_nece["viviendas_necesarias"].round(0)

df_nece = df_nece.reset_index()   
df_nece.rename(columns={"año": "date"}, inplace=True)
df_nece = df_nece.copy()
df_nece.to_csv("data/necesidad de vivienda.csv", index=False)
df_nece.tail()

Unnamed: 0,date,poblacion,habitantes_por_vivienda,viviendas_necesarias
31,2021,451230.4,3.24,139269.0
32,2022,460485.8,3.18,144807.0
33,2023,469741.2,3.12,150558.0
34,2024,478996.6,3.06,156535.0
35,2025,488252.0,3.0,162751.0



---
# Macroeconomicas


**Producto Interno Bruto nacional real**

Valor total de los bienes y servicios producidos en el país durante un año, medido a precios constantes de 2018 para eliminar el efecto de la inflación. Refleja el crecimiento económico real y permite comparaciones en el tiempo sobre el desempeño de la economía nacional. Fuente INEGI 

In [15]:

# ---- Como se compone la URL ---- #
# https://www.inegi.org.mx/app/api/indicadores/desarrolladores/jsonxml/INDICATOR/[IdIndicador]/[Idioma]/[Área Geográfica]/[Recientes]/[Fuente de datos]/[Versión][Token]?type=[Formato]
'''
IdIndicador
El primer paso que se debe realizar para obtener información de la API es seleccionar el indicador e identificar su clave. Esto lo puede realizar consultando el "Constructor de consultas".

Idioma
La información está disponible en español [es] e inglés [en].

Área geográfica
Puede ser nacional [00], por entidad federativa [99] o por municipio [999], dependiendo de cada indicador.

Dato más reciente o Serie histórica
Puede consultarse solo el dato más reciente [true] o la serie histórica completa [false].

Fuente de datos
Corresponde a la fuente de diseminación [BISE] o [BIE] de donde se obtendrán los datos consultados.

Versión
Con él se identificará la edición [2.0] del servicio de provisión de datos.

Token
Para utilizar la API es necesario mandarle un token válido, el cual puede obtener al registrarse aquí.

Formato
Se ofrece la información en 3 tipos de formatos: JSON [json], JSONP [jsonp] o XML [xml].
'''


# Token personal del INEGI
TOKEN = 'ccf9a2b3-64b9-4eb8-f202-a8cd92076d04'

# Indicador del PIB nacional a precios constantes de 2018 (trimestral)
INDICADOR_PIB_CONST = 735879  # (Fuente INEGI BIE)

# Área gragrafica
ag = '0700'  # Nacional

# URL para obtener el indicador del PIB nacional a precios constantes
url = f'https://www.inegi.org.mx/app/api/indicadores/desarrolladores/jsonxml/INDICATOR/{INDICADOR_PIB_CONST}/es/{ag}/false/BIE/2.0/{TOKEN}?type=json'

response = requests.get(url)
data = response.json()

# Extraer valores
valores = data['Series'][0]['OBSERVATIONS']

# Convertir a DataFrame
df_pib = pd.DataFrame(valores)

# Separar año y trimestre
df_pib[['anio', 'trimestre']] = df_pib['TIME_PERIOD'].str.split('/', expand=True)

# Mapear trimestres a fechas representativas
mes_inicio_trimestre = {
    '01': '01',  # Q1 → enero
    '02': '04',  # Q2 → abril
    '03': '07',  # Q3 → julio
    '04': '10'   # Q4 → octubre
}
# Crear columna de fecha válida
df_pib['fecha'] = pd.to_datetime(df_pib['anio'] + '-' + df_pib['trimestre'].map(mes_inicio_trimestre) + '-01')

# Dar Formato de valores númericos
df_pib['PIB_N'] = pd.to_numeric(df_pib['OBS_VALUE'], errors='coerce')
# Ordenar las fechas de mas antiguo al más reciente
df_pib = df_pib[['fecha', 'PIB_N']].sort_values('fecha')


# Extraer año desde la fecha
df_pib['anio'] = df_pib['fecha'].dt.year

# Agrupar por año y sumar PIB trimestral
df_pib_anual = df_pib.groupby('anio', as_index=False)['PIB_N'].sum()

# Mostrar resultado
df_pib_anual.rename(columns={'anio': 'date'}, inplace=True)
df_pib_anual.to_csv("Data/pib_anual.csv", index=False)
df_pib_anual.tail()

TypeError: list indices must be integers or slices, not str

**Tasa de interés de referencia**

Porcentaje fijado por el Banco de México como tasa objetivo para regular el costo del crédito en el país. Es un instrumento clave de política monetaria que influye directamente en las tasas hipotecarias, el acceso al financiamiento y la inversión en vivienda. Su variación impacta la capacidad de compra de los hogares y el ritmo del mercado inmobiliario.

In [18]:

# ---- Extracción de la tasa objetivo diaria del Banco de México ---- #

token_banxico = '3f1b778eb9764c78aebf314182c78d98f26cc66dfae50d4a5fc61a61f52015f6'

# ID de la serie de tasa objetivo diaria
serie_id = 'SF61745' 

url = f'https://www.banxico.org.mx/SieAPIRest/service/v1/series/{serie_id}/datos'
# Mapear trimestres a fechas representativas
mes_inicio_trimestre = {
    '01': '01',  # Q1 → enero
    '02': '04',  # Q2 → abril
    '03': '07',  # Q3 → julio
    '04': '10'   # Q4 → octubre
}

headers = {'Bmx-Token': token_banxico}

response = requests.get(url, headers=headers)

if response.status_code == 200:
    datos = response.json()
    observaciones = datos['bmx']['series'][0]['datos']
    
    df_tasa = pd.DataFrame(observaciones)
    df_tasa['fecha'] = pd.to_datetime(df_tasa['fecha'], dayfirst=True)
    df_tasa['Tasa objetivo diaria'] = pd.to_numeric(df_tasa['dato'], errors='coerce')
    df_tasa = df_tasa[['fecha', 'Tasa objetivo diaria']].sort_values('fecha')
    #display(df_tasa.tail())
else:
    print("Error en la consulta:", response.status_code)
    print(response.text[:500])


# Asegurarte de que la fecha sea el índice
df_tasa.set_index('fecha', inplace=True)

# Calcular promedio de tasa por trimestre (fin de trimestre)
df_trimestral_raw = df_tasa.resample('QE').mean()

# Reasignar ese promedio al primer día del siguiente trimestre
df_tasa_trimestral = df_trimestral_raw.copy()
df_tasa_trimestral.index = df_tasa_trimestral.index + pd.offsets.QuarterBegin(startingMonth=1)

# Resetear índice si lo necesitas como columna
df_tasa_trimestral = df_tasa_trimestral.reset_index()
df_tasa_trimestral.columns = ['fecha', 'tasa_referencia']


# Extraer año desde la fecha
df_tasa_trimestral['anio'] = df_tasa_trimestral['fecha'].dt.year

# Agrupar por año y calcular el promedio anual
df_tasa_anual = df_tasa_trimestral.groupby('anio', as_index=False)['tasa_referencia'].mean().round(2)

# Mostrar resultado
df_tasa_anual.rename(columns={"anio": "date"}, inplace=True)
df_tasa_anual.to_csv("Data/tasa_referencia_anual.csv", index=False)
df_tasa_anual.tail()

Unnamed: 0,date,tasa_referencia
14,2022,6.44
15,2023,10.76
16,2024,11.08
17,2025,9.15
18,2026,7.38




**Personas economicamete activas**

Número total de personas a nivel nacional que están ocupadas o buscan activamente empleo. Este indicador refleja el tamaño de la fuerza laboral disponible en el país y es clave para analizar el dinamismo del mercado laboral.

**Personas Desempleadas**

Cantidad de personas a nivel nacional que forman parte de la Población Económicamente Activa (PEA) pero que no tienen empleo y están buscando activamente trabajo. Este indicador permite evaluar la situación del desempleo en el país y su evolución a lo largo del tiempo.

**Tasa de desempleo**

Indicador del porcentaje de personas activas laboralmente que no encuentran empleo formal.


In [21]:

#URL para obtener el personas economicamente activas (PEA) a nivel nacional
url_empleo = f' https://www.inegi.org.mx/app/api/indicadores/desarrolladores/jsonxml/INDICATOR/6200093960/es/00/false/BISE/2.0/{TOKEN}?type=json'
# url_empleo = f' https://www.inegi.org.mx/app/api/indicadores/desarrolladores/jsonxml/INDICATOR/5000000002/es/00/true/BISE/2.0/[Aquí va tu Token]?type=json

response_empleo = requests.get(url_empleo)
data_empleo = response_empleo.json()

# Extraer valores
valores_empleo = data_empleo['Series'][0]['OBSERVATIONS']
# Convertir a DataFrame
df_empleo = pd.DataFrame(valores_empleo)
# Separar año y trimestre
df_empleo[['anio', 'trimestre']] = df_empleo['TIME_PERIOD'].str.split('/', expand=True)
# Crear columna de fecha válida
df_empleo['fecha'] = pd.to_datetime(df_empleo['anio'] + '-' + df_empleo['trimestre'].map(mes_inicio_trimestre) + '-01')
# Dar Formato de valores númericos
df_empleo['PEA'] = pd.to_numeric(df_empleo['OBS_VALUE'], errors='coerce')
# Ordenar las fechas de mas antiguo al más reciente
df_empleo = df_empleo[['fecha', 'PEA']].sort_values('fecha')


# URL para obtener el población desempleada a nivel nacional
url_desempleo = f'https://www.inegi.org.mx/app/api/indicadores/desarrolladores/jsonxml/INDICATOR/6200093973/es/00/false/BISE/2.0/{TOKEN}?type=json'

response_desempleo = requests.get(url_desempleo)
data_desempleo = response_desempleo.json()

# Extraer valores
valores_desempleo = data_desempleo['Series'][0]['OBSERVATIONS']
# Convertir a DataFrame
df_desempleo = pd.DataFrame(valores_desempleo)
# Separar año y trimestre
df_desempleo[['anio', 'trimestre']] = df_desempleo['TIME_PERIOD'].str.split('/', expand=True)
# Crear columna de fecha válida
df_desempleo['fecha'] = pd.to_datetime(df_desempleo['anio'] + '-' + df_desempleo['trimestre'].map(mes_inicio_trimestre) + '-01')
# Dar Formato de valores númericos
df_desempleo['valor'] = pd.to_numeric(df_desempleo['OBS_VALUE'], errors='coerce')
# Ordenar las fechas de mas antiguo al más reciente
df_desempleo = df_desempleo[['fecha', 'valor']].sort_values('fecha')

# Unir los DataFrames de empleo y desempleo
df_empleo['desempleo'] = df_desempleo['valor']

# Calcular la tasa de desempleo
df_empleo['tasa_desempleo'] = (df_empleo['desempleo'] / df_empleo['PEA']) * 100


# Extraer año desde la columna fecha
df_empleo['anio'] = df_empleo['fecha'].dt.year

# Agrupar por año y calcular promedios
df_empleo_anual = df_empleo.groupby('anio', as_index=False).agg({
    'PEA': 'mean',
    'desempleo': 'mean',
    'tasa_desempleo': 'mean'
}).round(2)

# Mostrar resultados
df_empleo_anual.rename(columns={"anio": "date"}, inplace=True)
df_empleo_anual.to_csv("Data/empleo_desempleo_anual.csv", index=False)
df_empleo_anual.tail(5) # Mostrar los últimos 5 registros

Unnamed: 0,date,PEA,desempleo,tasa_desempleo
16,2021,57530656.5,2364791.75,4.11
17,2022,59262415.0,1940016.5,3.28
18,2023,60585344.0,1688960.25,2.79
19,2024,61010596.25,1644631.0,2.69
20,2025,60953165.0,1628092.33,2.67


**Índice Nacional de Precios al Consumidor (INPC)**

Indicador que mide la variación promedio de los precios de una canasta representativa de bienes y servicios consumidos por los hogares mexicanos a lo largo del tiempo. Es la principal medida oficial de inflación en el país y permite evaluar el poder adquisitivo de la población y ajustar precios, salarios o créditos con base en la inflación.

In [27]:


# Indicador INPC general base 2018 = 100
INDICADOR_INPC = 628258

# Área geográfica nacional
AG = "0700"

# Construir URL para el INPC
# url = f'https://www.inegi.org.mx/app/api/indicadores/desarrolladores/jsonxml/INDICATOR/334360/es/{AG}/false/BIE/2.0/{TOKEN}?type=json'
url = f'https://www.inegi.org.mx/app/api/indicadores/desarrolladores/jsonxml/INDICATOR/910399/es/00/false/BIE-BISE/2.0/{TOKEN}?type=json'
# Hacer la solicitud
response = requests.get(url)
data = response.json()

# Extraer observaciones
valores = data['Series'][0]['OBSERVATIONS']
df_inpc = pd.DataFrame(valores)

# Separar año y mes
df_inpc[['anio', 'mes']] = df_inpc['TIME_PERIOD'].str.split('/', expand=True)

# Crear columna de fecha
df_inpc['fecha'] = pd.to_datetime(df_inpc['anio'] + '-' + df_inpc['mes'] + '-01')

# Convertir valores a numérico
df_inpc['INPC'] = pd.to_numeric(df_inpc['OBS_VALUE'], errors='coerce')

# Limpiar columnas y ordenar
df_inpc = df_inpc[['fecha', 'INPC']].sort_values('fecha')

# Extraer año desde la fecha
df_inpc['anio'] = df_inpc['fecha'].dt.year

# Agrupar por año y calcular el promedio anual del INPC
df_inpc_anual = df_inpc.groupby('anio', as_index=False)['INPC'].mean().round(2)

# Mostrar resultado
df_inpc_anual.rename(columns={"anio": "date"}, inplace=True)
df_inpc_anual.to_csv("Data/INPC_anual.csv", index=False)
df_inpc_anual


Unnamed: 0,date,INPC
0,1969,0.39
1,1970,0.38
2,1971,0.4
3,1972,0.45
4,1973,1.63
5,1974,1.58
6,1975,0.9
7,1976,2.04
8,1977,1.58
9,1978,1.26


**Inflación anual del INPC**

La inflación es el aumento generalizado y sostenido de los precios de bienes y servicios en una economía durante un periodo de tiempo. Reduce el poder adquisitivo del dinero.

In [23]:


INDICADOR_INFLACION_ANUAL = 628282  # Inflación anual INPC (%)
AG = "0700"  # Nacional


# Construir URL
url = (
    f"https://www.inegi.org.mx/app/api/indicadores/desarrolladores/jsonxml/"
    f"INDICATOR/{INDICADOR_INFLACION_ANUAL}/es/{AG}/false/BIE/2.0/{TOKEN}?type=json"
)

# Obtener respuesta
response = requests.get(url)
data = response.json()

# Extraer observaciones
valores = data['Series'][0]['OBSERVATIONS']
df_inflacion = pd.DataFrame(valores)

# Crear columnas de año y mes
df_inflacion[['anio', 'mes']] = df_inflacion['TIME_PERIOD'].str.split('/', expand=True)
df_inflacion['fecha'] = pd.to_datetime(df_inflacion['anio'])

# Convertir valor a numérico
df_inflacion['Inflacion'] = pd.to_numeric(df_inflacion['OBS_VALUE'], errors='coerce')

# Agrupar por año y calcular promedio
df_inflacion_agrupado = df_inflacion.groupby(df_inflacion['fecha'].dt.year).mean(numeric_only=True).reset_index()

# Crear columna de fecha tipo datetime (año como fecha)
df_inflacion_agrupado['date'] = pd.to_datetime(df_inflacion_agrupado['fecha'], format='%Y')

# Seleccionar columnas finales
df_inflacion_final = df_inflacion_agrupado[['date', 'Inflacion']].sort_values('date')

# Exportar a CSV
df_inflacion_final.to_csv("Data/Inflacion_anual.csv", index=False)

# Mostrar vista final
df_inflacion_final.tail(5)  # Mostrar los últimos 5 registros para verificar

TypeError: list indices must be integers or slices, not str

**Índice de precios en materiales de construcción**

Mide la variación en los costos de materiales como acero, concreto, tabique, etc.

**Indicadores disponibles (relevantes para construcción) – INEGI API**

| Nombre del Indicador                                                | ID INEGI   | Frecuencia | Comentario                              |
|---------------------------------------------------------------------|------------|------------|------------------------------------------|
| Índice de precios de materiales de construcción                     | **380002** | Mensual    | General nacional                         |
| Índice de precios de materiales para la construcción por entidad    | **380003** | Mensual    | Desglosado por estado                    |
| Índice de precios de materiales para vivienda de interés social     | 6203855936 | Mensual    | Específico para vivienda económica       |
| Índice de precios productor de materiales de construcción           | 6208195984 | Mensual    | Desde la perspectiva del productor       |


In [None]:

INDICADOR = 380003  # Índice estatal de precios de materiales
AG = "070025"       # Sinaloa
FUENTE = "BIE"

url = f"https://www.inegi.org.mx/app/api/indicadores/desarrolladores/jsonxml/INDICATOR/{INDICADOR}/es/{AG}/false/{FUENTE}/2.0/{TOKEN}?type=json"

response = requests.get(url)
data = response.json()

if "Series" in data and data["Series"]:
    valores = data['Series'][0]['OBSERVATIONS']
    df = pd.DataFrame(valores)
    df[['anio', 'mes']] = df['TIME_PERIOD'].str.split('/', expand=True)
    df['fecha'] = pd.to_datetime(df['anio'] + '-' + df['mes'] + '-01')
    df['indice_materiales'] = pd.to_numeric(df['OBS_VALUE'], errors='coerce')
    df = df[['fecha', 'indice_materiales']].sort_values('fecha')
else:
    print("❌ No se encontraron datos:")
    print(data)

df.tail()



**Actividad Económica Estatal (ITAEE)**

Indicador que mide de forma trimestral la evolución del valor agregado bruto generado por las actividades económicas (primarias, secundarias y terciarias) en cada entidad federativa. Permite dar seguimiento al crecimiento económico regional y compararlo entre estados a lo largo del tiempo.

In [None]:

# Diccionario de nombres de estados (INEGI)
estados = {
    1: 'Aguascalientes', 2: 'Baja California', 3: 'Baja California Sur', 4: 'Campeche',
    5: 'Coahuila', 6: 'Colima', 7: 'Chiapas', 8: 'Chihuahua', 9: 'Ciudad de México',
    10: 'Durango', 11: 'Guanajuato', 12: 'Guerrero', 13: 'Hidalgo', 14: 'Jalisco',
    15: 'México', 16: 'Michoacán', 17: 'Morelos', 18: 'Nayarit', 19: 'Nuevo León',
    20: 'Oaxaca', 21: 'Puebla', 22: 'Querétaro', 23: 'Quintana Roo', 24: 'San Luis Potosí',
    25: 'Sinaloa', 26: 'Sonora', 27: 'Tabasco', 28: 'Tamaulipas', 29: 'Tlaxcala',
    30: 'Veracruz', 31: 'Yucatán', 32: 'Zacatecas'
}

# Mapeo de trimestre a mes
mes_inicio_trimestre = {'01': '01', '02': '04', '03': '07', '04': '10'}

# DataFrame total
df_total = pd.DataFrame()



# Iterar por estados
for i in range(1, 33):
    codigo_estado = str(i).zfill(2)
    geo_code = f'070000{codigo_estado}'

    url = f'https://www.inegi.org.mx/app/api/indicadores/desarrolladores/jsonxml/INDICATOR/6207061361/es/{geo_code}/false/BISE/2.0/{TOKEN}?type=json'
    response = requests.get(url)

    if response.status_code != 200:
        print(f"Error al obtener datos del estado {codigo_estado} - {estados[i]}")
        continue

    try:
        data = response.json()
        observaciones = data['Series'][0]['OBSERVATIONS']
        df = pd.DataFrame(observaciones)

        df = df[df['TIME_PERIOD'].str.contains(r'^\d{4}/0[1-4]$')].copy()
        df[['anio', 'trimestre']] = df['TIME_PERIOD'].str.split('/', expand=True)
        df['mes'] = df['trimestre'].map(mes_inicio_trimestre)
        df = df[df['mes'].notna()]
        df['fecha'] = pd.to_datetime(df['anio'] + '-' + df['mes'] + '-01')
        df['ITAE'] = pd.to_numeric(df['OBS_VALUE'], errors='coerce')
        df['estado'] = estados[i]

        df_estado = df[['fecha', 'estado', 'ITAE']]
        df_total = pd.concat([df_total, df_estado], ignore_index=True)

    except Exception as e:
        print(f"❌ Error procesando {estados[i]}: {e}")

# Eliminar nulos
df_total = df_total.dropna()

# Pivotar para que cada estado sea columna
df_pivot = df_total.pivot(index="fecha", columns="estado", values="ITAE")

# Ordenar por fecha
df_pivot = df_pivot.sort_index()

# Asegurar que el índice sea datetime y extraer año
df_pivot = df_pivot.copy()
df_pivot['anio'] = df_pivot.index.year

# Agrupar por año y calcular el promedio anual por estado
df_itaee_anual = df_pivot.groupby('anio').mean().round(2)

# Resetear índice para tener 'anio' como columna
df_itaee_anual = df_itaee_anual.reset_index()

# Crear y guardar un CSV por cada columna (estado)
#for estado in df_itaee_anual.columns[1:]:
#    df_estado = df_itaee_anual[['anio', estado]].copy()
#    df_estado.columns = ['date', 'value']
#    filename = f"Data/Actividad_economica_{estado.replace(' ', '_')}.csv"
#    df_estado.to_csv(filename, index=False)
    
# Mostrar resultado
df_itaee_anual.rename(columns={"anio": "date"}, inplace=True)
df_itaee_anual.to_csv('Data/Actividad_economica_ITAEE.csv')
df_itaee_anual

**Recaudación estatal por ISAIE**

Total recaudado por el estado a través del Impuesto Sobre Adquisición de Inmuebles y otras operaciones similares.

**Unidades económicas activas (DENUE)**

Número total de establecimientos registrados y activos en el Directorio Estadístico Nacional de Unidades Económicas (DENUE) del INEGI. Incluye negocios, empresas y comercios que realizan actividades económicas formales en el país, permitiendo medir la dinámica empresarial y comercial en una región o periodo determinado.

In [None]:

# Crear DataFrame manualmente con las fechas y el número de DENUE
data = {
    'fecha': [
        '2010-07', '2011-03', '2012-06', '2013-07', '2013-07',
        '2014-12', '2016-01', '2016-10', '2017-03', '2017-03',
        '2017-11', '2018-03', '2018-11', '2019-04', '2019-11',
        '2020-04', '2020-11', '2021-05', '2021-11', '2022-05',
        '2022-11', '2023-11', '2024-05', '2024-11', '2025-04', '2025-05'
    ],
    'denue_total': [
        6354, 6419, 6486, 6487, 6510,
        9276, 9384, 9451, 9452, 9503,
        9550, 9732, 9774, 9923, 14609,
        14708, 14883, 14938, 14973, 14977,
        14995, 15216, 15404, 24758, 25631, 25637
    ]
}

df_denue = pd.DataFrame(data)

# Asegurar que la columna 'fecha' sea tipo datetime
df_denue['fecha'] = pd.to_datetime(df_denue['fecha'])

# Extraer el año
df_denue['anio'] = df_denue['fecha'].dt.year

# Ordenar por fecha para poder tomar el último registro del año
df_denue = df_denue.sort_values('fecha')

# Obtener el último registro de cada año (cierre anual)
df_denue_anual = df_denue.groupby('anio', as_index=False).last()[['anio', 'denue_total']]

# Mostrar resultado
df_denue_anual.rename(columns={'anio': 'date'}, inplace=True)
df_denue_anual.to_csv("Data/denue_anual.csv", index=False)
df_denue_anual.tail()


---

# Turismo


**Producto Interno Bruto turístico estimado**

Estimación basada en el número de turistas, su estadía promedio y su gasto diario. Refleja la aportación económica directa del turismo.

**Flujo aéreo**

Cantidad total de vuelos que arriban al aeropuerto de Mazatlán durante cada trimestre. Este indicador refleja la conectividad aérea de la ciudad y sirve como proxy del flujo turístico y de negocios.
 Fuente: Data Tur

 **Flujo aéreo nacional hacia Mazatlán**


Cantidad de vuelos nacionales que arriban al aeropuerto de Mazatlán en cada trimestre. Este indicador permite medir la conectividad aérea interior del país con Mazatlán y estimar el flujo turístico y comercial nacional hacia la ciudad.Fuente: Data Tur

 **Flujo aéreo internacional hacia Mazatlán**

Número de vuelos internacionales que arriban al aeropuerto de Mazatlán por trimestre. Este indicador refleja la conectividad aérea global de la ciudad y permite estimar el flujo de turistas y viajeros extranjeros hacia el destino.  Fuente: Data Tur

In [None]:

data_vuelos = [
    # año, mes, vuelos, vuelos_nac, vuelos_int
    (2016, "Enero", 543, 351, 192), (2016, "Febrero", 492, 324, 168), (2016, "Marzo", 548, 366, 182), (2016, "Abril", 498, 346, 152),
    (2016, "Mayo", 453, 354, 99), (2016, "Junio", 458, 370, 88), (2016, "Julio", 489, 397, 92), (2016, "Agosto", 495, 418, 77),
    (2016, "Septiembre", 411, 370, 41), (2016, "Octubre", 476, 389, 87), (2016, "Noviembre", 522, 396, 126), (2016, "Diciembre", 597, 415, 182),

    (2017, "Enero", 544, 354, 190), (2017, "Febrero", 475, 311, 164), (2017, "Marzo", 468, 273, 195), (2017, "Abril", 418, 270, 148),
    (2017, "Mayo", 349, 266, 83), (2017, "Junio", 337, 262, 75), (2017, "Julio", 372, 290, 82), (2017, "Agosto", 346, 277, 69),
    (2017, "Septiembre", 372, 319, 53), (2017, "Octubre", 423, 339, 84), (2017, "Noviembre", 466, 334, 132), (2017, "Diciembre", 559, 368, 191),

    (2018, "Enero", 518, 325, 193), (2018, "Febrero", 481, 291, 190), (2018, "Marzo", 577, 347, 230), (2018, "Abril", 485, 343, 142),
    (2018, "Mayo", 421, 332, 89), (2018, "Junio", 405, 321, 84), (2018, "Julio", 445, 361, 84), (2018, "Agosto", 418, 349, 69),
    (2018, "Septiembre", 373, 324, 49), (2018, "Octubre", 413, 332, 81), (2018, "Noviembre", 476, 340, 136), (2018, "Diciembre", 538, 367, 171),

    (2019, "Enero", 534, 338, 196), (2019, "Febrero", 483, 295, 188), (2019, "Marzo", 551, 324, 227), (2019, "Abril", 496, 375, 121),
    (2019, "Mayo", 435, 373, 62), (2019, "Junio", 428, 365, 63), (2019, "Julio", 451, 389, 62), (2019, "Agosto", 443, 384, 59),
    (2019, "Septiembre", 407, 362, 45), (2019, "Octubre", 496, 410, 86), (2019, "Noviembre", 549, 404, 145), (2019, "Diciembre", 648, 469, 179),

    (2020, "Enero", 625, 427, 198), (2020, "Febrero", 551, 356, 195), (2020, "Marzo", 492, 309, 183), (2020, "Abril", 96, 59, 37),
    (2020, "Mayo", 70, 50, 20), (2020, "Junio", 131, 98, 33), (2020, "Julio", 208, 173, 35), (2020, "Agosto", 269, 241, 28),
    (2020, "Septiembre", 303, 271, 32), (2020, "Octubre", 354, 309, 45), (2020, "Noviembre", 408, 331, 77), (2020, "Diciembre", 465, 355, 110),

    (2021, "Enero", 434, 326, 108), (2021, "Febrero", 351, 271, 80), (2021, "Marzo", 446, 340, 106), (2021, "Abril", 455, 392, 63),
    (2021, "Mayo", 451, 393, 58), (2021, "Junio", 446, 391, 55), (2021, "Julio", 546, 487, 59), (2021, "Agosto", 497, 447, 50),
    (2021, "Septiembre", 452, 409, 43), (2021, "Octubre", 509, 429, 80), (2021, "Noviembre", 517, 402, 115), (2021, "Diciembre", 588, 428, 160),

    (2022, "Enero", 594, 437, 157), (2022, "Febrero", 534, 393, 141), (2022, "Marzo", 621, 457, 164), (2022, "Abril", 535, 434, 101),
    (2022, "Mayo", 476, 424, 52), (2022, "Junio", 476, 423, 53), (2022, "Julio", 546, 488, 58), (2022, "Agosto", 523, 467, 56),
    (2022, "Septiembre", 486, 438, 48), (2022, "Octubre", 506, 427, 79), (2022, "Noviembre", 541, 414, 127), (2022, "Diciembre", 621, 445, 176),

    (2023, "Enero", 574, 406, 168), (2023, "Febrero", 557, 385, 172), (2023, "Marzo", 560, 365, 195), (2023, "Abril", 533, 408, 125),
    (2023, "Mayo", 454, 404, 50), (2023, "Junio", 454, 408, 46), (2023, "Julio", 466, 416, 50), (2023, "Agosto", 470, 421, 49),
    (2023, "Septiembre", 399, 355, 44), (2023, "Octubre", 441, 368, 73), (2023, "Noviembre", 506, 380, 126), (2023, "Diciembre", 634, 450, 184),

    (2024, "Enero", 573, 409, 164), (2024, "Febrero", 550, 383, 167), (2024, "Marzo", 651, 459, 192), (2024, "Abril", 644, 497, 147),
    (2024, "Mayo", 552, 489, 63), (2024, "Junio", 528, 463, 65), (2024, "Julio", 579, 512, 67), (2024, "Agosto", 555, 497, 58),
    (2024, "Septiembre", 474, 427, 47), (2024, "Octubre", 492, 407, 85), (2024, "Noviembre", 527, 400, 128), (2024, "Diciembre", 579, 408, 171),
]

# Crear DataFrame
df_vuelos = pd.DataFrame(data_vuelos, columns=["anio", "mes", "vuelos", "vuelos_nacionales", "vuelos_internacionales"])

# Asegurar que las columnas numéricas estén bien tipadas
cols_numericas = ["vuelos", "vuelos_nacionales", "vuelos_internacionales"]
df_vuelos[cols_numericas] = df_vuelos[cols_numericas].apply(pd.to_numeric, errors='coerce')

# Agrupar por año y sumar
df_vuelos_anual = df_vuelos.groupby("anio", as_index=False)[cols_numericas].sum().dropna()

# Mostrar resultado
df_vuelos_anual.rename(columns={'anio': 'date'},inplace=True)
df_vuelos_anual.to_csv("Data/vuelos_anuales.csv", index=False)
df_vuelos_anual.tail()  # Mostrar los últimos 5 registros para verificar

**Llegadas Aéreas de Turistas**


Número de turistas que arriban a Mazatlán por vía aérea, ya sea en vuelos nacionales o internacionales. Este indicador permite medir el volumen de visitantes y su impacto potencial en la economía local y el sector turístico.  Fuente: Data Tur

In [None]:

data_aereo = [
    # año, mes, pasajeros
    (2016, "Enero", 44217), (2016, "Febrero", 42379), (2016, "Marzo", 48386), (2016, "Abril", 40091),
    (2016, "Mayo", 34992), (2016, "Junio", 36816), (2016, "Julio", 41227), (2016, "Agosto", 37057),
    (2016, "Septiembre", 30058), (2016, "Octubre", 36919), (2016, "Noviembre", 42578), (2016, "Diciembre", 52002),
    
    (2017, "Enero", 48773), (2017, "Febrero", 45243), (2017, "Marzo", 52089), (2017, "Abril", 43978),
    (2017, "Mayo", 37906), (2017, "Junio", 36580), (2017, "Julio", 39388), (2017, "Agosto", 35596),
    (2017, "Septiembre", 30425), (2017, "Octubre", 35903), (2017, "Noviembre", 41927), (2017, "Diciembre", 49336),

    (2018, "Enero", 47260), (2018, "Febrero", 45917), (2018, "Marzo", 55082), (2018, "Abril", 47295),
    (2018, "Mayo", 39158), (2018, "Junio", 38021), (2018, "Julio", 42126), (2018, "Agosto", 37511),
    (2018, "Septiembre", 33096), (2018, "Octubre", 36722), (2018, "Noviembre", 46827), (2018, "Diciembre", 50265),

    (2019, "Enero", 50249), (2019, "Febrero", 47804), (2019, "Marzo", 57456), (2019, "Abril", 48430),
    (2019, "Mayo", 44278), (2019, "Junio", 44743), (2019, "Julio", 45125), (2019, "Agosto", 44230),
    (2019, "Septiembre", 38540), (2019, "Octubre", 44996), (2019, "Noviembre", 51651), (2019, "Diciembre", 63079),

    (2020, "Enero", 61548), (2020, "Febrero", 57017), (2020, "Marzo", 42411), (2020, "Abril", 4311),
    (2020, "Mayo", 3397), (2020, "Junio", 8822), (2020, "Julio", 19984), (2020, "Agosto", 27890),
    (2020, "Septiembre", 29181), (2020, "Octubre", 35269), (2020, "Noviembre", 39185), (2020, "Diciembre", 41139),

    (2021, "Enero", 35732), (2021, "Febrero", 31283), (2021, "Marzo", 44666), (2021, "Abril", 47340),
    (2021, "Mayo", 47237), (2021, "Junio", 45485), (2021, "Julio", 49635), (2021, "Agosto", 39745),
    (2021, "Septiembre", 42644), (2021, "Octubre", 50690), (2021, "Noviembre", 55783), (2021, "Diciembre", 62799),

    (2022, "Enero", 55572), (2022, "Febrero", 55179), (2022, "Marzo", 71512), (2022, "Abril", 62038),
    (2022, "Mayo", 56882), (2022, "Junio", 55898), (2022, "Julio", 61699), (2022, "Agosto", 59215),
    (2022, "Septiembre", 52265), (2022, "Octubre", 56630), (2022, "Noviembre", 65874), (2022, "Diciembre", 72710),

    (2023, "Enero", 66894), (2023, "Febrero", 67261), (2023, "Marzo", 74439), (2023, "Abril", 70403),
    (2023, "Mayo", 61738), (2023, "Junio", 63623), (2023, "Julio", 66912), (2023, "Agosto", 68285),
    (2023, "Septiembre", 57316), (2023, "Octubre", 60308), (2023, "Noviembre", 72037), (2023, "Diciembre", 81657),

    (2024, "Enero", 78228), (2024, "Febrero", 78275), (2024, "Marzo", 90129), (2024, "Abril", 85389),
    (2024, "Mayo", 76598), (2024, "Junio", 73450), (2024, "Julio", 83328), (2024, "Agosto", 76460),
    (2024, "Septiembre", 64777), (2024, "Octubre", 68428), (2024, "Noviembre", 74802), (2024, "Diciembre", 84548),

    (2025, "Enero", 80373), (2025, "Febrero", 71161), (2025, "Marzo", 88509), (2025, "Abril", 78994),
]

df_turismo_aereo = pd.DataFrame(data_aereo, columns=["anio", "mes", "pasajeros"])
df_turismo_aereo_F = df_turismo_aereo[["anio", "pasajeros"]].copy()
df_turismo_aereo_F.groupby("anio", as_index=False)["pasajeros"].sum()

df_turismo_aereo_F.rename(columns={"anio": "date"}, inplace=True)
df_turismo_aereo_F=df_turismo_aereo_F.groupby("date", as_index=False)["pasajeros"].sum()
df_turismo_aereo_F.to_csv("Data/turismo_aereo_anual.csv", index=False)
df_turismo_aereo_F.tail()

**Flujo carretero**

Cantidad de carros/camiones que entran a Mazatlán

**Llegadas terrestres de turistas**

Cantidad de personas que acceden mediante carreteras o autobuses.

**Llegadas Totales de Turistas**

Cantidad total de personas que visitan Mazatlán, sumando los flujos por vía aérea, marítima y terrestre. Este indicador refleja el volumen global de turistas que llegan a la ciudad en cada periodo.

In [None]:

data = {
    "anio": [
        2006, 2007, 2008, 2009, 2010,
        2011, 2012, 2013, 2014, 2015,
        2016, 2017, 2018, 2019, 2020,
        2021, 2022, 2023, 2024, 2025
    ],
    "visitantes_totales": [
        1253854, 1238991, 1296849, 1473545, 1603808,
        1548300, 1591233, 1743575, 1921951, 1981883,
        2154570, 2462870, 2587150, 2921578, 1893034,
        2759419, 2871286, 2562731, 2502175, 2030539
    ]
}

df_turismo = pd.DataFrame(data)
df_turismo.rename(columns={"anio": "date"}, inplace=True)
df_turismo.to_csv("Data/turismo_anual.csv", index=False)
df_turismo.tail(
    
)

**Turistas Internacionales**

Personas extranjeras que visitan Mazatlán con fines turísticos, provenientes de otros países. Este indicador refleja la llegada de visitantes no residentes en México, ya sea por vía aérea, marítima o terrestre.  Fuente: Data Tur

In [None]:


data_extranjeros = {
    "anio": [
        2016, 2017, 2018, 2019, 2020,
        2021, 2022, 2023, 2024, 2025
    ],
    "visitantes_extranjeros_cuatrimestre": [
        72033, 78783, 79495, 84369, 65270,
        24073, 61081, 88415, 97731, 94345
    ]
}

df_extranjeros = pd.DataFrame(data_extranjeros)
df_extranjeros.rename(columns={"anio": "date", "visitantes_extranjeros_cuatrimestre": "visitantes_extranjeros"}, inplace=True)
df_extranjeros.to_csv("Data/extranjeros_anual.csv", index=False)
df_extranjeros.tail()


**Turistas nacionales**

Turistas que se desplazan dentro del país pero fuera de su lugar de residencia habitual.Personas residentes en México que visitan Mazatlán por motivos turísticos, trasladándose fuera de su lugar habitual de residencia pero dentro del territorio nacional. Este indicador excluye a los residentes locales y a los visitantes internacionales.

In [None]:

# Unir ambos dataframes por año
df_merge = pd.merge(df_turismo, df_extranjeros, on='date', how='inner', suffixes=('_total', '_extranjeros'))

df_merge['visitantes_nacioanles'] =df_merge['visitantes_totales'] -  df_merge['visitantes_extranjeros'] 

df_nacionales = df_merge[['date', 'visitantes_nacioanles']].copy()
df_nacionales.to_csv("Data/nacionales_anual.csv", index=False)
df_nacionales.tail()

**Estadía promedio de turistas extranjeros**

**Estadía promedio general**

**Gasto diario promedio por turista extranjero**

**Gasto diario promedio por turista nacional**

**Inversión extranjera directa en turismo e inmuebles**


---

# Hoteleria

**Inventario de hoteles**

**Habitaciones hoteleras totales**

**Habitaciones Disponibles en Hoteles**

Número total de habitaciones habilitadas para hospedaje en los establecimientos hoteleros de Mazatlán durante un periodo determinado. Este indicador permite medir la capacidad instalada del sector turístico.

In [None]:

data_cuartos = {
    "anio": list(range(2006, 2026)),
    "cuartos_disponibles": [
        8123, 8252, 8623, 8994, 9111, 9143, 9217, 9086, 9122, 9145,
        9357, 9974, 9552, 9859, 9304, 9889, 9562, 9844, 10093, 10093
    ]
}

df_cuartos = pd.DataFrame(data_cuartos)
df_cuartos.rename(columns={"anio": "date"}, inplace=True)
df_cuartos.to_csv("Data/cuartos_disponibles_anual_hotel.csv", index=False)    
df_cuartos.tail()


**Habitaciones ocupadas**

Cantidad de habitaciones de hotel que fueron efectivamente utilizadas por huéspedes durante un periodo determinado en Mazatlán. Este indicador refleja la demanda turística y el nivel de aprovechamiento de la oferta hotelera.

In [None]:

data = {
    "anio": list(range(2010, 2026)),
    "cuartos_ocupados": [
        1608641, 1573722, 1594383, 1682165, 1831982, 1971379, 2085757,
        2241796, 2118077, 2254505, 1400723, 2064954, 2401485, 2296151,
        2256637, 2082289
    ]
}

df_ocupacion = pd.DataFrame(data)
df_ocupacion.rename(columns={"anio": "date"}, inplace=True)
df_ocupacion.to_csv("Data/cuartos_ocupados_anual.csv", index=False) 
df_ocupacion.tail()

**Porcentaje de ocupación hotelera**

Proporción de habitaciones ocupadas respecto al total de habitaciones disponibles en hoteles durante un periodo determinado en Mazatlán. Este indicador mide el nivel de utilización de la infraestructura hotelera y la intensidad de la actividad turística.   Fuente: Data Tur

In [None]:

# Datos de ocupación promedio anual
datos_ocupacion = {
    "Año": [2010, 2011, 2012, 2013, 2014, 2015, 2016, 2017, 2018, 2019,
            2020, 2021, 2022, 2023, 2024, 2025],
    "Ocupación_Promedio_Anual (%)": [
        48.2, 47.4, 47.5, 50.6, 55.2, 59.0, 61.4, 60.8, 60.1, 64.1,
        39.0, 58.1, 66.7, 65.8, 61.1, 46.8
    ]
}

# Crear el DataFrame
df_ocupacion = pd.DataFrame(datos_ocupacion)

# Mostrar el DataFrame
df_ocupacion.rename(columns={"Año": "date"}, inplace=True)
df_ocupacion.to_csv("Data/porcentaje_ocupacion_anual.csv", index=False )
df_ocupacion_por = df_ocupacion.copy()
df_ocupacion_por.tail(5)

**Huéspedes totales en hoteles**

**Promedio de ocupantes por habitación hotelera**


---
# Renta turistica

**Inventario total de viviendas vacacionales**

Total de viviendas registradas para uso turístico mediante plataformas como Airbnb, Vrbo, entre otras.

In [None]:

# Crear el DataFrame anual con promedios estimados
data_renta = {
    "date": [2019, 2020, 2021, 2022, 2023, 2024, 2025],
    "Propiedades_Listadas": [
        6638,
        round((4282 + 5013 + 4559) / 3),
        round((7419 + 7277 + 6157 + 7573) / 4),
        round((7222 + 8668 + 8549 + 9743) / 4),
        round((8975 + 9401 + 8823 + 9953) / 4),
        round((10288 + 10166 + 11637 + 10680) / 4),
        round((10724 + 10820) / 2)
    ]
}

df_propiedades = pd.DataFrame(data_renta)
df_propiedades.to_csv("Data/propiedades_listadas_anual.csv", index=False)
df_propiedades.tail()

**Disponibilidad de viviendas vacacionales**

Cantidad de propiedades activas y disponibles para ser rentadas durante el periodo.

In [None]:

# Crear el DataFrame actualizado con los valores corregidos
data_trimestral_corr = {
    "Año": [
        2020, 2020, 2020, 2020,
        2021, 2021, 2021, 2021,
        2022, 2022, 2022, 2022,
        2023, 2023, 2023, 2023,
        2024, 2024, 2024, 2024,
        2025, 2025
    ],
    "Trimestre": [
        "I", "II", "III", "IV",
        "I", "II", "III", "IV",
        "I", "II", "III", "IV",
        "I", "II", "III", "IV",
        "I", "II", "III", "IV",
        "I", "II"
    ],
    "Propiedades_Listadas": [
        4282, 5013, 4559, 6638,
        7418, 7277, 6157, 7573,
        7222, 8661, 8549, 9743,
        8975, 9401, 8823, 9953,
        10288, 10166, 11637, 10680,
        10724, 10820
    ]
}

df_corr = pd.DataFrame(data_trimestral_corr)

# Calcular promedios anuales corregidos
df_anual_corr = df_corr.groupby("Año").mean(numeric_only=True).round().astype(int).reset_index()
df_anual_corr.rename(columns={"Año": "date"}, inplace=True)
df_anual_corr.to_csv("Data/propiedades_renta_anual.csv", index=False)
df_anual_corr.tail()

**Ocupación de viviendas vacacionales**

**Porcentaje de ocupación en viviendas vacacionales**

**Huéspedes en viviendas vacacionales**

Número total de personas que se hospedaron en propiedades destinadas a renta vacacional, como departamentos, casas o villas turísticas, durante un periodo determinado. Este indicador refleja el uso de alojamiento alternativo al hotelero en Mazatlán

In [None]:

# Crear el DataFrame a partir de los datos reconstruidos visualmente
data = {
    "date": [2016, 2017, 2018, 2019, 2020, 2021, 2022, 2023, 2024, 2025],
    "Visitantes_Anuales": [
        162557, 558019, 1170548, 1544991, 746665,
        1057307, 1436230, 1492676, 1758556, 1557491
    ]
}

df_visitantes = pd.DataFrame(data)
df_visitantes.to_csv("Data/visitantes_anuales_rt.csv", index=False)
df_visitantes.tail()  # Mostrar los últimos 5 registros para verificar

**Ocupantes promedio por unidad vacacional**


---

# Modelado econometrico

**Preparacion de datos**

9. Discusión
Interpretación de los resultados.

Comparación con otros estudios.

Limitaciones del estudio.

10. Conclusiones
Resumen de hallazgos clave.

Implicaciones prácticas o teóricas.

Recomendaciones.

Futuras líneas de investigación.

11. Referencias bibliográficas
Formato APA, MLA o IEEE, según la disciplina.

🧠 Consejos prácticos
Escribe en tercera persona y con tono objetivo y formal.

Usa datos reales y fuentes confiables.

El resumen y conclusiones deben entenderse sin leer todo el documento.

Usa gráficas y tablas bien etiquetadas y citadas.