¿Sirven los modelos paramétricos para estimar de manera rápida, objetiva y consistente el precio de alquiler de departamentos en Lima?

Por Juan Germán Gayoso ArnillasIcónica Gestión.

Tags: Real Estate, Alquiler, Ratios, ASEI, Lima Metropolitana.

Resumen y problema a resolver

Si, son una buena y mejor alternativa a aplicar el precio promedio como método de cálculo para estimar el alquiler de departamentos. Si, aunque supongan un proceso más trabajoso de cálculo generan un método que permite tomar en cuenta múltiples parámetros que contribuyen a un cálculo consistente y que refleja de manera más ajustada a lo real.

El mercado de alquiler de departamentos es una fuente importante de información de la salud del desarrollo inmobiliario, al poder desarrollar indicadores de tiempo medio de pago de una inversión y compararla con los kpis que historicamente han definido la salud de los mercados de desarrollo[1].

Del mismo modo, la información de alquiler de departamentos y su variación temporal permite tener un entendimiento del mercado de inversión, al poder evaluar que productos se mantienen en stock en mayor proporción y cómo se relacionan con el segmento al que están enfocados en cuanto a su dimensión y precio.

Sin embargo, los análisis que se pueden realizar con la información disponible son engorrosos, debido a la falta de plataformas con datos ordenados e indexados, por lo que es necesario el uso de herramientas de procesamiento de lenguaje para extraer la información de las descripciones de las unidades. Esto se evidención en el post pasado sobre un estandar de nomenclatura en las unidades en venta y alquiler[2].

Con modelos paramétricos consistentes es posible estimar rápidamente los precios y con ello tener información objetiva al instante sin recurrir a generalizaciones como el precio promedio.

Información recabada y características de la oferta.

Se tomaron los datos de alquiler de las propiedades de Lima Metropolitana, extrayendo información de los portales de alquiler en línea que hay para el mercado local.

En total se pudieron extraer un total de 13mil propiedades de Lima y provincias.

Depurando solo los de Lima y Callao se tiene esta distribución de frecuencias de la cantidad de muestras de propiedades por distrito:

Diagrama de frecuencias de las muestras de alquiler

De esta manera se puede acotar el modelo a aquellos distritos que tienen una mayor muestra y evitar la distorsión de aquellos que no tienen datos para una correcta regresión.

Del mismo modo se eliman los departamentos ubicados en las playas de Lima y Cañete, dado que estas tienen un precio de alquiler basados en características o criterios distintos a los de vivienda, al ser estacionales.

Una última depuración es de aquellos distritos donde la cantidad de propiedades en alquiler son menores a 10 unidades.

Preparación del modelo paramétrico

Se hizo un modelo simplificado de los departamentos de Lima y Callao con la finalidad de hacer un modelo lineal de múltiples parámetros para la estimación de los precios de los departamentos.

Se tomaron en consideración los siguientes parámetros:

  • Distrito
  • Area total del departamento.
  • Indicación de si está o no amoblado
  • Cantidad de dormitorios.
  • Cantidad de baños.
  • Cantidad de estacionamientos.

Existen parámetros adicionales que podrían dar mejor ajuste al modelo, tales como, urbanización, NSE de la zona, pero de manera preliminar y debido a la dificultad en limpiar la información se iniciará el análisis con las variables descritas.

Es importante la estandarización, tal y como se escribió en un post anterior, dado que las descripciones de los departamentos incluyen frases coloquiales y muy variables que impiden extraer las características objetivas de las unidades, de tener variables en la base de datos que indiquen los parámetros adicionales que se plantean sería más rápido el estudio.

Si aplicamos una nube de palabras sobre la información de descripción de las unidades se tiene lo siguiente:

A screenshot of a cell phone

Description automatically generated

Varios de los conjuntos de palabras que más repetición tienen son descripciones coloquiales de las unidades y su ubicación, esto no aporta valor al análisis y más bien imposibilita determinar facilmente la información cualittiva de la unidad, como por ejemplo si esta está amoblada o no.

Para poder determinar si las unidades estaban o no amobladas fue necesario hacer un análisis sobre la raíz de la palabra amoblar y con ello depurar en el texto aquello que define a la unidad como amoblada.

Para poder limpiar la información se ha utilizado regular expressions utilizando Google sheets y también una limpieza preliminar con Open Refine para uniformizar la base de datos. Con todo esto se ha generado un archivo CSV con la base de datos de Lima Metropolitana.

Para evitar la correlación a priori que hay entre el ratio de alquiler por metro cuadrado y el área total del departamento, se está dejando de utilizar como variable dependiente dicho ratio y se pasará a utilizar el precio de alquiler total llevado a dólares con un tipo de cambio de 3.6 soles por dólar.

Como se mencionó se ha hecho una reducción de la muestra a aquellos distritos que mayor cantidad de propiedades tienen, por lo tanto se tomará la siguiente información en el análisis.

Tabla de número de muestras y frecuencias

A manera de resumen de sus precios de alquiler por m2 en dólares se tiene la siguiente tabla, donde el rango dado por -2s y +2s representa el intervalo donde cae el 95% de las muestras de cada distrito.

Tabla de precio de alquiler (USD/m2)

De manera gráfica se tiene esta distribución:

Diagrama de precio de alquiler (USD/m2)

La gráfica muestra en el eje vertical izquierdo la cantidad de propiedades en oferta en cada distrito, representadas por las barras azules, mientras que el ratio de alquiler de USD/m2 está representada por cuatro variables, los extremos máximos y mínimos de los distritos y en la caja blanca el rango definido por +- 2s que enmarca, en una distribución normal, el 95% de la totalidad de las muestras de los distritos.

Si requirieramos hacer una estimación rápida es posible utilizar estos rangos y con ello tener una magnitud del alquiler de un departamento en los distritos analizados.

Tratamiento de las variables.

Cantidad de dormitorios

Para poder analizar los dormitorios se tiene el siguiente gráfico de frecuencias.

Chart, histogram

Description automatically generated
Histograma de número de dormitorios

En vista que la mayor frecuencia se tiene en departamentos de 1, 2 y 3 dormitorios se trabajarán con una variable de agrupación, en la que estén separados estas tres variantes y la de 4 a más en una variable. Todas ellas se tratarán como dummies binarias.

Cantidad de baños

Chart, histogram

Description automatically generated
Histograma de número de baños

De la misma manera que en los dormitorios, se tomarán como clases independientes los grupos de 1, 2, 3 y 4 baños, para los 5 a más se tendrá un grupo único.

Cantidad de estacionamientos

Chart, histogram

Description automatically generated
Histograma de número de estacionamientos

Con respecto a los estacionamientos el grupo se simplificará un poco más, siendo grupos independientes los de 1 y 2 estacionamientos y 3 a más serán un paquete.

Con estas premisas se rehace el modelo de alquileres manteniendo la muestra con todos los distritos.

De esta manera se probará si el modelo de regresión lineal tiene un mejor ajuste y permite estimar de manera más acertada los montos de alquiler.

Modelo paramétrico

Para generar el modelo se empleará tanto el software R como Gretl, comparándose los modelos resultantes de ambos programas y el ajuste de la regresión que propongan con respecto a la muestra.

Modelo paramétrico en Gretl

Bajo un modelo de mínimos cuadrados ordinarios el software Gretl genera un modelo con las siguientes características:

Modelo lineal (Gretl)

Las variables independientes empleadas tienen correlación con la variable dependiente en todos los casos y el ajuste del modelo con la muestra llega al 79.26% de la muestra.

Si se grafican los valores observados versus los valores proyectados de la curva de regresión se tiene la siguiente superposición, donde las barras verdes representan la muestra de precios de alquiler y las barras naranjas los valores estimados con el modelo de regresión para los mismos parámetros de cada muestra:

Gráfico comparativo muestras vs predicciones (Gretl)

Se puede apreciar un ajuste sobre los valores de mayor representación, sin embargo, aquellos valores extremos no son calculados adecuadamente.

Por lo tanto, si se requiere la estimación del precio de alquiler de un departamento en los distritos descritos en el modelo es posible utlizar los coeficientes calculados y con ello tener una estimación del precio de alquiler en dólares americanos.

Por ejemplo, si requerimos estimar el precio de alquiler de un departamento en Miraflores de unos 210 m2 de 03 dormitorios, 03 baños y 02 estacionamientos no amoblado, tendremos un valor de alquiler de USD 1’927.60 o en su defecto un ratio por m2 de 9.18 USD/m2.

El cálculo está dado por la siguiente ecuación:

Value_USD= 7.62*Area_Total+ 732.33*Miraflores- 11.6*Dormitorios_3+ 53.48*Banios_3- 447.72*Estac_2

Modelo paramétrico en R

En R se utilizó el modelo lineal de regresión considerando las mismas variables que en Gretl.

En este modelo se tuvo el siguiente resultado:

Modelo lineal (R)

En el modelo lineal de R se tiene un ajuste del 79.26% igual al 79.26% que se tiene en la regresión de Gretl.

Si se grafican los valores observados versus los valores proyectados de la curva de regresión se tiene la siguiente superposición, donde las barras verdes representan la muestra de precios de alquiler y las barras azules los valores estimados con el modelo de regresión para los mismos parámetros de cada muestra:

Gráfico comparativo de muestras vs predicciones (R)

En ella se puede apreciar que la predicción del modelo se ajusta con los valores que representan a la mayor cantidad de observaciones, sin embargo, aquellos valores extremos no pueden ser estimados por la regresión de manera adecuada.

Para el mismo ejemplo de un departamento en Miraflores de 246 m2 con 3 dormitorios, 3 baños y 2 estacionamientos sin amoblar se tiene un precio de alquiler de: 1927.60 USD o en su defecto un ratio por m2 de 9.18 USD/m2. Siendo equivalentes las dos estimaciones entre Gretl y R.

El cálculo esta dado por la siguiente ecuación.

Valor_USD= 361.56+ 7.62*Area_Total+ 370.77*Miraflores-11.6*Dormitorios_3+ 53.48*Banios_3- 447.72*Estac_2

Conclusiones

La información del mercado de alquiler puede recabarse de los distintos portales de internet, pero pese a esta disponibilidad debe trabajarse previamente para limpiar la información debido a que no hay un estándar para describir las características cuantitativas y cualitativas de ellas. El uso de un estándar en el gremio inmobiliario permitiría tener información homogénea para análisis de este tipo, incluyendo variables temporales y correlaciones con la venta de unidades nuevas de una manera más rápida.

El modelo líneal de regresión genera un ajuste del 80%, lo que lo hace útil para la estimación del precio de alquiler de departamentos. A su vez, las variables dependientes definidas en el presente estudio explican en el comportamiento del precio de alquiler en dicho porcentaje, son por lo tanto lo que define el valor de una unidad.

El uso de modelos de estimación paramétricos genera información rápida, consistente y confiable que ayuda al análisis de los negocios inmobiliarios, al tener precios de alquiler rápidamente para las posibles inversiones y con ello hacer cálculos sobre el beneficio de una inversión.

Con el uso de modelos de estimación paramétrica en las propiedades en alquiler se abre una ventana para la extrapolación del método en los departamentos en venta, lo que da la posibilidad de tener un modelo que tome parámetros más detallados de las características de las unidades, del edificio y del entorno donde se encuentra este.


[1] https://www.globalpropertyguide.com/Latin-America/Peru/price-rent-ratio

[2] https://piensoluegocambio.wordpress.com/2020/06/11/estandar-de-nomenclatura-de-departamentos-para-el-mercado-inmobiliario/

Análisis: Entendiendo el trazo urbano en los distritos de Lima para proyectar una mejor ciudad.

Por Juan Germán Gayoso Arnillas.

Tags: GIS, Python, Urban_Design, Lima_Metro, Urbanismo, Arquitectura_y_urbanismo.

Resumen

El presente artículo busca entender la ciudad de Lima y sus principales distritos, para lo cual analiza los mapas de sus calles y los transforma en variables que puedan dar una explicación numérica y visual de cómo están dispuestas las calles dentro del terreno, de ésta forma entenderemos como proyectar una mejor ciudad.

Mediante el uso de elementos gráficos que muestran la dirección y cantidad de calles en la orientación NSEO hasta la determinación de indicadores de cuan conectada está la ciudad se describen los distritos para entenderlos.

Lima se desarrolla en un espacio geográfico y climático que permite mejorar nuestro actual problema de tráfico. En el 2018 solo un 17.3%[1] tiene automóvil, pero este colapsa a la ciudad ya casi en todos los momentos del día y de la semana.

La importancia de este estudio radica en el entendimiento de nuestra ciudad y con ello el reto de planificar para el futuro aquellos cambios que se deben tenerse para una mejor calidad de vida en cada uno de los distritos.

Pese a que las grillas ortogonales son eficientes para la orientación de las personas al ser líneas paralelas, carece de una componente lúdica que genere un recorrido interesante, asimismo no toma la topografía en su trazo por lo que los desniveles en las calles deben adecuarse.

Introducción

El sentido de este documento no es hacer una investigación sobre la historia y razones que llevaron al diseño de las calles en los distintos distritos, dentro de ese espectro existen estudios tanto de la época precolombina, virreinato y época republicana que pueden tomarse para entender las caudas que dieron forma a nuestras ciudades en el Perú.

Lo que busca el presente trabajo es entender con índices, elementos visuales e información cuantitativa cómo están distribuidas las calles de los principales distritos de Lima Metropolitana y deja el camino para estudios posteriores en las principales ciudades del Perú.

Base de información

Este trabajo toma la base de distintos post de programación en Python y el análisis de las ciudades que pueden tomarse en internet. Para el desarrollar el modelo que analiza las calles se utilizó un complemento de Python, llamado OSMNX, que permite leer información de OpenStreetMaps y estudiar la información de las calles[2].

Python es un lenguaje de programación que tiene un desarrollo extenso de herramientas y complementos que permiten análisis complejos en el campo del GIS, inteligencia artificial, Big data, entre otros. Simplemente se debe entender la lógica del programa e instalar un software IDE para programar.

La información resultante es mostrada tanto en elementos visuales que veremos más adelante cómo en variables cuantitativa que explican numéricamente la complejidad de cada grilla de calles en los distritos.

Explicación de las variables

En el estudio realizado se utilizarán los siguientes elementos de descripción de las calles en cada distrito.

Se empleará como principal elemento de análisis una rosa náutica en la que las calles se muestran a manera de vectores con una dirección y magnitud.

Para poder comprender que es un vector definámoslo como una fuerza con una dirección y magnitud dada.

La dirección del vector está definida por la orientación de la calle con respecto al norte y por el sentido de la calle en sí.

La magnitud del vector estará definida por la cantidad de calles que se tienen en ese mismo rumbo.

Por lo tanto, al ver uno de estos diagramas podremos entender la disposición de las calles basados en el diagrama de distribución de los vectores en la rosa náutica.

Como ejemplo tenemos estas dos ciudades en el mundo, Santiago de Chile y Bogotá.

En estos dos diagramas podemos visualizar las ciudades basados en la agrupación de los vectores de dirección de sus calles.

En el caso de Santiago de Chile tenemos una grilla muy uniforme, que respeta la distribución de damero[3], mientras que en el diagrama de Bogotá podemos apreciar una distribución más extendida en todos los rumbos.

Comparativamente no se puede generar una postura de valor en beneficio de una u otra, simplemente una tiene un patrón en sus calles mucho más homogéneo y ha transformado el terreno natural en calles que siguen casi a la perfección una alineación NSEO, mientras que el patrón de distribución de las calles de Bogotá muestra una diseño más orgánico y adaptado a la topografía del terreno donde se ubica la ciudad.

Debido a que solo este diagrama no te permite entender cómo están las calles distribuidas, es decir, que no te permite entender si el diseño de la ciudad tiene una buena conectividad de sus espacios o por el contrario tiene en su diseño calles truncas o cul de sacs[4] es necesario hacer el cálculo de información cuantitativa.

El complemente OSMNX de Python tiene la capacidad de determinar estadísticas de las calles que analiza y dentro de ellas vamos a utilizar los parámetros siguientes:

streets_per_node_proportion = dict, same as previous, but as a proportion of the total, rather than counts.

Este parámetro mide la proporción de intersecciones con calles adyacentes, para cada tipo de intersección, es decir:

  • 1: Intersección de una sola calle (calle trunca).
  • 2: Intersección de dos calles.
  • 3: Intersección de tres calles, intersección tipo T.
  • 4: Intersección de cuatro calles, intersección tipo cruz.
  • 5 o más: Intersecciones con mayor cantidad de calles que confluyen.

Se debe entender como calle que llega a la intersección como el segmento de calle que nace o llega a dicho nodo, pudiendo ser la misma calle en la práctica, pero son segmentos independientes que llegan y nacen del nodo.

Como medida de este parámetro se puede entender cuan interconectada es la trama de calles, es decir, la cantidad de interconexiones o caminos que puedes tomar para llegar a un punto determinado de la ciudad.

street_length_avg = mean edge length in the undirected

Es la longitud promedio de las calles entre nodos o intersecciones, con este valor se tiene un promedio de la dimensión de las manzanas que conforman el distrito.

street_density_km = street_length_total divided by area in square kilometers

Es la longitud total de las calles entre el área del distrito.Te da una idea de la cantidad de vías que se tienen en el área del distrito.

Detalle de los distritos

Información general de los distritos

Se han analizado los siguientes distritos de Lima y para cada uno de ellos se han extraído los valores de área y población adicionales a los definidos en el apartado anterior.

Orientación de las calles por distritos.

Las rosas náuticas con los vectores de dirección de las calles que conforman los distritos son las siguientes:

La grilla de los distritos en su mayoría es tipo damero, es decir, con una malla ortogonal, salvo en distritos como Barranco, Breña y San Juan de Miraflores existe un patrón más variable de las calles.

La rotación que tienen con respecto al norte tiene dos grandes variantes, la primera con una rotación positiva de 23 grados y la segunda con una negativa de 23 grados.

La rotación de 23 grados con respecto al norte guarda relación con la necesidad de maximizar el tiempo de luz solar durante el invierno, por lo cual, si montamos la inclinación de 23 grados positivos o negativos en la gráfica de amanecer y atardecer durante el solsticio de invierno, dado el 20 de junio, que es cuando se tiene la inclinación máxima. De esta manera las fachadas frontales y posteriores tienen un mayor tiempo durante el año de incidencia del sol[5].

En la parte gráfica que se muestra al final del presente análisis se pueden ver las grillas de cada distrito junto con la rosa náutica de vectores de manera de tener una referencia de la conformación de las calles.

Proporción de calles por cada intersección.

La proporción de las calles que nacen de una intersección es importante para determinar si existen calles truncas que impiden un tránsito continuo ya sea de los vehículos o de los peatones.

Mientras más incidencia se tenga en intersecciones con 1 sola calle por nodo, mayor incidencia de este tipo de distribución y con ello un problema de conectividad del distrito.

Dentro de los distritos que tienen una incidencia de calles truncas se encuentran los de La Molina, Independencia, San Juan de Lurigancho y Villa María del Triunfo.

Mientras que en los 3 últimos obedece a la necesidad de expansión en laderas y quebradas, el primero tiene un origen también en la manera cómo se configuraron sus calles, asemejando a suburbios con calles truncas con lotes de casas.

Cuando se analizan las intersecciones de 3 calles, las cuales por su diseño generan nodo mucho más seguro, dado que por su diseño los vehículos deben reducir su velocidad al aproximarse, se tiene que los distritos con mejor proporción de dichas intersecciones son Los Olivos, San Juan de Miraflores, San Miguel y Santiago de Surco.

Longitud media de las calles

La longitud media entre intersecciones de las calles también es un indicador de cuan caminables son estas para poder llegar de un punto al otro.

Manzanas largas impiden al peatón ir de un punto a otro, al tener que recorrer distancias considerables en un solo sentido.

Calles cortas, por el contrario, permiten una ruta eficiente ya sea a pie, bicicleta o con vehículos motorizados.

Densidad de las calles por distritos.

Si utilizamos la información cuantitativa de densidad de las calles y lo comparamos con la densidad poblacional proyectada para el 2020 para cada distrito tenemos lo siguiente:

De esta tabla podemos apreciar que no hay una correlación positiva entre los distritos con mayor densidad y aquellos que tienen mayor densidad de calles en toda su área.

Los cinco primeros distritos en densidad no corresponden a los cinco primeros en densidad de calles, por el contrario, descienden a partir del puesto 4 en densidad de calles.

Conclusiones

El planeamiento vial de la ciudad de Lima es homogéneo en la mayoría de los distritos, obedece una disposición tradicional ortogonal y en algunos casos, más por la necesidad de acomodar la grilla tradicional en la topografía ha seguido un desarrollo orgánico.

Los distritos con mayor densidad requieren soluciones mayores de conectividad para el peatón, mediante la creación de pasajes y calles que permitan ser eficientes en el transporte de un punto dado de la ciudad a otro, de esta manera se aprovecha la ventaja de vivir en una ciudad medianamente plana y sin extremos de temperatura muy grandes.

Para evitar caer en evaluaciones subjetivas al momento de tomar decisiones referentes a la ciudad es necesario informar de manera objetiva que características tienen nuestros distritos de Lima Metropolitana, de esta manera los planes urbanos tendrán una meta coherente y se descartará el proceso político de modificación de la ciudad que no nos permite integrarnos.

Internet es una plataforma abierta para la toma de datos y el análisis de la información, con herramientas de acceso abierto es posible tener estudios de los datos e información para poder entender el espacio que nos rodea.


[1] http://www.limacomovamos.org/wp-content/uploads/2019/11/Informe-2018_web.pdf

[2] https://geoffboeing.com/2018/07/city-street-orientations-world/

[3] https://en.wikipedia.org/wiki/Grid_plan

[4] https://transportgeography.org/?page_id=4725

[5] https://apuntesdearquitecturadigital.blogspot.com/2013/06/el-diseno-urbano-inca-y-el-solsticio-de.html

Diagramas de orientación y plano distrital