Cómo se perciben las empresas inmobiliarias a si mismas. Aplicación del procesamiento de lenguaje natural en las descripciones en portales de venta.

Por Juan Germán Gayoso Arnillas

Tags: NLP, análisis, semántico, negocios, inmobiliarias

Resumen

La aplicación de técnicas de procesamiento de lenguaje natural permite entender los mensajes o ideas claves de la percepción que tienen las empresas inmobiliarias sobre el negocio que manejan y cómo se enfocan en otorgar un producto a sus clientes.

De esta manera se puede entender que es importante para la mayoría de las empresas, definir a que cliente tienen, que este cliente mejora su calidad de vida con el producto y que esto se basa en la experiencia de la empresa ya sea por sus años o por las personas que están en ella.

En este primer análisis usando la agrupación de palabras se plantea un método objetivo para determinar el mensaje de textos dentro de las descripciones que tienen las empresas, sin embargo, este método puede ser aplicado a la normalización de las descripciones de los departamentos en alquiler y venta y con ello tener una mejor idea del mercado inmobiliario en el Perú.

Introducción

Se ha hecho un análisis de la definición que tiene cada empresa inmobiliaria y que describen en las páginas de ASEI y Nexo Inmobiliario.

El estudio corresponde a un análisis de las palabras que utilizan para definirse a si mismas y grupos de palabras que expresan ideas y cómo estas se repiten a lo largo de las definiciones de cada una.

Dentro de los estudios de NLP[1] (Procesamiento natural del lenguaje) se tiene la metodología de agrupación en NGRAM o grupos de palabras y su frecuencia de uso como una manera para entender la idea de un texto y el sentimiento que se tiene dentro de él.[2]

Las palabras y su frecuencia pueden evidenciar el enfoque de lo que se quiere comunicar, sin embargo, no son suficientes para interpretar la idea o la connotación del texto, para ello es necesario analizar grupos de palabras, en agrupaciones donde se pueda entender el sentido de las oraciones de manera objetiva.

Es importante este análisis a fin de percibir la idea que las empresas inmobiliarias tienen sobre lo que es el negocio de venta de departamentos.

En un posterior estudio se podrá hacer el mismo análisis sobre la descripción de los proyectos de las principales inmobiliarias y con ello entender los patrones o enfoques comerciales que se tienen y poder replantear la estrategia de comunicaciones para generar una diferenciación.

El resumen de las palabras se hará en un servicio en línea que realiza el análisis de frecuencias para los distintos grados de agrupación[3].

Análisis 1Gram

Tenemos primero un análisis de frecuencias de palabras únicas, de las cuales se han depurado los artículos y preposiciones por no contener significado relevante para el análisis y se dejaron aquellas palabras que las empresas inmobiliarias consideran de valor.

Se tiene la siguiente lista resumen de las principales palabras, la cantidad de repeticiones y la frecuencia sobre el total de la muestra.

Se desprende de este primer análisis que la incidencia en describir sus PROYECTOS, es decir, su producto es importante para las empresas.

Por otro lado, EL CLIENTE es un elemento que se busca encajar dentro de la definición, definiendo el cumplimiento de una promesa, el conocimiento de este o nombrándolo para definir cercanía con él.

Por último, LA CALIDAD es el otro elemento que se refuerza y que en los análisis de 2Gram, 3Gram y 4Gram se podrá apreciar cómo se le aborda.

Sin embargo, este primer análisis de las palabras no arroja una conclusión sobre el sentimiento de las frases y su incidencia en los textos de todos los socios del ASEI, por lo tanto, es necesario proseguir con las siguientes agrupaciones.

Análisis 2Gram

En el análisis 2Gram, es decir, de grupos de 2 palabras, se tienen los siguientes resultados.

En esta agrupación se puede comenzar a entender la idea o enfoque de definición de las empresas inmobiliarias.

En mayor frecuencia las empresas definen o toman a un cliente o segmento y afirman que ellos reciben un producto específico, recalcando para ello la experiencia y los años de la empresa o del equipo humano, a su vez inciden de manera constante en la calidad del producto que generan.

Análisis 3Gram

En la medida que se incrementa el grado de agrupación de palabras se puede tener una idea del sentimiento o sentido de la redacción que describe a las empresas y cómo buscan apropiarse de un concepto o idea.

En el caso del análisis 3Gram tenemos las siguientes ideas relevantes de definición de la empresa:

Lo más resaltante de esta agrupación de ideas es el refuerzo de los conceptos que se aprecian en los 2Grams.

Se hace énfasis en los clientes o el público objetivo al que se enfoca la empresa, en la experiencia que se tiene y en menor medida como la calidad de vida es afectada, aunque en este último aspecto no se puede apreciar aún un juicio positivo o negativo de esa frase.

4Gram y 5Gram

En el análisis de 4Gram y 5Gram, pese a que las frases cuentan con un mayor sentido para su entendimiento tienen la deficiencia que son agrupaciones de muy baja frecuencia sobre el total de la muestra, por la probabilidad de ocurrencia de conjuntos de 4 o 5 palabras en todos los textos de descripción de las empresas inmobiliarias, sin embargo, igual dan una idea de lo que significan los textos.

Se recalca lo descrito en los anteriores NGrams, que indican una incidencia en la descripción basada en la experiencia de la empresa, la calidad del producto que generan y como afectan o se preocupan por la calidad de vida de sus clientes.

Consolidación de los hallazgos y conclusiones

El principal descriptor que las empresas inmobiliarias usan es la experiencia que ellas tienen en mejorar la calidad de vida de sus clientes.

Esta auto descripción se desprende de la frecuencia que tienen palabras y luego frases orientadas al su cliente, el valor asociado de mejora de calidad de vida y la alta incidencia de la experiencia dentro de los textos analizados.

En un análisis comparativo en los textos se tienen que un 26% de las empresas empiezan definiéndose con un texto clásico de “somos una empresa”, solo algunas emplean nuevas maneras de definirse que no tengan esa manera clásica de definición de sí mismas.

El análisis NLP es una herramienta útil para el análisis del significado de grandes trozos de textos con una base objetiva en las conclusiones.

El NLP permite entender la percepción de las empresas de la competencia sobre si mismas y con ello tener información que permita generar una diferenciación dentro del plan estratégico de comunicaciones.

De la misma manera que da insights sobre la percepción de las empresas sobre si mismas, se puede realizar el procesamiento de todas las descripciones de los proyectos para entender las diferencias en el lenguaje que tienen las empresas sobre los distintos targets a los que se enfocan y poder validar si lo que se comunica genera valor o se conecta con el lenguaje del público objetivo o con las necesidades y aspiraciones de ese grupo demográfico.


[1] https://en.wikipedia.org/wiki/Natural_language_processing

[2] http://guidetodatamining.com/assets/guideChapters/DataMining-ch7.pdf

[3] http://guidetodatamining.com/ngramAnalyzer/