Tabla de Contenidos
Variaciones espaciales de precios por plaza
Documentación basada originalmente en https://github.com/montera34/airbnbeuskadi/wiki/Variaciones-espaciales-de-precios-por-plaza-en-Donostia desarrollado por Ana Boto, Habib Belaribi, Pablo de Miguel, Patxi Sesigai y Claudia Yubero en el Summerlab'17 en Hirikilabs, Donostia.
1. Qué análisis o visualización responde a la pregunta
- Gráfico de barras: cada barra es un barrio. LA longitud es el precio. Podría incluirse máyor y menor precio.
- Matriz de histogramas de precios por cada barrio.
- Mapa geográfico con 1 punto de color por vivienda. El color de cada zona (cuadros de unos cientos de metros) varía proporcionalmente al precio medio del alquiler por plaza en esta zona. Los colores son un degradado determinado que se aplica a los quantiles estadísticos de los precios (nosotros definimos cuantos quantiles).
2 Qué datos necesito y dónde los encuentro
Datos de Airbnb que necesitamos para trabajar (Columnas dentro del archivo csv):
- Id_piso
- Longitud
- Latitud
- Añadir una columna: barrio (con longitud y latitud de un id_piso dado)
- Precio_alquiler
- fecha del conjunto de datos (para comparar la evolución de los precios otro día en el futuro por ejemplo)
Tenemos el archivo de datos de viviendas airbnb sobre qué vamos a trabajar y el archivo con las coordenadas de las fronteras de los barrios de Donostia (GIS: formato .shp)
3 Qué herramientas uso para preparar los datos. Qué pasos debo seguir
Descripción de las herramientas y pasos a dar
A) Proceso
Nos basamos inicialmente en el ejemplo descrito en: https://github.com/montera34/airbnbeuskadi/wiki/%C2%BFC%C3%B3mo-se-concentra-la-oferta-por-barrios-de-Airbnb%3F Miramos un ejemplo de extracto csv para entender qué tipos de datos tenemos.
Hablamos de gŕaficos que nos podrían interesar, y conversarmos para identificar 1 pregunta, y rápidamente 2 preguntas, y 1 sub-pregunta por pregunta (total= 3 preguntas, 3 mapas).
QGIS permite asociar las coordenadas de puntos geográficos(longitud, latitud), en nuestro caso las viviendas sobre airbnb, con las coordenadas de la fronteras de los barrios de Donostia, superponiendo 2 bases de datos (base 1: fronteras de los barrios, base 2: coordenadas de las viviendas)
B) Herramientas
Privilegiamos el uso de software libre, de acuerdo con nuestras ganas de facilitar el compartimiento de conocimiento con cualquier persona con esté interesada en este tema:
Para los cálculos (medias y medianas, asociar un barrio a cada vivienda): Hoja de cálculo de LibreOffice (Calc) Para hacer un análisis sobre un mapa geográfico: http://qgis.org/en/site/ : herramienta GIS (sistema de información geográfica) de la comunidad de software libre y open-source (FOSS) alternativa: https://carto.com/ : software en línea, se usa dentro de tu navegador
3) Producción de las mapas
3-A) trabajo con QGIS
Paso 1: cargar capa csv con los datos de airbnb en QGIS. Al cargarla nos pedirá la proyección. Nos aseguramos de que es la misma en todas las capas. En este caso elegimos WGS 84: EPSG 4326.
Aparecen en QGIS todos los anuncios repartidos por DSS. Algunos de ellos están en el mar.
Paso 2: para no perder los puntos que están en el mar los movemos al barrio mas cercano. Consideramos el movimiento siempre con menos de 100m para que el error no sobrepase el propio error de Airbnb. Vectorial > herramienta de investigación > selección por localización > en el cuadro de dialogo se anade la capa de puntos con la capa a intersectar (barrios) y se pincha la opción inconexo. Una vez que están todos los anuncios en tierra se genera una columna con las coordenadas x e y nuevas.
Se crea una capa a parte para obtener los puntos que estan en el mar (son 31). Solo para verlos e identificar cuales debemos mover.
Identificamos cada uno de ellos en la capa con la que vamos a trabajar y los movemos “a mano” a la zona más próxima edificada. Herramienta Mover objetos espaciales.
Paso 3: utilizamos la herramienta “Unir atributos por localizacion” (Menu: Vector > Data Management Tools > Join Attributes by location) para añadir informacion (de barrio) a cada unos de los anuncios de la base de datos de los anuncios. La capa “Target vector Layer” serán nuestros anuncios de Airbnb y la “Join Vector Layer” los barrios. Marca “Take attributes of first located feature” y “Only keep matching records” (para quedarte solamente con los puntos que están en los barrios“. Salva la capa como un shapefile y comprueba que se aha añadido la columna de “barrio” a tus base de datos de anuncios.
4 Qué herramientas uso para producir la visualización. Qué pasos debo seguir
3-B) trabajo sobre los datos con una hoja de cálculo
Se exporta la nueva base de datos a una hoja de calculo para limpiarla: Quitar informacion irrelevante (codigo de barrio, las shape lenght y area tec.) para dejar BAR_DS_O.
Partimos de una base de datos que recoge los anuncios del día 28 de marzo de 2017 (martes) y completada con los anuncios de una segunda base de datos (1830). Hemos calculado la media de los precios por plaza de cada anuncio. El dato precios por plaza nos permite comparar pisos de diferente tamaño. Nos hemos centrado solo en los pisos turísticos completos (1346), eliminando las habitaciones compartidas y las habitaciones privadas (suponiendo que estas no están en pisos turísticos completos, aunque sabemos que puede no ser así siempre). A cada anuncio le hemos asignado el barrio en el que se ubica y como en 3 casos no reconocía el barrio hemos eliminado estos registros (1343). También hemos eliminado otros 2 que no tenían dato de precio precio (1341). Las medias por barrio se han obtenido sobre este total de registros. Para analizar la distribución espacial hemos optado por hacer cuadriculas dado el gran número de puntos según propone carto.com.
3-C) trabajo sobre carto.com
Capturas de pantalla disponibles por aquí: http://www.pearltrees.com/habsinn/item205116760.
Conectate a CARTO y crea una cuenta de usuario (capturas de pantalla 1,2) Cliquea sobre “New map” para crear un nuevo mapa. (captura de pantalla 3) Busca los 2 archivos que necesitas: fronteras de los barrios (https://github.com/montera34/airbnbeuskadi/blob/master/data/barrios-donostia.zip — cliquea sobre “raw zip” para bajar el archivo), datos de las viviendas (https://raw.githubusercontent.com/montera34/airbnbeuskadi/master/data/listings_con_barrios_donostia_merged.csv — haz clic en el botón derecho para “bajarte los datos” — guárdalos en un tu hoja de calculo en formato .csv). (capturas de pantalla 7,8) Cliquea sobre el menu “connect dataset” para subir los 2 archivos: (capturas de pantalla 4,5,6) Cliquea sobre el símbolo para modificar tu nuevo mapa “untitled map” : darle un título, una descripción y luego trabajar sobre los datos…(captura de pantalla 9)
3-D) trabajo para dibujar y imprimir las variaciones de precio por zona en la forma de un mapa 3D**
Herramientas:
- embossify.com Convert 2D images to 3D objects.
- tinkercad.com Simple, online 3D design and 3D printing app for everyone.
- https://stephaneginier.com/sculptgl/ Online modelator.
Proceso:
1- Trabajo sobre carto.com: El objetivo es limpiar la carta para que sea más fácil crear un archivo 3D donde se visualizan las variaciones de precio por una altura espacial diferente. Resultado obtenido:
2- Elegir la capa de datos de los barrios y poner esa capa en color blanco o muy claro para diferenciar bien el fondo de la visualización que nos interesa
3- Hacer una captura de pantalla del mapa en formato :jpeg.
4- Convertir el .jpeg en archivo .stl con embossify.com, utilizando la opción “thicker” - “darker”. Embossify permite asociar cada color de cada zona a una altura propia (proporcional a los precios), Importante: elegir “width”= 5 (o otro cifra pequeña) para que las diferencias de altura entre cada quintile de precio medio se vean bien.
5- Abrir tinkercad.com para trabajar sobre el archivo .stl.
6- Estirar la altura general del mapa con el punto-flecha en el centro del mapa.
7- Así se ven mejor las diferencias de alturas entre cada quintile.
Ejemplo de resultado para imprimir:
Otras ideas de visualización para la próxima vez: a- con una impresora 3D que tiene RGB, se podría hacer un color por torre/barra según el precio medio que representa, para diferenciar las “torres invisibles” cada quintile. b- con una impresora 3D que tiene RGB,hacer un color por quintile dentro de cada torre, y así ver un degradado de color para cada torre y entonces para el mapa 3D en general.