airbnb:pregunta:eliminados
¿Cuántos y qué pisos se eliminan (dejan de estar publicados) de un mes a otro en Airbnb?
A raíz de la pregunta planteada para la ciudad de Barcelona ¿Se eliminaron más anuncios de AirBnB desde el pacto entre la plataforma y el Ayuntamiento de Barcelona de Mayo de 2018? se ha desarrollado esta metodología.
Se parte de varias bases de datos de InsideAirbnb.
- Listings mensuales de anuncios en AirBnb de Barcelona scrapeados por InsideAirbnb https://github.com/montera34/airbnb.barcelona/tree/master/data/original/airbnb
Scripts de análisis:
- El primer análisis se hizo con un script de Python que analiza la cantidad de anuncios de cada base de datos, el número de nuevos y “eliminados” y el balance https://github.com/montera34/airbnb.barcelona/blob/master/taller/mango/airbnb.ipynb
- Un script de R se desarrollo después para hacer los cálculos y generar todos los gráficos del estudio (por tipo de host, tipo de alojamiento, por distritos, anuncios coincidentes) https://github.com/montera34/airbnb.barcelona/blob/master/analisis/eliminados.R Los gráficos generados pueden verse en https://github.com/montera34/airbnb.barcelona/tree/master/images/airbnb/eliminados. El proceso consistió en:
- Hacer un listado con todos los listings que han existido en Barcelona.
- Hacer una matriz (data.frame en el argot de R) en el que cada fila es un listings y cada columna es la fecha del scraping en que apareció. 0 si no estaba listado, 1 si aparecía.
- A partir de esa matriz se pasa a formato “largo”: un data.frame con tres columnas básicas: id del listing, fecha, a la que se añaden características del listing (host.type, room_type, distrito…).
- A partir de ese formato se desarrollan todas las visualizaciones.
Otros:
- Un grafo en gephi (diagrama de red) para analizar anncios coincidentes y no coincidentes entre bases de datos de InsideAirbnb https://github.com/montera34/airbnb.barcelona/tree/master/analisis/eliminados
airbnb/pregunta/eliminados.txt · Última modificación: 2019/03/24 00:48 por numeroteca