====== ¿Cuántos y qué pisos se eliminan (dejan de estar publicados) de un mes a otro en Airbnb? ====== A raíz de la pregunta planteada para la ciudad de Barcelona **¿Se eliminaron más anuncios de AirBnB desde el pacto entre la plataforma y el Ayuntamiento de Barcelona de Mayo de 2018?** se ha desarrollado esta metodología. Se parte de varias bases de datos de InsideAirbnb. * Listings mensuales de anuncios en AirBnb de Barcelona scrapeados por InsideAirbnb https://github.com/montera34/airbnb.barcelona/tree/master/data/original/airbnb Scripts de análisis: * El primer análisis se hizo con un script de Python que analiza la cantidad de anuncios de cada base de datos, el número de nuevos y "eliminados" y el balance https://github.com/montera34/airbnb.barcelona/blob/master/taller/mango/airbnb.ipynb * Un script de R se desarrollo después para hacer los cálculos y generar todos los gráficos del estudio (por tipo de host, tipo de alojamiento, por distritos, anuncios coincidentes) https://github.com/montera34/airbnb.barcelona/blob/master/analisis/eliminados.R Los gráficos generados pueden verse en https://github.com/montera34/airbnb.barcelona/tree/master/images/airbnb/eliminados. El proceso consistió en: - Hacer un listado con todos los listings que han existido en Barcelona. - Hacer una matriz (data.frame en el argot de R) en el que cada fila es un listings y cada columna es la fecha del scraping en que apareció. 0 si no estaba listado, 1 si aparecía. - A partir de esa matriz se pasa a formato "largo": un data.frame con tres columnas básicas: id del listing, fecha, a la que se añaden características del listing (host.type, room_type, distrito...). - A partir de ese formato se desarrollan todas las visualizaciones. Otros: * Un grafo en gephi (diagrama de red) para analizar anncios coincidentes y no coincidentes entre bases de datos de InsideAirbnb https://github.com/montera34/airbnb.barcelona/tree/master/analisis/eliminados