Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anterior Revisión previa | |||
airbnb:pregunta:eliminados [2019/03/24 00:42] numeroteca |
airbnb:pregunta:eliminados [2019/03/24 00:48] (actual) numeroteca |
||
---|---|---|---|
Línea 7: | Línea 7: | ||
Scripts de análisis: | Scripts de análisis: | ||
- | * Un script de Python que analiza la cantidad de anuncios de cada base de datos, el número de nuevos y "eliminados" y el balance https://github.com/montera34/airbnb.barcelona/blob/master/taller/mango/airbnb.ipynb | + | * El primer análisis se hizo con un script de Python que analiza la cantidad de anuncios de cada base de datos, el número de nuevos y "eliminados" y el balance https://github.com/montera34/airbnb.barcelona/blob/master/taller/mango/airbnb.ipynb |
- | * Un script de R hacer los cálculos y generar todos los gráficos del estudio (por tipo de host, tipo de alojamiento, por distritos, anuncios coincidentes) https://github.com/montera34/airbnb.barcelona/blob/master/analisis/eliminados.R Los gráficos generados pueden verse en https://github.com/montera34/airbnb.barcelona/tree/master/images/airbnb/eliminados | + | * Un script de R se desarrollo después para hacer los cálculos y generar todos los gráficos del estudio (por tipo de host, tipo de alojamiento, por distritos, anuncios coincidentes) https://github.com/montera34/airbnb.barcelona/blob/master/analisis/eliminados.R Los gráficos generados pueden verse en https://github.com/montera34/airbnb.barcelona/tree/master/images/airbnb/eliminados. El proceso consistió en: |
+ | - Hacer un listado con todos los listings que han existido en Barcelona. | ||
+ | - Hacer una matriz (data.frame en el argot de R) en el que cada fila es un listings y cada columna es la fecha del scraping en que apareció. 0 si no estaba listado, 1 si aparecía. | ||
+ | - A partir de esa matriz se pasa a formato "largo": un data.frame con tres columnas básicas: id del listing, fecha, a la que se añaden características del listing (host.type, room_type, distrito...). | ||
+ | - A partir de ese formato se desarrollan todas las visualizaciones. | ||
Otros: | Otros: | ||
* Un grafo en gephi (diagrama de red) para analizar anncios coincidentes y no coincidentes entre bases de datos de InsideAirbnb https://github.com/montera34/airbnb.barcelona/tree/master/analisis/eliminados | * Un grafo en gephi (diagrama de red) para analizar anncios coincidentes y no coincidentes entre bases de datos de InsideAirbnb https://github.com/montera34/airbnb.barcelona/tree/master/analisis/eliminados |