Herramientas de usuario

Herramientas del sitio


airbnb:pregunta:eliminados

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anterior Revisión previa
airbnb:pregunta:eliminados [2019/03/24 00:42]
numeroteca
airbnb:pregunta:eliminados [2019/03/24 00:48] (actual)
numeroteca
Línea 7: Línea 7:
  
 Scripts de análisis: Scripts de análisis:
-  * Un script de Python que analiza la cantidad de anuncios de cada base de datos, el número de nuevos y "​eliminados"​ y el balance https://​github.com/​montera34/​airbnb.barcelona/​blob/​master/​taller/​mango/​airbnb.ipynb +  * El primer análisis se hizo con un script de Python que analiza la cantidad de anuncios de cada base de datos, el número de nuevos y "​eliminados"​ y el balance https://​github.com/​montera34/​airbnb.barcelona/​blob/​master/​taller/​mango/​airbnb.ipynb 
-  * Un script de R hacer los cálculos y generar todos los gráficos del estudio (por tipo de host, tipo de alojamiento,​ por distritos, anuncios coincidentes) https://​github.com/​montera34/​airbnb.barcelona/​blob/​master/​analisis/​eliminados.R Los gráficos generados pueden verse en https://​github.com/​montera34/​airbnb.barcelona/​tree/​master/​images/​airbnb/​eliminados+  * Un script de R se desarrollo después para hacer los cálculos y generar todos los gráficos del estudio (por tipo de host, tipo de alojamiento,​ por distritos, anuncios coincidentes) https://​github.com/​montera34/​airbnb.barcelona/​blob/​master/​analisis/​eliminados.R Los gráficos generados pueden verse en https://​github.com/​montera34/​airbnb.barcelona/​tree/​master/​images/​airbnb/​eliminados. El proceso consistió en: 
 +    - Hacer un listado con todos los listings que han existido en Barcelona. 
 +    - Hacer una matriz (data.frame en el argot de R) en el que cada fila es un listings y cada columna es la fecha del scraping en que apareció. 0 si no estaba listado, 1 si aparecía. 
 +    - A partir de esa matriz se pasa a formato "​largo":​ un data.frame con tres columnas básicas: id del listing, fecha, a la que se añaden características del listing (host.type, room_type, distrito...). 
 +    - A partir de ese formato se desarrollan todas las visualizaciones.
  
 Otros: Otros:
   * Un grafo en gephi (diagrama de red) para analizar anncios coincidentes y no coincidentes entre bases de datos de InsideAirbnb https://​github.com/​montera34/​airbnb.barcelona/​tree/​master/​analisis/​eliminados   * Un grafo en gephi (diagrama de red) para analizar anncios coincidentes y no coincidentes entre bases de datos de InsideAirbnb https://​github.com/​montera34/​airbnb.barcelona/​tree/​master/​analisis/​eliminados
airbnb/pregunta/eliminados.txt · Última modificación: 2019/03/24 00:48 por numeroteca