Herramientas de usuario

Herramientas del sitio


airbnb:pregunta:que-anuncios-estan-activos

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anterior Revisión previa
Próxima revisión
Revisión previa
airbnb:pregunta:que-anuncios-estan-activos [2018/09/11 09:51]
numeroteca
airbnb:pregunta:que-anuncios-estan-activos [2018/12/03 13:13] (actual)
numeroteca [1. Qué análisis o visualización responde a la pregunta]
Línea 7: Línea 7:
 ===== 1. Qué análisis o visualización responde a la pregunta ===== ===== 1. Qué análisis o visualización responde a la pregunta =====
  
-Para responder a esta pregunta primero hay que definir qué es un **anuncio activo**. Lo ideal sería poder definir los anuncios que se han alquilado un cierto número de días al año o en un determinado periodo, esto es, poder definir los anuncios que han aceptado clientes recientemente. Como esos datos son difíciles de obtener podemos usar las siguientes alternativas en función de los datos disponibles.+Para responder a esta pregunta primero hay que definir qué es un **anuncio activo**. ​
  
-Un anuncio activo podría estar definido ​por:+Lo ideal sería poder definir los anuncios que se han alquilado un cierto número de días al año o en un determinado periodo, esto es, poder definir los anuncios que han aceptado clientes recientemente ​por encima de una cantidad establecida. Como esos datos son difíciles de obtener podemos usar las siguientes alternativas en función de los datos disponibles.
  
-  ​* **El que está visible en la web en determinado momento**. Quedarían fuera los que han sido datos de baja. +Un anuncio activo puede definirse por una combinación de variables:​ 
-  * **El que tiene fechas disponibles para ser alquilado**. Habría que definir ​en qué fechas. +  * **El que ha recibido //reviews// en un determinado periodo** [pasado]. No todos los anuncios que han tenido una reserva llegan a tener //review//, pero puede ser un buen indicador. 
-  * **El que ha recibido __reviews__ ​en un determinado periodo**No todos los anuncios ​que han tenido una reserva llegan a tener __review__ pero puede ser un buen indicador.+  ​* **El que está visible en la web en determinado momento** ​[presente]. Quedarían fuera los que han sido dados de baja. 
 +  * **El que tiene fechas disponibles para ser alquilado** ​[futuro]. Habría que definir qué periodo de fechas. 
 + 
 +Como se indica ​en [[http://​insideairbnb.com/​about.html#​disclaimers|InsideAirbnb]] "​algunos anfitriones no mantienen sus calendarios actualizados o los tienen muy disponibles,​ incluso cuando viven en su propia casa/​apartamento"​ por lo tanto es preciso combinar este análisis asegurándose de que hayan sido reservados recientemente (han tenido una review en los últimos 6 meses) y frecuentemente (número de noches alquiladas por año mayor que el ¿límite/​umbral?​ para esa ciudad). 
 + 
 +Parece necesario entonces, para clasificar ​un anuncio como activo, combinar el análisis de una serie de variables.
  
 Visualización:​ Visualización:​
  
   * Una barra en el que se representa el total de pisos e indica qué parte de éstos se consideran activos.   * Una barra en el que se representa el total de pisos e indica qué parte de éstos se consideran activos.
 +
 +
 +==== Método: activos por mes ====
 +
 +Para contar los activos en un determinado mes (la empresa Airdna lo hace así "An active rental is a property that has had at least one available day or property day in the previous month. Available day means the host had made the property available to rent", y tiene sentido, hay que delimitar el periodo que se quiere estudiar) podemos seleccionar los que cumplan alguna de las siguientes cosas:
 +  * tengan fechas disponibles (que la  significa que la fecha de "​revised"​ en las bases de datos de datahippo.org sea de ese mes o anterior)
 +  * haya tenido reserva en el mes anterior o en ese mismo (eso lo podemos saber por la fecha de las last review del [[https://​github.com/​montera34/​airbnbeuskadi/​blob/​09b6e3cc34a1510bcf74794326d62a3fe46f3074/​scraping/​airbnb.lastreview.py|scraping que hemos desarrollado]])
 +
 +[[https://​github.com/​montera34/​airbnbeuskadi/​blob/​master/​analisis/​listings_activos_filter.R|Ver script en R]] para calcular los activos en un determinado mes.
 +
  
  
Línea 28: Línea 43:
 ===== 2. Qué datos necesito y dónde los encuentro ===== ===== 2. Qué datos necesito y dónde los encuentro =====
  
-Para responder a esta pregunta hace falta+Los datos que hacen falta varían dependiendo ​de lo que vayamos a utilzar.
-  * Lista de //​listings//​ de una región/​ciudad. +
-  * Lista de los //​listings// ​que están disponibles. +
-  * Última //review// (crítica o comentario que deja un usuario en el anuncio tras haber terminado su estancia) de cada //listing//.+
  
-Inside Airbnb ofrece un archivo con todas las //​reviews// ​de los //​listings//​ //​scrapeados//​. +==== Análisis ​de calendario ====
-Datahippo solamente ofrece los id de los //listings scrapeados//​. ​+
  
-Si el scrapeo no incluye la fecha del último review hace falta hacer un scraping a partir de los id de los listings de esa regiónEste es el [[https://​github.com/​montera34/​airbnbeuskadi/​blob/​master/​scraping/​airbnb.lastreview.py|script ​de python]], para que funcione necesitas ​un archivo donde en cada línea haya un id de listing.+Insidairbnb ofrece ​un archivo ''​%%calendar.csv.gz%%''​ donde se pueden consultar las fechas disponibles ​de un listing.
  
 +Ejemplo de un archivo de calendar.csv de Insideairbnb,​ donde en cada línea se tiene el id, la fecha en que está disponible y el precio: ​
 +
 +^listing_id ^ date ^ available ^ price ^
 +| 11368 | 2019-08-13 | t | $100.00 |
 +| 11368 | 2019-08-12 | t | $100.00 | 
 +| 11368 |2019-08-11 | t | $100.00 |
 +
 +Una de las variables de los archivos de InsideAirbnb es la de ''​availability_30'',​ ''​availability_60'',​ ''​availability_90''​ o ''​availability_365''​ que indican el número de noches que tiene cada anuncio disponibles en los próximos 30, 90 o 265 días.
 +
 +
 +=== Análisis de anuncios con fechas disponibles ===
 +
 +Datahippo archiva en su base de datos como "​revisado"​ (//​revised//​) cuando un anuncio es encontrado de nuevo al hacer una búsqueda. El //​scraping//​ está desarrollado haciendo una búsqueda para fechas lejanas (aproximadamente el año siguiente). ​
 +
 +
 +==== Análisis de anuncios que siguen online ====
 +
 +En base a un listado de id de listings (que puedes obtener de Insideairbnb o de la base de datos incremental de Datahippo) se puede hacer un //ping// a cada url de cada listing para ver cuales están activos.
 +
 +
 +==== Análisis de reviews ====  ​
 +
 +  * Listado con todos los //reviews// de un listado de //​listings//​. Está disponible en Insideairnb en el archivo ''​reviews.csv.gz''​.
 +  * Última //review// (crítica o comentario que deja un usuario en el anuncio tras haber terminado su estancia) de cada //​listing//​.
 +
 +InsideAirbnb ofrece un archivo con todas las //reviews// de los //​listings//​ //​scrapeados//​. Podemos utilizar la fecha de la última //review// para definir cuándo un anuncio ha estado activo o analizar el total de //reviews// por periodo analizado.
 +
 +Datahippo solamente ofrece los id de los //listings scrapeados//​. Como el scrapeo no incluye la fecha del último review hace falta hacer un scraping a partir de los id de los listings de esa región. Este es el [[https://​github.com/​montera34/​airbnbeuskadi/​blob/​master/​scraping/​airbnb.lastreview.py|script de python]], para que funcione necesitas un archivo donde en cada línea haya un id de listing. El script podría hacer varias funciones: ver si el anuncio sigue online y capturar datos actualizados:​ últimas fechas de reviews (porque había varias reviews en portada y no siempre ordenadas cronológicamente),​ título, usuario, id, plazas, precio y número de reviews.
  
  
 ===== 3. Qué herramientas uso para preparar los datos. Qué pasos debo seguir ===== ===== 3. Qué herramientas uso para preparar los datos. Qué pasos debo seguir =====
 +
 +==== Análisis de calendario ====
 +
 +==== Análisis de anuncios que siguen online ====
 +
 +==== Análisis de reviews ====
 +
 +Este script escrito en R, ''​review-analysis.R'',​ analiza los reviews de una localización para estudiar estacionalidad y evolución de uso en base a un archivo de //reviews// de Insideairbnb:​
 +https://​github.com/​montera34/​airbnbeuskadi/​blob/​master/​analisis/​review-analysis.R
 +
  
 ===== 4 Qué herramientas uso para producir la visualización. Qué pasos debo seguir ===== ===== 4 Qué herramientas uso para producir la visualización. Qué pasos debo seguir =====
  
-==== Visualización 1 ==== 
  
-Pasos a seguir para producir la visualización 1 y qué herramientas son necesarias.+==== Análisis de reviews ==== 
 + 
 +Puedes ver los resultados del script ''​review-analysis.R''​ aquí: https://​github.com/​montera34/​airbnbeuskadi/​tree/​master/​images/​airbnb/​reviews 
 + 
 +== Resultados == 
 + 
 +{{https://​raw.githubusercontent.com/​montera34/​airbnbeuskadi/​master/​images/​airbnb/​reviews/​airbnb-reviews-por-mes-stacked-donostia-2013-2016.png?​550}} 
 + 
 +{{https://​raw.githubusercontent.com/​montera34/​airbnbeuskadi/​master/​images/​airbnb/​reviews/​airbnb-reviews-mes-2011-2017.png?​550}}
  
 +{{https://​raw.githubusercontent.com/​montera34/​airbnbeuskadi/​master/​images/​airbnb/​reviews/​airbnb-reviews-puntos-donostia-2011-2017_1.png?​550}}
  
-== Resultado ==+{{https://​raw.githubusercontent.com/​montera34/​airbnbeuskadi/​master/​images/​airbnb/​reviews/​airbnb-reviews-puntos-donostia-2011-2017_2.png?​550}}
  
-Imagen de las diferentes visualizaciones y enlaces a la web en la que están publicadas.+{{https://​raw.githubusercontent.com/​montera34/​airbnbeuskadi/​master/​images/​airbnb/​reviews/​airbnb-reviews-mes-top4-marcado-2011-2017.png?​550}}
airbnb/pregunta/que-anuncios-estan-activos.1536659494.txt.gz · Última modificación: 2018/09/11 09:51 por numeroteca