Herramientas de usuario

Herramientas del sitio


airbnb:pregunta:que-anuncios-estan-activos

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anterior Revisión previa
Próxima revisión
Revisión previa
airbnb:pregunta:que-anuncios-estan-activos [2018/09/11 09:35]
numeroteca [1. Qué análisis o visualización responde a la pregunta]
airbnb:pregunta:que-anuncios-estan-activos [2018/12/03 13:13] (actual)
numeroteca [1. Qué análisis o visualización responde a la pregunta]
Línea 7: Línea 7:
 ===== 1. Qué análisis o visualización responde a la pregunta ===== ===== 1. Qué análisis o visualización responde a la pregunta =====
  
-Para responder a esta pregunta primero hay que definir qué es un anuncio activo. Lo ideal sería poder definir los anuncios que se han alquilado un cierto número de días al año o en un determinado periodo. Como esos datos son difíciles de obtener podemos usar las siguientes alternativas en función de los datos disponibles.+Para responder a esta pregunta primero hay que definir qué es un **anuncio activo**
  
-Un anuncio activo podría estar definido ​por:+Lo ideal sería poder definir los anuncios que se han alquilado un cierto número de días al año o en un determinado periodo, esto es, poder definir los anuncios que han aceptado clientes recientemente ​por encima de una cantidad establecida. Como esos datos son difíciles de obtener podemos usar las siguientes alternativas en función de los datos disponibles.
  
-  ​* **El que está visible en la web en determinado momento**. Quedarían fuera los que han sido datos de baja. +Un anuncio activo puede definirse por una combinación de variables:​ 
-  * **El que tiene fechas disponibles para ser alquilado**. Habría que definir ​en qué fechas. +  * **El que ha recibido //reviews// en un determinado periodo** [pasado]. No todos los anuncios que han tenido una reserva llegan a tener //review//, pero puede ser un buen indicador. 
-  * **El que ha recibido __reviews__ ​en un determinado periodo**No todos los anuncios ​que han tenido una reserva llegan a tener __review__ pero puede ser un buen indicador.+  ​* **El que está visible en la web en determinado momento** ​[presente]. Quedarían fuera los que han sido dados de baja. 
 +  * **El que tiene fechas disponibles para ser alquilado** ​[futuro]. Habría que definir qué periodo de fechas. 
 + 
 +Como se indica ​en [[http://​insideairbnb.com/​about.html#​disclaimers|InsideAirbnb]] "​algunos anfitriones no mantienen sus calendarios actualizados o los tienen muy disponibles,​ incluso cuando viven en su propia casa/​apartamento"​ por lo tanto es preciso combinar este análisis asegurándose de que hayan sido reservados recientemente (han tenido una review en los últimos 6 meses) y frecuentemente (número de noches alquiladas por año mayor que el ¿límite/​umbral?​ para esa ciudad). 
 + 
 +Parece necesario entonces, para clasificar ​un anuncio como activo, combinar el análisis de una serie de variables.
  
 Visualización:​ Visualización:​
Línea 20: Línea 25:
  
  
-==== Referencias ​====+==== Método: activos por mes ====
  
-?+Para contar los activos en un determinado mes (la empresa Airdna lo hace así "An active rental is a property that has had at least one available day or property day in the previous month. Available day means the host had made the property available to rent", y tiene sentido, hay que delimitar el periodo que se quiere estudiar) podemos seleccionar los que cumplan alguna de las siguientes cosas: 
 +  * tengan fechas disponibles (que la  significa que la fecha de "​revised"​ en las bases de datos de datahippo.org sea de ese mes o anterior) 
 +  * haya tenido reserva en el mes anterior o en ese mismo (eso lo podemos saber por la fecha de las last review del [[https://​github.com/​montera34/​airbnbeuskadi/​blob/​09b6e3cc34a1510bcf74794326d62a3fe46f3074/​scraping/​airbnb.lastreview.py|scraping que hemos desarrollado]])
  
-===== 2Qué datos necesito y dónde ​los encuentro =====+[[https://​github.com/​montera34/​airbnbeuskadi/​blob/​master/​analisis/​listings_activos_filter.R|Ver script en R]] para calcular ​los activos en un determinado mes.
  
-Para responder a esta pregunta hace falta: 
-  * Lista de //​listings//​ de una región/​ciudad. 
-  * Última //review// de cada listing. 
  
-El objetivo es poder analizar qué anuncios están activos, y por activos queremos indicar: anuncios que han aceptado clientes recientemente. 
  
-==== Más info sobre este tema ====+==== Referencias ​====
  
 "Un 72% de los usuarios dejan comentarios"​ (datos de 2012): https://​www.quora.com/​What-percent-of-Airbnb-hosts-leave-reviews-for-their-guests. Fuente e hilo de Twitter: https://​twitter.com/​InsideAirbnb/​status/​988886252329095168 "Un 72% de los usuarios dejan comentarios"​ (datos de 2012): https://​www.quora.com/​What-percent-of-Airbnb-hosts-leave-reviews-for-their-guests. Fuente e hilo de Twitter: https://​twitter.com/​InsideAirbnb/​status/​988886252329095168
Línea 38: Línea 41:
 Improving the Transparency of the Sharing (2017) Economy http://​mathias.lecuyer.me/​assets/​assets/​www2017airbnb.pdf Improving the Transparency of the Sharing (2017) Economy http://​mathias.lecuyer.me/​assets/​assets/​www2017airbnb.pdf
  
-Si el scrapeo no incluye ​la fecha del último ​review (crítica o comentario que deja un usuario en el anuncio tras haber terminado su estancia) hace falta hacer un scrpaming ​a partir de los id de los listings de esa región. Este es el [[https://​github.com/​montera34/​airbnbeuskadi/​blob/​master/​scraping/​airbnb.lastreview.py|script de python]], para que funcione necesitas un archivo donde se en cada línea haya un id de listing.+===== 2. Qué datos necesito y dónde los encuentro ===== 
 + 
 +Los datos que hacen falta varían dependiendo de lo que vayamos a utilzar. 
 + 
 +==== Análisis de calendario ==== 
 + 
 +Insidairbnb ofrece un archivo ''​%%calendar.csv.gz%%''​ donde se pueden consultar las fechas disponibles de un listing. 
 + 
 +Ejemplo de un archivo de calendar.csv de Insideairbnb,​ donde en cada línea se tiene el id, la fecha en que está disponible y el precio:  
 + 
 +^listing_id ^ date ^ available ^ price ^ 
 +| 11368 | 2019-08-13 | t | $100.00 | 
 +| 11368 | 2019-08-12 | t | $100.00 |  
 +| 11368 |2019-08-11 | t | $100.00 | 
 + 
 +Una de las variables de los archivos de InsideAirbnb es la de ''​availability_30'',​ ''​availability_60'',​ ''​availability_90''​ o ''​availability_365''​ que indican el número de noches que tiene cada anuncio disponibles en los próximos 30, 90 o 265 días. 
 + 
 + 
 +=== Análisis de anuncios con fechas disponibles === 
 + 
 +Datahippo archiva en su base de datos como "​revisado"​ (//​revised//​) cuando un anuncio es encontrado de nuevo al hacer una búsqueda. El //​scraping//​ está desarrollado haciendo una búsqueda para fechas lejanas (aproximadamente el año siguiente).  
 + 
 + 
 +==== Análisis de anuncios que siguen online ==== 
 + 
 +En base a un listado de id de listings (que puedes obtener de Insideairbnb o de la base de datos incremental de Datahippo) se puede hacer un //ping// a cada url de cada listing para ver cuales están activos. 
 + 
 + 
 +==== Análisis de reviews ====   
 + 
 +  * Listado con todos los //reviews// de un listado de //​listings//​. Está disponible en Insideairnb en el archivo ''​reviews.csv.gz''​. 
 +  * Última //review// (crítica o comentario que deja un usuario en el anuncio tras haber terminado su estancia) ​de cada //​listing//​. 
 + 
 +InsideAirbnb ofrece un archivo con todas las //reviews// de los //​listings//​ //​scrapeados//​. Podemos utilizar la fecha de la última //review// para definir cuándo un anuncio ha estado activo o analizar el total de //reviews// por periodo analizado. 
 + 
 +Datahippo solamente ofrece los id de los //listings scrapeados//​. Como el scrapeo no incluye la fecha del último review ​hace falta hacer un scraping ​a partir de los id de los listings de esa región. Este es el [[https://​github.com/​montera34/​airbnbeuskadi/​blob/​master/​scraping/​airbnb.lastreview.py|script de python]], para que funcione necesitas un archivo donde en cada línea haya un id de listing. ​El script podría hacer varias funciones: ver si el anuncio sigue online y capturar datos actualizados:​ últimas fechas de reviews (porque había varias reviews en portada y no siempre ordenadas cronológicamente),​ título, usuario, id, plazas, precio y número de reviews. 
  
 ===== 3. Qué herramientas uso para preparar los datos. Qué pasos debo seguir ===== ===== 3. Qué herramientas uso para preparar los datos. Qué pasos debo seguir =====
 +
 +==== Análisis de calendario ====
 +
 +==== Análisis de anuncios que siguen online ====
 +
 +==== Análisis de reviews ====
 +
 +Este script escrito en R, ''​review-analysis.R'',​ analiza los reviews de una localización para estudiar estacionalidad y evolución de uso en base a un archivo de //reviews// de Insideairbnb:​
 +https://​github.com/​montera34/​airbnbeuskadi/​blob/​master/​analisis/​review-analysis.R
 +
  
 ===== 4 Qué herramientas uso para producir la visualización. Qué pasos debo seguir ===== ===== 4 Qué herramientas uso para producir la visualización. Qué pasos debo seguir =====
  
-==== Visualización 1 ==== 
  
-Pasos a seguir para producir la visualización 1 y qué herramientas son necesarias.+==== Análisis de reviews ==== 
 + 
 +Puedes ver los resultados del script ''​review-analysis.R''​ aquí: https://​github.com/​montera34/​airbnbeuskadi/​tree/​master/​images/​airbnb/​reviews 
 + 
 +== Resultados == 
 + 
 +{{https://​raw.githubusercontent.com/​montera34/​airbnbeuskadi/​master/​images/​airbnb/​reviews/​airbnb-reviews-por-mes-stacked-donostia-2013-2016.png?​550}} 
 + 
 +{{https://​raw.githubusercontent.com/​montera34/​airbnbeuskadi/​master/​images/​airbnb/​reviews/​airbnb-reviews-mes-2011-2017.png?​550}}
  
 +{{https://​raw.githubusercontent.com/​montera34/​airbnbeuskadi/​master/​images/​airbnb/​reviews/​airbnb-reviews-puntos-donostia-2011-2017_1.png?​550}}
  
-== Resultado ==+{{https://​raw.githubusercontent.com/​montera34/​airbnbeuskadi/​master/​images/​airbnb/​reviews/​airbnb-reviews-puntos-donostia-2011-2017_2.png?​550}}
  
-Imagen de las diferentes visualizaciones y enlaces a la web en la que están publicadas.+{{https://​raw.githubusercontent.com/​montera34/​airbnbeuskadi/​master/​images/​airbnb/​reviews/​airbnb-reviews-mes-top4-marcado-2011-2017.png?​550}}
airbnb/pregunta/que-anuncios-estan-activos.1536658524.txt.gz · Última modificación: 2018/09/11 09:35 por numeroteca