Herramientas de usuario

Herramientas del sitio


airbnb:pregunta:que-anuncios-estan-activos

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anterior Revisión previa
Próxima revisión
Revisión previa
airbnb:pregunta:que-anuncios-estan-activos [2018/04/25 11:34]
numeroteca [2. Qué datos necesito y dónde los encuentro]
airbnb:pregunta:que-anuncios-estan-activos [2018/12/03 13:13]
numeroteca [1. Qué análisis o visualización responde a la pregunta]
Línea 7: Línea 7:
 ===== 1. Qué análisis o visualización responde a la pregunta ===== ===== 1. Qué análisis o visualización responde a la pregunta =====
  
-El análisis consiste ​en explorar ​en qué consiste ​un anuncio activo+Para responder a esta pregunta primero hay que definir qué es un **anuncio activo**.  
 + 
 +Lo ideal sería poder definir los anuncios que se han alquilado un cierto número de días al año o en un determinado periodo, esto es, poder definir los anuncios que han aceptado clientes recientemente por encima de una cantidad establecida. Como esos datos son difíciles de obtener podemos usar las siguientes alternativas en función de los datos disponibles. 
 + 
 +Un anuncio activo puede definirse por una combinación de variables:​ 
 +  * **El que ha recibido //​reviews// ​en un determinado periodo** [pasado]. No todos los anuncios que han tenido una reserva llegan a tener //review//, pero puede ser un buen indicador. 
 +  * **El que está visible ​en la web en determinado momento** [presente]. Quedarían fuera los que han sido dados de baja. 
 +  * **El que tiene fechas disponibles para ser alquilado** [futuro]. Habría que definir ​qué periodo de fechas. 
 + 
 +Como se indica en [[http://​insideairbnb.com/​about.html#​disclaimers|InsideAirbnb]] "​algunos anfitriones no mantienen sus calendarios actualizados o los tienen muy disponibles,​ incluso cuando viven en su propia casa/​apartamento"​ por lo tanto es preciso combinar este análisis asegurándose de que hayan sido reservados recientemente (han tenido una review en los últimos 6 meses) y frecuentemente (número de noches alquiladas por año mayor que el ¿límite/​umbral?​ para esa ciudad). 
 + 
 +Parece necesario entonces, para clasificar ​un anuncio ​como activo, combinar el análisis de una serie de variables.
  
 Visualización:​ Visualización:​
  
-  * Una barra en el que se representa el total de pisos y que parte de estos se consideran activos ​+  * Una barra en el que se representa el total de pisos e indica qué parte de éstos ​se consideran activos
 + 
 + 
 +==== Método: activos por mes ==== 
 + 
 +Para contar los activos en un determinado mes (la empresa Airdna lo hace así "An active rental is a property that has had at least one available day or property day in the previous month. Available day means the host had made the property available to rent", y tiene sentido, hay que delimitar el periodo que se quiere estudiar) podemos seleccionar los que cumplan alguna de las siguientes cosas: 
 +  * tengan fechas disponibles (que la  significa que la fecha de "​revised"​ en las bases de datos de datahippo.org sea de ese mes o anterior) 
 +  * haya tenido reserva en el mes anterior o en ese mismo (eso lo podemos saber por la fecha de las last review del [[https://​github.com/​montera34/​airbnbeuskadi/​blob/​09b6e3cc34a1510bcf74794326d62a3fe46f3074/​scraping/​airbnb.lastreview.py|scraping que hemos desarrollado]]) 
 + 
 +[[https://​github.com/​montera34/​airbnbeuskadi/​blob/​master/​analisis/​listings_activos_filter.R|Ver script en R]] para calcular los activos en un determinado mes. 
  
  
 ==== Referencias ==== ==== Referencias ====
  
-?+"Un 72% de los usuarios dejan comentarios"​ (datos de 2012): https://​www.quora.com/​What-percent-of-Airbnb-hosts-leave-reviews-for-their-guests. Fuente e hilo de Twitter: https://​twitter.com/​InsideAirbnb/​status/​988886252329095168 
 + 
 +Improving the Transparency of the Sharing (2017) Economy http://​mathias.lecuyer.me/​assets/​assets/​www2017airbnb.pdf
  
 ===== 2. Qué datos necesito y dónde los encuentro ===== ===== 2. Qué datos necesito y dónde los encuentro =====
  
-Para responder a esta pregunta hace falta+Los datos que hacen falta varían dependiendo ​de lo que vayamos a utilzar.
-  * Lista de //​listings//​ de una región/​ciudad. +
-  * Última //review// de cada listing.+
  
-El objetivo es poder analizar qué anuncios están activos, y por activos queremos indicar: anuncios que han aceptado clientes recientemente.+==== Análisis de calendario ====
  
-Más info sobre este tema: "Un 72% de los usuarios dejan comentarios" (datos de 2012): https://www.quora.com/What-percent-of-Airbnb-hosts-leave-reviews-for-their-guestsFuente e hilo de Twitter: ​https://twitter.com/InsideAirbnb/status/988886252329095168+Insidairbnb ofrece un archivo ''​%%calendar.csv.gz%%''​ donde se pueden consultar las fechas disponibles de un listing. 
 + 
 +Ejemplo de un archivo de calendar.csv de Insideairbnb,​ donde en cada línea se tiene el id, la fecha en que está disponible y el precio:  
 + 
 +^listing_id ^ date ^ available ^ price ^ 
 +| 11368 | 2019-08-13 | t | $100.00 | 
 +| 11368 | 2019-08-12 | t | $100.00 |  
 +| 11368 |2019-08-11 | t | $100.00 | 
 + 
 +Una de las variables ​de los archivos de InsideAirbnb es la de ''​availability_30'',​ ''​availability_60'',​ ''​availability_90''​ o ''​availability_365''​ que indican el número de noches que tiene cada anuncio disponibles en los próximos 30, 90 o 265 días. 
 + 
 + 
 +=== Análisis de anuncios con fechas disponibles === 
 + 
 +Datahippo archiva en su base de datos como "​revisado" (//​revised//​) cuando un anuncio es encontrado de nuevo al hacer una búsqueda. El //​scraping//​ está desarrollado haciendo una búsqueda para fechas lejanas (aproximadamente el año siguiente).  
 + 
 + 
 +==== Análisis de anuncios que siguen online ==== 
 + 
 +En base a un listado de id de listings (que puedes obtener de Insideairbnb o de la base de datos incremental ​de Datahippose puede hacer un //ping// a cada url de cada listing para ver cuales están activos. 
 + 
 + 
 +==== Análisis de reviews ====   
 + 
 +  * Listado con todos los //reviews// de un listado de //​listings//​Está disponible en Insideairnb en el archivo ''​reviews.csv.gz''​. 
 +  * Última //review// (crítica o comentario que deja un usuario en el anuncio tras haber terminado su estancia) de cada //​listing//​. 
 + 
 +InsideAirbnb ofrece un archivo con todas las //reviews// de los //​listings//​ //​scrapeados//​Podemos utilizar la fecha de la última //review// para definir cuándo un anuncio ha estado activo o analizar el total de //reviews// por periodo analizado. 
 + 
 +Datahippo solamente ofrece los id de los //listings scrapeados//​. Como el scrapeo no incluye la fecha del último review hace falta hacer un scraping a partir de los id de los listings de esa región. Este es el [[https://github.com/montera34/airbnbeuskadi/blob/​master/​scraping/​airbnb.lastreview.py|script de python]], para que funcione necesitas un archivo donde en cada línea haya un id de listing. El script podría hacer varias funciones: ver si el anuncio sigue online y capturar datos actualizados:​ últimas fechas de reviews (porque había varias reviews en portada y no siempre ordenadas cronológicamente),​ título, usuario, id, plazas, precio y número de reviews.
  
-Si el scrapeo no incluye la fecha del último review (crítica o comentario que deja un usuario en el anuncio tras haber terminado su estancia) hace falta hacer un scrpaming a partir de los id de los listings de esa región. Este es el [[https://​github.com/​montera34/​airbnbeuskadi/​blob/​master/​scraping/​airbnb.lastreview.py|script de python]], para que funcione necesitas un archivo donde se li 
  
 ===== 3. Qué herramientas uso para preparar los datos. Qué pasos debo seguir ===== ===== 3. Qué herramientas uso para preparar los datos. Qué pasos debo seguir =====
 +
 +==== Análisis de calendario ====
 +
 +==== Análisis de anuncios que siguen online ====
 +
 +==== Análisis de reviews ====
 +
 +Este script escrito en R, ''​review-analysis.R'',​ analiza los reviews de una localización para estudiar estacionalidad y evolución de uso en base a un archivo de //reviews// de Insideairbnb:​
 +https://​github.com/​montera34/​airbnbeuskadi/​blob/​master/​analisis/​review-analysis.R
 +
  
 ===== 4 Qué herramientas uso para producir la visualización. Qué pasos debo seguir ===== ===== 4 Qué herramientas uso para producir la visualización. Qué pasos debo seguir =====
  
-==== Visualización 1 ==== 
  
-Pasos a seguir para producir la visualización 1 y qué herramientas son necesarias.+==== Análisis de reviews ==== 
 + 
 +Puedes ver los resultados del script ''​review-analysis.R''​ aquí: https://​github.com/​montera34/​airbnbeuskadi/​tree/​master/​images/​airbnb/​reviews 
 + 
 +== Resultados == 
 + 
 +{{https://​raw.githubusercontent.com/​montera34/​airbnbeuskadi/​master/​images/​airbnb/​reviews/​airbnb-reviews-por-mes-stacked-donostia-2013-2016.png?​550}} 
 + 
 +{{https://​raw.githubusercontent.com/​montera34/​airbnbeuskadi/​master/​images/​airbnb/​reviews/​airbnb-reviews-mes-2011-2017.png?​550}}
  
 +{{https://​raw.githubusercontent.com/​montera34/​airbnbeuskadi/​master/​images/​airbnb/​reviews/​airbnb-reviews-puntos-donostia-2011-2017_1.png?​550}}
  
-== Resultado ==+{{https://​raw.githubusercontent.com/​montera34/​airbnbeuskadi/​master/​images/​airbnb/​reviews/​airbnb-reviews-puntos-donostia-2011-2017_2.png?​550}}
  
-Imagen de las diferentes visualizaciones y enlaces a la web en la que están publicadas.+{{https://​raw.githubusercontent.com/​montera34/​airbnbeuskadi/​master/​images/​airbnb/​reviews/​airbnb-reviews-mes-top4-marcado-2011-2017.png?​550}}
airbnb/pregunta/que-anuncios-estan-activos.txt · Última modificación: 2018/12/03 13:13 por numeroteca