Herramientas de usuario

Herramientas del sitio


airbnb:pregunta:que-anuncios-estan-activos

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anteriorRevisión previa
Próxima revisión
Revisión previa
airbnb:pregunta:que-anuncios-estan-activos [2018/09/11 12:20] – [Análisis de calendario] numerotecaairbnb:pregunta:que-anuncios-estan-activos [2018/12/03 14:13] (actual) – [1. Qué análisis o visualización responde a la pregunta] numeroteca
Línea 7: Línea 7:
 ===== 1. Qué análisis o visualización responde a la pregunta ===== ===== 1. Qué análisis o visualización responde a la pregunta =====
  
-Para responder a esta pregunta primero hay que definir qué es un **anuncio activo**. Lo ideal sería poder definir los anuncios que se han alquilado un cierto número de días al año o en un determinado periodo, esto es, poder definir los anuncios que han aceptado clientes recientemente. Como esos datos son difíciles de obtener podemos usar las siguientes alternativas en función de los datos disponibles.+Para responder a esta pregunta primero hay que definir qué es un **anuncio activo**. 
  
-Un anuncio activo podría estar definido por:+Lo ideal sería poder definir los anuncios que se han alquilado un cierto número de días al año o en un determinado periodo, esto es, poder definir los anuncios que han aceptado clientes recientemente por encima de una cantidad establecida. Como esos datos son difíciles de obtener podemos usar las siguientes alternativas en función de los datos disponibles.
  
-  * **El que está visible en la web en determinado momento**. Quedarían fuera los que han sido datos de baja. +Un anuncio activo puede definirse por una combinación de variables: 
-  * **El que tiene fechas disponibles para ser alquilado**. Habría que definir qué periodo de fechas. +  * **El que ha recibido //reviews// en un determinado periodo** [pasado]. No todos los anuncios que han tenido una reserva llegan a tener //review//, pero puede ser un buen indicador. 
-  * **El que ha recibido //reviews// en un determinado periodo**No todos los anuncios que han tenido una reserva llegan a tener //review//pero puede ser un buen indicador.+  * **El que está visible en la web en determinado momento** [presente]. Quedarían fuera los que han sido dados de baja. 
 +  * **El que tiene fechas disponibles para ser alquilado** [futuro]. Habría que definir qué periodo de fechas. 
 + 
 +Como se indica en [[http://insideairbnb.com/about.html#disclaimers|InsideAirbnb]] "algunos anfitriones no mantienen sus calendarios actualizados o los tienen muy disponibles, incluso cuando viven en su propia casa/apartamento" por lo tanto es preciso combinar este análisis asegurándose de que hayan sido reservados recientemente (han tenido una review en los últimos 6 meses) y frecuentemente (número de noches alquiladas por año mayor que el ¿límite/umbral? para esa ciudad). 
 + 
 +Parece necesario entoncespara clasificar un anuncio como activo, combinar el análisis de una serie de variables.
  
 Visualización: Visualización:
  
   * Una barra en el que se representa el total de pisos e indica qué parte de éstos se consideran activos.   * Una barra en el que se representa el total de pisos e indica qué parte de éstos se consideran activos.
 +
 +
 +==== Método: activos por mes ====
 +
 +Para contar los activos en un determinado mes (la empresa Airdna lo hace así "An active rental is a property that has had at least one available day or property day in the previous month. Available day means the host had made the property available to rent", y tiene sentido, hay que delimitar el periodo que se quiere estudiar) podemos seleccionar los que cumplan alguna de las siguientes cosas:
 +  * tengan fechas disponibles (que la  significa que la fecha de "revised" en las bases de datos de datahippo.org sea de ese mes o anterior)
 +  * haya tenido reserva en el mes anterior o en ese mismo (eso lo podemos saber por la fecha de las last review del [[https://github.com/montera34/airbnbeuskadi/blob/09b6e3cc34a1510bcf74794326d62a3fe46f3074/scraping/airbnb.lastreview.py|scraping que hemos desarrollado]])
 +
 +[[https://github.com/montera34/airbnbeuskadi/blob/master/analisis/listings_activos_filter.R|Ver script en R]] para calcular los activos en un determinado mes.
 +
  
  
Línea 41: Línea 56:
 | 11368 |2019-08-11 | t | $100.00 | | 11368 |2019-08-11 | t | $100.00 |
  
 +Una de las variables de los archivos de InsideAirbnb es la de ''availability_30'', ''availability_60'', ''availability_90'' o ''availability_365'' que indican el número de noches que tiene cada anuncio disponibles en los próximos 30, 90 o 265 días.
  
-==== Análisis de anuncios que siguen online ==== 
  
-En base a un listado de id de listings (que puedes obtener de Insideairbnb o de la base de datos incremental de Datahippo) se puede hacer un //ping// a cada url de cada listing para ver cuales están activos.+=== Análisis de anuncios con fechas disponibles ===
  
 +Datahippo archiva en su base de datos como "revisado" (//revised//) cuando un anuncio es encontrado de nuevo al hacer una búsqueda. El //scraping// está desarrollado haciendo una búsqueda para fechas lejanas (aproximadamente el año siguiente). 
  
-==== Análisis de anuncios con fechas disponibles ==== 
  
-Datahippo archiva en su base de datos como "revisado" (//revised//) cuando un anuncio es encontrado de nuevo al hacer una búsqueda. El //scraping// está desarrollado haciendo una búsqueda para fechas lejanas (aproximadamente el año siguiente). +==== Análisis de anuncios que siguen online ====
  
-==== Análisis de reviews ====  +En base a un listado de id de listings (que puedes obtener de Insideairbnb o de la base de datos incremental de Datahippo) se puede hacer un //ping// a cada url de cada listing para ver cuales están activos.
  
  
-  * Lista de //listings// de una región/ciudad. +==== Análisis de reviews ====   
-  * Lista de los //listings// que están disponibles.+ 
 +  * Listado con todos los //reviews// de un listado de //listings//. Está disponible en Insideairnb en el archivo ''reviews.csv.gz''.
   * Última //review// (crítica o comentario que deja un usuario en el anuncio tras haber terminado su estancia) de cada //listing//.   * Última //review// (crítica o comentario que deja un usuario en el anuncio tras haber terminado su estancia) de cada //listing//.
  
-InsideAirbnb ofrece un archivo con todas las //reviews// de los //listings// //scrapeados//. Podemos utilizar la fecha de la última //review// para definir cuándo un anuncio ha estado activo.+InsideAirbnb ofrece un archivo con todas las //reviews// de los //listings// //scrapeados//. Podemos utilizar la fecha de la última //review// para definir cuándo un anuncio ha estado activo o analizar el total de //reviews// por periodo analizado.
  
-Datahippo solamente ofrece los id de los //listings scrapeados//+Datahippo solamente ofrece los id de los //listings scrapeados//. Como el scrapeo no incluye la fecha del último review hace falta hacer un scraping a partir de los id de los listings de esa región. Este es el [[https://github.com/montera34/airbnbeuskadi/blob/master/scraping/airbnb.lastreview.py|script de python]], para que funcione necesitas un archivo donde en cada línea haya un id de listing. El script podría hacer varias funciones: ver si el anuncio sigue online y capturar datos actualizados: últimas fechas de reviews (porque había varias reviews en portada y no siempre ordenadas cronológicamente), título, usuario, id, plazas, precio y número de reviews.
  
-Si el scrapeo no incluye la fecha del último review hace falta hacer un scraping a partir de los id de los listings de esa región. Este es el [[https://github.com/montera34/airbnbeuskadi/blob/master/scraping/airbnb.lastreview.py|script de python]], para que funcione necesitas un archivo donde en cada línea haya un id de listing. 
  
 +===== 3. Qué herramientas uso para preparar los datos. Qué pasos debo seguir =====
  
-El script podría hacer varias funciones: ver si el anuncio sigue online y capturar datos actualizados: últimas fechas de reviews (porque había varias reviews en portada y no siempre ordenadas cronológicamente), título, usuario, id, plazas, precio y número de reviews.+==== Análisis de calendario ====
  
 +==== Análisis de anuncios que siguen online ====
 +
 +==== Análisis de reviews ====
 +
 +Este script escrito en R, ''review-analysis.R'', analiza los reviews de una localización para estudiar estacionalidad y evolución de uso en base a un archivo de //reviews// de Insideairbnb:
 +https://github.com/montera34/airbnbeuskadi/blob/master/analisis/review-analysis.R
  
-===== 3. Qué herramientas uso para preparar los datos. Qué pasos debo seguir ===== 
  
 ===== 4 Qué herramientas uso para producir la visualización. Qué pasos debo seguir ===== ===== 4 Qué herramientas uso para producir la visualización. Qué pasos debo seguir =====
  
-==== Visualización 1 ==== 
  
-Pasos a seguir para producir la visualización 1 y qué herramientas son necesarias.+==== Análisis de reviews ==== 
 + 
 +Puedes ver los resultados del script ''review-analysis.R'' aquí: https://github.com/montera34/airbnbeuskadi/tree/master/images/airbnb/reviews 
 + 
 +== Resultados == 
 + 
 +{{https://raw.githubusercontent.com/montera34/airbnbeuskadi/master/images/airbnb/reviews/airbnb-reviews-por-mes-stacked-donostia-2013-2016.png?550}} 
 + 
 +{{https://raw.githubusercontent.com/montera34/airbnbeuskadi/master/images/airbnb/reviews/airbnb-reviews-mes-2011-2017.png?550}}
  
 +{{https://raw.githubusercontent.com/montera34/airbnbeuskadi/master/images/airbnb/reviews/airbnb-reviews-puntos-donostia-2011-2017_1.png?550}}
  
-== Resultado ==+{{https://raw.githubusercontent.com/montera34/airbnbeuskadi/master/images/airbnb/reviews/airbnb-reviews-puntos-donostia-2011-2017_2.png?550}}
  
-Imagen de las diferentes visualizaciones y enlaces a la web en la que están publicadas.+{{https://raw.githubusercontent.com/montera34/airbnbeuskadi/master/images/airbnb/reviews/airbnb-reviews-mes-top4-marcado-2011-2017.png?550}}
airbnb/pregunta/que-anuncios-estan-activos.txt · Última modificación: 2018/12/03 14:13 por numeroteca