Herramientas de usuario

Herramientas del sitio


airbnb:pregunta:que-anuncios-estan-activos

¡Esta es una revisión vieja del documento!


¿Qué anuncios están activos en Airbnb?

Equipo

Montera34

1. Qué análisis o visualización responde a la pregunta

Para responder a esta pregunta primero hay que definir qué es un anuncio activo. Lo ideal sería poder definir los anuncios que se han alquilado un cierto número de días al año o en un determinado periodo, esto es, poder definir los anuncios que han aceptado clientes recientemente por encima de una cantidad establecida. Como esos datos son difíciles de obtener podemos usar las siguientes alternativas en función de los datos disponibles.

Un anuncio activo puede definirse por una combinación de variables:

  • El que ha recibido reviews en un determinado periodo [pasado]. No todos los anuncios que han tenido una reserva llegan a tener review, pero puede ser un buen indicador.
  • El que está visible en la web en determinado momento [presente]. Quedarían fuera los que han sido datos de baja.
  • El que tiene fechas disponibles para ser alquilado [futuro]. Habría que definir qué periodo de fechas.

Como se indica en InsideAirbnb “algunos anfitriones no mantienen sus calendarios actualizados o los tienen muy disponibles, incluso cuando viven en su propia casa/apartamento” por lo tanto es preciso combinar este análisis asegurándose de que hayan sido reservados recientemente (han tenido una review en los últimos 6 meses) y frecuentemente (número de noches alquiladas por año mayor que el ¿límite/umbral? para esa ciudad).

Parece necesario entonces, para clasificar un anuncio como activo, combinar el análisis de una serie de variables.

Visualización:

  • Una barra en el que se representa el total de pisos e indica qué parte de éstos se consideran activos.

Referencias

“Un 72% de los usuarios dejan comentarios” (datos de 2012): https://www.quora.com/What-percent-of-Airbnb-hosts-leave-reviews-for-their-guests. Fuente e hilo de Twitter: https://twitter.com/InsideAirbnb/status/988886252329095168

Improving the Transparency of the Sharing (2017) Economy http://mathias.lecuyer.me/assets/assets/www2017airbnb.pdf

2. Qué datos necesito y dónde los encuentro

Los datos que hacen falta varían dependiendo de lo que vayamos a utilzar.

Análisis de calendario

Insidairbnb ofrece un archivo calendar.csv.gz donde se pueden consultar las fechas disponibles de un listing.

Ejemplo de un archivo de calendar.csv de Insideairbnb, donde en cada línea se tiene el id, la fecha en que está disponible y el precio:

listing_id date available price
11368 2019-08-13 t $100.00
11368 2019-08-12 t $100.00
11368 2019-08-11 t $100.00

Una de las variables de los archivos de InsideAirbnb es la de availability_30, availability_60, availability_90 o availability_365 que indican el número de noches que tiene cada anuncio disponibles en los próximos 30, 90 o 265 días.

Análisis de anuncios con fechas disponibles

Datahippo archiva en su base de datos como “revisado” (revised) cuando un anuncio es encontrado de nuevo al hacer una búsqueda. El scraping está desarrollado haciendo una búsqueda para fechas lejanas (aproximadamente el año siguiente).

Análisis de anuncios que siguen online

En base a un listado de id de listings (que puedes obtener de Insideairbnb o de la base de datos incremental de Datahippo) se puede hacer un ping a cada url de cada listing para ver cuales están activos.

Análisis de reviews

  • Listado con todos los reviews de un listado de listings. Está disponible en Insideairnb en el archivo reviews.csv.gz.
  • Última review (crítica o comentario que deja un usuario en el anuncio tras haber terminado su estancia) de cada listing.

InsideAirbnb ofrece un archivo con todas las reviews de los listings scrapeados. Podemos utilizar la fecha de la última review para definir cuándo un anuncio ha estado activo o analizar el total de reviews por periodo analizado.

Datahippo solamente ofrece los id de los listings scrapeados. Como el scrapeo no incluye la fecha del último review hace falta hacer un scraping a partir de los id de los listings de esa región. Este es el script de python, para que funcione necesitas un archivo donde en cada línea haya un id de listing. El script podría hacer varias funciones: ver si el anuncio sigue online y capturar datos actualizados: últimas fechas de reviews (porque había varias reviews en portada y no siempre ordenadas cronológicamente), título, usuario, id, plazas, precio y número de reviews.

3. Qué herramientas uso para preparar los datos. Qué pasos debo seguir

Análisis de calendario

Análisis de anuncios que siguen online

Análisis de reviews

Este script escrito en R, review-analysis.R, analiza los reviews de una localización para estudiar estacionalidad y evolución de uso en base a un archivo de reviews de Insideairbnb: https://github.com/montera34/airbnbeuskadi/blob/master/analisis/review-analysis.R

4 Qué herramientas uso para producir la visualización. Qué pasos debo seguir

Análisis de reviews

Puedes ver los resultados del script review-analysis.R aquí: https://github.com/montera34/airbnbeuskadi/tree/master/images/airbnb/reviews

Resultados

airbnb/pregunta/que-anuncios-estan-activos.1541538048.txt.gz · Última modificación: 2018/11/06 21:00 por skotperez