airbnb:pregunta:nube-palabras-anuncios
¡Esta es una revisión vieja del documento!
Tabla de Contenidos
¿Cómo se anuncian los pisos? Un análisis de las palabras usadas?
Dificultad: MEDIA
METODOLOGÍA
Nube de palabras con timdream
- Seleccionar la columna NAME del listing pertinente
- Crear un fichero de texto con el texto copiado
- Seleccionar FILE y subir el fichero de texto
- Una vez generada la nube de palabras, pulsar sobre EDIT LIST y limpiar los datos (quitar palabras como “y”, “el”, “la”… o unir palabras con y sin tilde, etc.)
- Modificar el tema y la disposición de palabras al gusto
Porcentaje y número de palabras (R)
Si se desea ver numéricamente la frecuencia de las palabras, se puede usar el siguiente script de R:
avisos<- scan("INPUT.txt", what="character", sep="\n")` avisos1 <- tolower(avisos) avisos2 <- strsplit(avisos1, "\\W") avisos3 <- unlist(avisos2) freq<-table(avisos3) freq1<-sort(freq, decreasing=TRUE) percent<- round(100*(freq1/length(avisos)),3) temple.sorted.table<-paste(names(freq1), freq1, percent, sep="\t") cat("Word\tFREQ\tPERCENT", temple.sorted.table, file="OUTPUT.txt", sep="\n")
Aquí se verá la frecuencia absoluta de cada palabra y el porcentaje.
Número de palabras, bigramas y trigamas (Databasic.io)
Sube o copia-pega un archivo con todos los títulos de los anuncios (selecciona y copia esa columna en una hoja de cálculo) a la herramienta Wordcounter de Databasic.io
Resultado
Puedes ver un ejemplo en el informde de Efecto Airbnb Donostia (julio 2017) https://lab.montera34.com/airbnb/donostia/#palabras
airbnb/pregunta/nube-palabras-anuncios.1523812328.txt.gz · Última modificación: 2018/04/15 19:12 por numeroteca