Herramientas de usuario

Herramientas del sitio


airbnb:pregunta:nube-palabras-anuncios

¡Esta es una revisión vieja del documento!


¿Cómo se anuncian los pisos? Un análisis de las palabras usadas

Dificultad: MEDIA

METODOLOGÍA

Nube de palabras con timdream

  1. Seleccionar la columna NAME del listing pertinente
  2. Crear un fichero de texto con el texto copiado
  3. Seleccionar FILE y subir el fichero de texto
  4. Una vez generada la nube de palabras, pulsar sobre EDIT LIST y limpiar los datos (quitar palabras como “y”, “el”, “la”… o unir palabras con y sin tilde, etc.)
  5. Modificar el tema y la disposición de palabras al gusto

Porcentaje y número de palabras (R)

Si se desea ver numéricamente la frecuencia de las palabras, se puede usar el siguiente script de R:

avisos<- scan("INPUT.txt", what="character", sep="\n")`
avisos1 <- tolower(avisos)
avisos2 <- strsplit(avisos1, "\\W")
avisos3 <- unlist(avisos2)

freq<-table(avisos3)
freq1<-sort(freq, decreasing=TRUE)

percent<- round(100*(freq1/length(avisos)),3)
temple.sorted.table<-paste(names(freq1), freq1, percent, sep="\t")

cat("Word\tFREQ\tPERCENT", temple.sorted.table, file="OUTPUT.txt", sep="\n")
 

Aquí se verá la frecuencia absoluta de cada palabra y el porcentaje.

Número de palabras, bigramas y trigamas (Databasic.io)

Sube o copia-pega un archivo con todos los títulos de los anuncios (selecciona y copia esa columna en una hoja de cálculo) a la herramienta Wordcounter de Databasic.io

https://databasic.io/en/wordcounter

Número de palabras con línea de comandos

Resultado

Puedes ver un ejemplo en el informde de Efecto Airbnb Donostia (julio 2017) https://lab.montera34.com/airbnb/donostia/#palabras

airbnb/pregunta/nube-palabras-anuncios.1523970685.txt.gz · Última modificación: 2018/04/17 13:11 por numeroteca