taller-web-scraping-hirikilabs:meneame-titulares
Diferencias
Muestra las diferencias entre dos versiones de la página.
Próxima revisión | Revisión previaPróxima revisiónAmbos lados, revisión siguiente | ||
taller-web-scraping-hirikilabs:meneame-titulares [2018/02/07 01:32] – creado numeroteca | taller-web-scraping-hirikilabs:meneame-titulares [2018/02/07 01:40] – numeroteca | ||
---|---|---|---|
Línea 1: | Línea 1: | ||
+ | ======= Ejemplo de script para extraer varias variables de meneame.net ======= | ||
+ | |||
Código para extraer título de noticia, número de meneames y número de clicks de las 20 primeras páginas de meneame.net y guardarlo en un fichero .csv: | Código para extraer título de noticia, número de meneames y número de clicks de las 20 primeras páginas de meneame.net y guardarlo en un fichero .csv: | ||
Línea 32: | Línea 34: | ||
writer.writerow([title, | writer.writerow([title, | ||
+ | ===== Análisis de datos ===== | ||
Análisis del resultado con Databasic.io: | Análisis del resultado con Databasic.io: | ||
- | https:// | + | |
+ | * Palabras con más frecuencia, bigramas y trigramas: https:// | ||
+ | * Distribución de datos en columnas: |
taller-web-scraping-hirikilabs/meneame-titulares.txt · Última modificación: 2018/02/07 16:45 por numeroteca