Herramientas de usuario

Herramientas del sitio


taller-web-scraping-hirikilabs

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anteriorRevisión previa
Próxima revisión
Revisión previa
Próxima revisiónAmbos lados, revisión siguiente
taller-web-scraping-hirikilabs [2018/02/06 17:33] – [Instalación de Python] numerotecataller-web-scraping-hirikilabs [2018/02/07 20:13] – p numeroteca
Línea 1: Línea 1:
 ====== Cómo liberar datos: taller de web scraping ====== ====== Cómo liberar datos: taller de web scraping ======
 +
 +Esta es la página de documentación del taller "Cómo liberar datos: taller de scrapping" en Hirikilabs. Donostia/ San Sebastian. 6 y 7 de febrero de 2018. [[https://montera34.com/project/liberar-datos-scraping-hirikilabs/|Más información]].
 +
 +
 +===== Proyectos desarrollados en el taller ===== 
 +
 +Estos son los proyectos desarrollados durante el segundo día del taller:
 +
 +  * [[taller-web-scraping-hirikilabs:meneame-titulares|Extracción de títulos, menéames (votos) y clicks de meneame.net]].
 +  * [[taller-web-scraping-hirikilabs:descarga_sigpac_navarra|Descarga de los datos del SIGPAC de Navarra]]
 +  * [[taller-web-scraping-hirikilabs:jakdojade|Tiempos de recorridos en la web Jak Dojade]]
 +  * [[taller-web-scraping-hirikilabs:arte|Obras Museo del Prado]]
 +  * [[taller-web-scraping-hirikilabs:coches|Descarga de ofertas de coches.net]]
 +  * [[taller-web-scraping-hirikilabs:levantar-navegador-selenium|Empezar a trabajar con Selenium]]
 +  * [[taller-web-scraping-hirikilabs:napartheid|Descarga de imágenes del fanzine Napartheid]]
  
 ===== Cosas a preparar al principio del taller ===== ===== Cosas a preparar al principio del taller =====
Línea 52: Línea 67:
   - Descarga python pinchando en el siguiente enlace: https://www.python.org/ftp/python/3.6.4/python-3.6.4-macosx10.6.pkg   - Descarga python pinchando en el siguiente enlace: https://www.python.org/ftp/python/3.6.4/python-3.6.4-macosx10.6.pkg
   - Ejecuta el archivo descargado y sigue las instrucciones.   - Ejecuta el archivo descargado y sigue las instrucciones.
 +
 +
 +==== Instalar librerías de Python ====
 +
 +Para instalar librerías o módulos de Python, que añaden funcionalidades adicionales, se puede user pip desde la línea de comandos del sistema operativo, no desde la consola de Python:
 +
 +    pip install nombre-modulo
 +
 +Para buscar paquetes:
 +
 +    pip search nombre
 +
 +Para el taller es necesario instalar:
 +
 +  * Urllib: Hace peticiones HTTP
 +  * BeautifulSoup: Interpretar respuestas HTTP
 +  * Json: Interpreta documentos (y respuestas) JSON
 +
 +Es aconsejable instalar además:
 +
 +  * Selenium: Controlar un navegador web
 +  * Scrapy: Framework preparado para scrapers
 +
  
  
Línea 57: Línea 95:
  
 Instalar Postman Instalar Postman
- 
  
taller-web-scraping-hirikilabs.txt · Última modificación: 2021/11/05 01:39 por numeroteca