Herramientas de usuario

Herramientas del sitio


taller-web-scraping-hirikilabs

Diferencias

Muestra las diferencias entre dos versiones de la página.

Enlace a la vista de comparación

Ambos lados, revisión anteriorRevisión previa
Próxima revisión
Revisión previa
Próxima revisiónAmbos lados, revisión siguiente
taller-web-scraping-hirikilabs [2018/02/06 17:32] – [Instalación de Python] numerotecataller-web-scraping-hirikilabs [2018/02/07 20:13] – p numeroteca
Línea 1: Línea 1:
 ====== Cómo liberar datos: taller de web scraping ====== ====== Cómo liberar datos: taller de web scraping ======
 +
 +Esta es la página de documentación del taller "Cómo liberar datos: taller de scrapping" en Hirikilabs. Donostia/ San Sebastian. 6 y 7 de febrero de 2018. [[https://montera34.com/project/liberar-datos-scraping-hirikilabs/|Más información]].
 +
 +
 +===== Proyectos desarrollados en el taller ===== 
 +
 +Estos son los proyectos desarrollados durante el segundo día del taller:
 +
 +  * [[taller-web-scraping-hirikilabs:meneame-titulares|Extracción de títulos, menéames (votos) y clicks de meneame.net]].
 +  * [[taller-web-scraping-hirikilabs:descarga_sigpac_navarra|Descarga de los datos del SIGPAC de Navarra]]
 +  * [[taller-web-scraping-hirikilabs:jakdojade|Tiempos de recorridos en la web Jak Dojade]]
 +  * [[taller-web-scraping-hirikilabs:arte|Obras Museo del Prado]]
 +  * [[taller-web-scraping-hirikilabs:coches|Descarga de ofertas de coches.net]]
 +  * [[taller-web-scraping-hirikilabs:levantar-navegador-selenium|Empezar a trabajar con Selenium]]
 +  * [[taller-web-scraping-hirikilabs:napartheid|Descarga de imágenes del fanzine Napartheid]]
  
 ===== Cosas a preparar al principio del taller ===== ===== Cosas a preparar al principio del taller =====
Línea 25: Línea 40:
   - Si te da error, intenta seguir este tutorial: https://www.quora.com/How-do-I-install-Python-in-Windows-8-1   - Si te da error, intenta seguir este tutorial: https://www.quora.com/How-do-I-install-Python-in-Windows-8-1
   - Instalar pip: https://stackoverflow.com/questions/4750806/how-do-i-install-pip-on-windows#12476379   - Instalar pip: https://stackoverflow.com/questions/4750806/how-do-i-install-pip-on-windows#12476379
 +
 +Una vez tienes Python y pip instalados tienes que instalar las librerías:
  
 == Windows Vista == == Windows Vista ==
Línea 50: Línea 67:
   - Descarga python pinchando en el siguiente enlace: https://www.python.org/ftp/python/3.6.4/python-3.6.4-macosx10.6.pkg   - Descarga python pinchando en el siguiente enlace: https://www.python.org/ftp/python/3.6.4/python-3.6.4-macosx10.6.pkg
   - Ejecuta el archivo descargado y sigue las instrucciones.   - Ejecuta el archivo descargado y sigue las instrucciones.
 +
 +
 +==== Instalar librerías de Python ====
 +
 +Para instalar librerías o módulos de Python, que añaden funcionalidades adicionales, se puede user pip desde la línea de comandos del sistema operativo, no desde la consola de Python:
 +
 +    pip install nombre-modulo
 +
 +Para buscar paquetes:
 +
 +    pip search nombre
 +
 +Para el taller es necesario instalar:
 +
 +  * Urllib: Hace peticiones HTTP
 +  * BeautifulSoup: Interpretar respuestas HTTP
 +  * Json: Interpreta documentos (y respuestas) JSON
 +
 +Es aconsejable instalar además:
 +
 +  * Selenium: Controlar un navegador web
 +  * Scrapy: Framework preparado para scrapers
 +
  
  
Línea 55: Línea 95:
  
 Instalar Postman Instalar Postman
- 
  
taller-web-scraping-hirikilabs.txt · Última modificación: 2021/11/05 01:39 por numeroteca