taller-web-scraping-hirikilabs
Diferencias
Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previa | ||
taller-web-scraping-hirikilabs [2018/02/06 16:44] – [Instalación de Python] numeroteca | taller-web-scraping-hirikilabs [2021/11/05 01:39] (actual) – se ha restaurado la vieja versión (2018/02/07 20:13) numeroteca | ||
---|---|---|---|
Línea 1: | Línea 1: | ||
====== Cómo liberar datos: taller de web scraping ====== | ====== Cómo liberar datos: taller de web scraping ====== | ||
+ | |||
+ | Esta es la página de documentación del taller "Cómo liberar datos: taller de scrapping" | ||
+ | |||
+ | |||
+ | ===== Proyectos desarrollados en el taller ===== | ||
+ | |||
+ | Estos son los proyectos desarrollados durante el segundo día del taller: | ||
+ | |||
+ | * [[taller-web-scraping-hirikilabs: | ||
+ | * [[taller-web-scraping-hirikilabs: | ||
+ | * [[taller-web-scraping-hirikilabs: | ||
+ | * [[taller-web-scraping-hirikilabs: | ||
+ | * [[taller-web-scraping-hirikilabs: | ||
+ | * [[taller-web-scraping-hirikilabs: | ||
+ | * [[taller-web-scraping-hirikilabs: | ||
===== Cosas a preparar al principio del taller ===== | ===== Cosas a preparar al principio del taller ===== | ||
Línea 11: | Línea 26: | ||
Si tienes la versión 2.7 también te vale. | Si tienes la versión 2.7 también te vale. | ||
- | Linux | + | === Linux === |
- Abre una terminal | - Abre una terminal | ||
Línea 19: | Línea 34: | ||
- Para hacer funcionar Python escribe " | - Para hacer funcionar Python escribe " | ||
- | Windows | + | === Windows |
- Descarga python pinchando en el siguiente enlace: https:// | - Descarga python pinchando en el siguiente enlace: https:// | ||
- Ejecuta el archivo descargado y sigue las instrucciones. | - Ejecuta el archivo descargado y sigue las instrucciones. | ||
- Si te da error, intenta seguir este tutorial: https:// | - Si te da error, intenta seguir este tutorial: https:// | ||
+ | - Instalar pip: https:// | ||
- | Mac | + | Una vez tienes Python y pip instalados tienes que instalar las librerías: |
+ | |||
+ | == Windows Vista == | ||
+ | |||
+ | Para que python funcione en Windows tenemos que añadirlo al " | ||
+ | |||
+ | Una vez abierto Python escribe "pip import" | ||
+ | |||
+ | Instalación de PIP. Añadir a PATH para que reconozca donde está PIP. Si no lo consigues Tienes que meter el full path: | ||
+ | |||
+ | C: | ||
+ | |||
+ | en vez de | ||
+ | |||
+ | pip install bs4 | ||
+ | |||
+ | == Windows 10 == | ||
+ | |||
+ | Para instalar un paquete: | ||
+ | |||
+ | py -m pip install bs4 | ||
+ | |||
+ | === Mac === | ||
- Descarga python pinchando en el siguiente enlace: https:// | - Descarga python pinchando en el siguiente enlace: https:// | ||
- Ejecuta el archivo descargado y sigue las instrucciones. | - Ejecuta el archivo descargado y sigue las instrucciones. | ||
+ | |||
+ | |||
+ | ==== Instalar librerías de Python ==== | ||
+ | |||
+ | Para instalar librerías o módulos de Python, que añaden funcionalidades adicionales, | ||
+ | |||
+ | pip install nombre-modulo | ||
+ | |||
+ | Para buscar paquetes: | ||
+ | |||
+ | pip search nombre | ||
+ | |||
+ | Para el taller es necesario instalar: | ||
+ | |||
+ | * Urllib: Hace peticiones HTTP | ||
+ | * BeautifulSoup: | ||
+ | * Json: Interpreta documentos (y respuestas) JSON | ||
+ | |||
+ | Es aconsejable instalar además: | ||
+ | |||
+ | * Selenium: Controlar un navegador web | ||
+ | * Scrapy: Framework preparado para scrapers | ||
+ | |||
Línea 34: | Línea 95: | ||
Instalar Postman | Instalar Postman | ||
- | |||
taller-web-scraping-hirikilabs.txt · Última modificación: 2021/11/05 01:39 por numeroteca