taller-web-scraping-hirikilabs
Diferencias
Muestra las diferencias entre dos versiones de la página.
| Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previa | ||
| taller-web-scraping-hirikilabs [2018/02/06 17:31] – [Instalación de Python] numeroteca | taller-web-scraping-hirikilabs [2021/11/05 01:39] (actual) – se ha restaurado la vieja versión (2018/02/07 20:13) numeroteca | ||
|---|---|---|---|
| Línea 1: | Línea 1: | ||
| ====== Cómo liberar datos: taller de web scraping ====== | ====== Cómo liberar datos: taller de web scraping ====== | ||
| + | |||
| + | Esta es la página de documentación del taller "Cómo liberar datos: taller de scrapping" | ||
| + | |||
| + | |||
| + | ===== Proyectos desarrollados en el taller ===== | ||
| + | |||
| + | Estos son los proyectos desarrollados durante el segundo día del taller: | ||
| + | |||
| + | * [[taller-web-scraping-hirikilabs: | ||
| + | * [[taller-web-scraping-hirikilabs: | ||
| + | * [[taller-web-scraping-hirikilabs: | ||
| + | * [[taller-web-scraping-hirikilabs: | ||
| + | * [[taller-web-scraping-hirikilabs: | ||
| + | * [[taller-web-scraping-hirikilabs: | ||
| + | * [[taller-web-scraping-hirikilabs: | ||
| ===== Cosas a preparar al principio del taller ===== | ===== Cosas a preparar al principio del taller ===== | ||
| Línea 25: | Línea 40: | ||
| - Si te da error, intenta seguir este tutorial: https:// | - Si te da error, intenta seguir este tutorial: https:// | ||
| - Instalar pip: https:// | - Instalar pip: https:// | ||
| + | |||
| + | Una vez tienes Python y pip instalados tienes que instalar las librerías: | ||
| == Windows Vista == | == Windows Vista == | ||
| Línea 32: | Línea 49: | ||
| Una vez abierto Python escribe "pip import" | Una vez abierto Python escribe "pip import" | ||
| - | Instalación de PIP. Añadir a PATH para que reconozca donde está PIP. Si no lo consigues Tienes que meter el | + | Instalación de PIP. Añadir a PATH para que reconozca donde está PIP. Si no lo consigues Tienes que meter el full path: |
| - | full path: C: | + | C: |
| + | |||
| + | en vez de | ||
| + | |||
| + | pip install bs4 | ||
| == Windows 10 == | == Windows 10 == | ||
| Línea 46: | Línea 67: | ||
| - Descarga python pinchando en el siguiente enlace: https:// | - Descarga python pinchando en el siguiente enlace: https:// | ||
| - Ejecuta el archivo descargado y sigue las instrucciones. | - Ejecuta el archivo descargado y sigue las instrucciones. | ||
| + | |||
| + | |||
| + | ==== Instalar librerías de Python ==== | ||
| + | |||
| + | Para instalar librerías o módulos de Python, que añaden funcionalidades adicionales, | ||
| + | |||
| + | pip install nombre-modulo | ||
| + | |||
| + | Para buscar paquetes: | ||
| + | |||
| + | pip search nombre | ||
| + | |||
| + | Para el taller es necesario instalar: | ||
| + | |||
| + | * Urllib: Hace peticiones HTTP | ||
| + | * BeautifulSoup: | ||
| + | * Json: Interpreta documentos (y respuestas) JSON | ||
| + | |||
| + | Es aconsejable instalar además: | ||
| + | |||
| + | * Selenium: Controlar un navegador web | ||
| + | * Scrapy: Framework preparado para scrapers | ||
| + | |||
| Línea 51: | Línea 95: | ||
| Instalar Postman | Instalar Postman | ||
| - | |||
taller-web-scraping-hirikilabs.1517934703.txt.gz · Última modificación: por numeroteca