taller-web-scraping-hirikilabs
Diferencias
Muestra las diferencias entre dos versiones de la página.
Ambos lados, revisión anteriorRevisión previaPróxima revisión | Revisión previaÚltima revisiónAmbos lados, revisión siguiente | ||
taller-web-scraping-hirikilabs [2018/02/07 19:19] – [Proyectos de scraping] iperugorria | taller-web-scraping-hirikilabs [2019/07/18 14:59] – rukki123 | ||
---|---|---|---|
Línea 1: | Línea 1: | ||
- | ====== Cómo liberar datos: taller de web scraping ====== | + | The Service Desk Technicians enlarge technical help to all inner IT and non-IT employees as well as customers going through issues related to hardware, software, and networking. They are responsible for troubleshooting problems confronted by means of the give up-customers of PCs, laptops, and cell telephones by way of identifying troubles and studying them. |
- | ===== Cosas a preparar al principio del taller ===== | + | Technicians obtain trouble tickets raised via users via emails, phones or in-person, as they' |
- | Descargarse el repositorio de ejercicios: [[https://github.com/Saigesp/scraping-workshop|scrapers para los ejercicios prácticos]] | + | Know More:- [[https://www.fieldengineer.com/skills/service-desk-technician|Service Desk Technician]] |
- | Descargarse la presentación [[https:// | ||
- | |||
- | ==== Instalación de Python ==== | ||
- | |||
- | Si tienes la versión 2.7 también te vale. | ||
- | |||
- | === Linux === | ||
- | |||
- | - Abre una terminal | ||
- | - Comprueba si ya tienes instalado python tecleando: python3 --version | ||
- | - Si no lo tienes instalado o la versión es anterior a la 3.5 teclea: sudo apt-get install python3.5 | ||
- | - Si tu distribución de Linux no dispone de la versión 3.5, instala la última versión disponible: sudo apt-get install python3 | ||
- | - Para hacer funcionar Python escribe " | ||
- | |||
- | === Windows === | ||
- | |||
- | - Descarga python pinchando en el siguiente enlace: https:// | ||
- | - Ejecuta el archivo descargado y sigue las instrucciones. | ||
- | - Si te da error, intenta seguir este tutorial: https:// | ||
- | - Instalar pip: https:// | ||
- | |||
- | Una vez tienes Python y pip instalados tienes que instalar las librerías: | ||
- | |||
- | == Windows Vista == | ||
- | |||
- | Para que python funcione en Windows tenemos que añadirlo al " | ||
- | |||
- | Una vez abierto Python escribe "pip import" | ||
- | |||
- | Instalación de PIP. Añadir a PATH para que reconozca donde está PIP. Si no lo consigues Tienes que meter el full path: | ||
- | |||
- | C: | ||
- | |||
- | en vez de | ||
- | |||
- | pip install bs4 | ||
- | |||
- | == Windows 10 == | ||
- | |||
- | Para instalar un paquete: | ||
- | |||
- | py -m pip install bs4 | ||
- | |||
- | === Mac === | ||
- | |||
- | - Descarga python pinchando en el siguiente enlace: https:// | ||
- | - Ejecuta el archivo descargado y sigue las instrucciones. | ||
- | |||
- | |||
- | ==== Instalar librerías de Python ==== | ||
- | |||
- | Para instalar librerías o módulos de Python, que añaden funcionalidades adicionales, | ||
- | |||
- | pip install nombre-modulo | ||
- | |||
- | Para buscar paquetes: | ||
- | |||
- | pip search nombre | ||
- | |||
- | Para el taller es necesario instalar: | ||
- | |||
- | * Urllib: Hace peticiones HTTP | ||
- | * BeautifulSoup: | ||
- | * Json: Interpreta documentos (y respuestas) JSON | ||
- | |||
- | Es aconsejable instalar además: | ||
- | |||
- | * Selenium: Controlar un navegador web | ||
- | * Scrapy: Framework preparado para scrapers | ||
- | |||
- | |||
- | |||
- | ==== Opcional ==== | ||
- | |||
- | Instalar Postman | ||
- | |||
- | |||
- | |||
- | ==== Proyectos de scraping ==== | ||
- | |||
- | * [[taller-web-scraping-hirikilabs: | ||
- | * [[taller-web-scraping-hirikilabs: | ||
- | * [[taller-web-scraping-hirikilabs: | ||
- | * [[taller-web-scraping-hirikilabs: | ||
- | * [[taller-web-scraping-hirikilabs: | ||
- | * [[taller-web-scraping-hirikilabs: | ||
- | * [[taller-web-scraping-hirikilabs: |
taller-web-scraping-hirikilabs.txt · Última modificación: 2021/11/05 01:39 por numeroteca