En el siguiente post veremos cómo obtener capturas de pantalla de websites con Selenium. Selenium es una herramienta utilizada para automatizar la interacción con los navegadores.
Etiqueta: python
Webscraping en 6 líneas de código
Hace unos días leí un post sobre cómo realizar web scraping con 6 líneas de código para generar sentencias INSERT de SQL y de ese modo contar con información de prueba para algún proyecto personal. Este post se basa en aquel, pero con otros ejemplos.
Profiling con Python
Revisaremos el concepto de profiling, los módulos que podemos utilizar en python (profile, cprofile) asi como el uso de una interfaz gráfica (snakeviz) para ver los resultados.
Convertir un archivo CSV a SQLite con Python
Instrucciones para convertir un archivo CSV a un archivo SQLite. SQLite viene con su propia línea de comandos para realizar algunas tareas, entre ellas, la importación de archivos CSV.
Peewee: ORM para python - I
¿Qué es?
Peewee es un ORM para python. Incluye soporte para SQLite, MySQL, PostgreSQL y Cockroachdb.
¿Qué es un ORM?
Sus siglas significan Object-Relational mapping, o en español: Mapeo Objeto-relacional. Es una técnica que permite convertir entre los tipos de datos usados en los lenguajes de programación orientados a objetos y los tipos de datos de algun sistema de base de datos relacional.
Instalación
Se instala mediante pip.
pip install peewee
Para comprobar que se haya realizado la instalación, podemos …
Webscraping básico con Python - III
En esta ocasión, siguiendo el ejemplo del post anterior, realizaré la misma tarea pero utilizando Scrapy, un framework especializado en la tarea de realizar webscraping.
Nuestro objetivo es el mismo: descargar la lista de libros y precios de Books to scrape.
Requisitos
Necesitamos instalar scrapy:
pip install scrapy
Comenzando
Nuestro script, según el ejemplo de la documentación de scrapy, toma la siguiente forma:
::python
import scrapy
url = 'http://books.toscrape.com'
class BooksSpider(scrapy.Spider):
name = 'books'
start_urls = [
url,
]
def …