Recent Posts

Tutorial - Automatizando la descarga de una lista de links con Scrapy

Tutorial - Automatizando la descarga de una lista de links con Scrapy Automatizar las tareas de descargas es un tarea muy común que nos encontraremos tanto en el trabajo como en nuestra vida. En esta ocasión quiero enseñarlos como utilizar Scrapy para descargar automaticamente una lista de Libros en PDF de un artículo en Medium: Springer has released 65 Machine Learning and Data books for free. En todo proyecto de Scraping, es importante primero analizar como está estructurada la data y como puedo accedarla programaticamente y así planificar nuestro desarrollo.

El ToolBox del Data Scientist - Parte I

El ToolBox del Data Scientist - Parte I Durante mi regreso en el bus que me lleva desde la escuela de mis hijas hasta casa siempre se me ocurren cosas que quiero hacer, ideas relacionadas con un proyecto de DataScience o Machine Learning por ejemplo. Cosas super cool e interesantes, pero siempre me tropiezo con un pequeño problema, pero que no es tan pequeño para cuando DataScience se trata: La disponibilidad de los Datos.

Web Scraping con Scrapy Framework y Jupyter

Usando Scrapy Framework dentro de Jupyter Notebooks En el mundo del Data Science y de los proyectos de Web Development es cada vez más común e incluso necesario tener habilidades y conocimiento al menos básicos de Web Scraping. Scrapy Framework se ha convertido en uno de los frameworks basados en Python más poderoso, versatil y usado para la creación de spiders. Su arquitectura basada en Pipelines, Schedulers, Spiders y Downloaders permite al desarrollador tener un impresionante control sobre todo el proceso de Scraping.

Desplegando MongoDB en un Docker Container en menos de 10 minutos

Ya he hablado anteriormente de que es Docker y sus bondades tanto para las empresas como para los desarrolladores. En esta ocasión quiero compartir este tutorial que nos permitirá desplegar MondoDB como un contenedor. Interectuaremos con la consola de Cliente específicamente. MongoDB es una de las bases de datos NoSQL, orientada a documentos, más populares de hoy en día. MongoDB se caracteriza por ser OpenSource y por estar orientada a priorizar la alta disponibilidad y la alta consistencia del Teorema CAP.

¿Qué es Docker?

Guía rápida para entender qué es Docker De acuerdo a Wikipedia, Docker es: Un proyecto de código abierto capaz de automatizar el despliegue de aplicaciones dentro de contenedores de software, proporcionándonos así una capa adicional de abstracción y automatización en el nivel de virtualización de sistema operativo sobre Linux. Pero la verdad es que a Docker lo podemos definir desde dos perspectivas diferentes: Para los desarrolladores Docker viene a resolver el típico problema del "trabaja en mi máquina" pero cuando el proyecto es desplegado en producción todo falla.