Episodio 71 🐍⚙️
El impacto de NumFOCUS, versiones nuevas de Kedro-Viz, Fugue, y deepchecks, Markdown avanzado en JupyterLab, aplicaciones con PyScript, y la PyCon Latam en Mexico
💖 Como cada mes, tenemos el boletín de NumFOCUS con jugosas novedades, ¡recomiendo encarecidamente su lectura! Además, han publicado también su informe anual de impacto. Muy feliz de ver lo que han conseguido este año, y de haber podido contribuir nuestro granito de arena desde PyData Madrid.
🚀 Aparte de las versiones nuevas recogidas por NumFOCUS, esta semana hemos sacado Kedro-Viz 6.0, con previsualización de tablas, mejoras en el área de seguimiento de experimentos (experiment tracking), y más cosas. Y de paso, ¡nuevo blog!
Hablando de Kedro, el miércoles hacemos un evento online para hablar de las últimas novedades, así que si quieres saber más, es tu oportunidad. Habrá sesiones por la mañana y por la tarde hora española.
Cambiando de tercio, ayer se anunció Fugue 0.8.3, que a pesar de tener un número de versión poco sugerente, trae una novedad importante: compatibilidad con Polars. Como cuenta Kevin en su LinkedIn, “por ejemplo, un cluster Spark con 10 nodos puede correr funciones de Polars en cada nodo”. Ahora se puede usar FugueSQL con DuckDB y Polars.
Por último, recientemente han salido versiones nuevas de deepchecks (0.12 y 0.13), con nuevas funcionalidades para validar modelos de procesamiento del lenguaje natural, nuevos métodos para detectar deriva (data drift) con clases desbalanceadas, y mucho más. Las notas de versión son un poco inescrutables pero en su Slack se explayan más.
💡 Esta semana he descubierto jupyterlab-myst, un complemento para usar MyST (un dialecto de Markdown con la potencia de reStructuredText) directamente dentro de notebooks de Jupyter, incluyendo referencias cruzadas inteligentes, figuras numeradas, carteles, y mucho más.
También he descubierto Gradio, otra biblioteca Python para crear aplicaciones web para ciencia de datos de manera sencilla. El mes que viene la gente de Hugging Face va a hacer un sprint público para integrarlo con su plataforma.
📚 Anaconda ha anunciado PyScript, una nueva plataforma para programar con Python en el navegador utilizando… PyScript (la plataforma es punto com, y la biblioteca de código abierto es punto net, ojo). Más detalles en el LinkedIn de Anaconda.
Al crear una cuenta y un proyecto nuevo, esto es lo que se ve: un editor muy simple y funcionalidad para publicar los proyectos en una URL autogenerada. Todavía sin información de precios o limitaciones, habrá que estar atentos.
Me ha gustado este post de Greg Wilson en el que destaca una investigación que analiza la reproducibilidad de los notebooks desde el punto de vista de las dependencias: más del 90 % de los notebooks analizados no explica cuáles hacen falta. Al mismo tiempo, el equipo investigador creó un software para extraer dichas dependencias, llegando incluso a detectar qué versiones hacen falta.
El problema con el software es que no funciona muy bien, lamentablemente. Pude correrlo localmente tras algunos pequeños ajustes, eso sí. ¡El poder del código abierto!
💼 La gente maja de Kairós busca Data Engineer, con Python + SQL + Scala, 45 - 60 k€/año. ¡Espero que si envías tu candidatura les digas que vas de mi parte!
📣 ¡Está abierta la llamada a charlas de la PyCon Latam 2023! Será del 24 al 26 de agosto en Monterrey, Mexico.
¿Buscas proveedor de dominios y hosting bueno, bonito y barato para tu próximo proyecto? Llevo años con Dinahosting (enlace afiliado) y no me cambio por nada, el soporte 24 horas es 🔝, y son de Galicia 🇪🇸