Episodio 59 🐍⚙️🎄 Despedida 2022
Nueva esperadísima versión de Shapely, versiones nuevas de conda y Polars, simulación basada en agentes con Python, mejoras notables de rendimiento en Python 3.11, ¡y nos vemos en 2023!
🔥 ¡Por fin tenemos Shapely 2.0! Shapely es una biblioteca Python para manipulación de geometrías bidimensionales. Está basada en el paquete GEOS, y ha sufrido una enorme transformación que lleva fraguándose varios años y que resuelve varios problemas - entre ellos, la imposibilidad de instalar Cartopy y Shapely con pip en el mismo entorno virtual. Este problema se identificó hace más de 6 años, y fruto de un largo proceso desgranado y dirigido por Joris Van den Bossche, toda la arquitectura interna ha cambiado y el programa es ahora mucho más rápido.
Recomiendo encarecidamente consultar las diapositivas de la charla de Joris en el FOSS4G el año pasado. En ellas también se explica cómo Shapely, Fiona, y pyproj son la base de GeoPandas.
🚀 ¡Y no terminan aquí las versiones nuevas! conda 22.11.1 trae jugosas novedades, principalmente que el nuevo algoritmo basado en mamba deja de ser experimental, las descargas ocurren en paralelo (¡aleluya!) y ahora el proyecto tiene una arquitectura de plugins. Si bien hace tiempo que me he casado con micromamba, esto son excelentes noticias para la gente que utiliza la distribución de Anaconda, que tendrá una experiencia por defecto mucho más placentera.
Seguimos teniendo frecuentes versiones nuevas de Polars: en las últimas semanas han incluido un nuevo método DataFrame.glimpse()
(parecida a la del paquete tibble de R), soporte para Lakehouses (la fusión de Data Lakes y Warehouses) basados en el framework abierto Delta Lake, y mucho más. Y por si fuera poco, ¿parece que dask-polars se acerca cada vez más?
💡 Esta semana he descubierto Mesa, un framework de Python para simulación basada en agentes. Me encantaría aprender más sobre esto para simular sistemas de incentivos, dinámicas en redes sociales, grafos de confianza…
También he descubierto DrWhy, una colección de herramientas para explicabilidad en inteligencia artificial.
📚 Me ha gustado mucho este artículo sobre cómo crear un data lake localmente usando Dagster para orquestación, Parquet para la serialización, y DuckDB para las transformaciones.
Y por otro lado, ¡feliz de ver que Python 3.11 va como una bala comparado con la versión anterior!
🎄 Se acerca el fin de año y, como tal vez ya hayas leído en mi LinkedIn, estoy de vacaciones porque he dejado mi anterior trabajo. Tengo una lista enorme de cosas que quiero hacer y se me van las horas tomando notas, escribiendo, leyendo, aprendiendo… ¡Así que también voy a descansar de noticiero! Esta es la última edición del año, así que aquí van los mejores enlaces de todo el material que tenía en la reserva:
Se acercan JupyterLab 4.0 y otras esperadísimas versiones nuevas, pero de momento hago borrón de enlaces acumulados y pauso el noticiero por un par de semanas. ¡Pasa unas felices fiestas y nos leemos en 2023! 🍇