Librerías pendientes de probar:

Data Workflow with Python

Librerias de AutoML para Python

  • MLFlow: herramienta perfecta la realización de experimentos con ML pipelines en la fase de desarrollo. También permite encapsular pipelines con modelos entrenados para su uso en la implementación de software operativo, incluso en servidor. La mala noticia es que está en fase alpha por lo esta el uso de última funcionalidad mencionada sería cuestionable.
  • Featuretools: librería que permite cierta automatización del proceso de features engineering.
  • FEDOT: It is an open-source framework for automated modeling and machine learning (AutoML).

Machine Learning tools

  • mlxtend: Librería de herramientas útiles para el día a día en tareas de ciencia de datos desarrolladas por Sebastian Raschka.

  • Shogun: It is and open-source machine learning library that offers a wide range of efficient and unified machine learning methods. Sus puntos fuertes son su buen performance, facilidad de uso y sobretodo ser multiplaforma (Python, R, Java/Scala, etc) y pasar de uno a otro de manera muy sencilla.

  • OPTUNA: An open source hyperparameter optimization framework to automate hyperparameter search.

Timeseries

  • PyFlux: It is an open source library in Python explicitly built for working with time series problems. The library has an excellent array of modern time series models including but not limited to ARIMA, GARCH and VAR models. In short, PyFlux offers a probabilistic approach to time series modelling.

  • Darts: It is a Python library for easy manipulation and forecasting of time series.

  • tslearn: The machine learning toolkit for time series analysis in Python.

  • sktime: A unified framework for machine learning with time series.

Data Analysis tools

  • Comparison of F-test and mutual information
  • statistics: Es una libreria ademas de calcular medias de centralidad y varianza de un sample, tambien lo hace estima la de la poblacion. Ademas, aporta nuevos tipos de datos como fracciones y regresion lineal entre dos variables muy facil de usar.

Auto-EDA tools

  • Mito: Es un spreadsheet que proporciona a traves de un iPython Notebook una interfaz grafica para echar un vistazo a datos de manera sencilla.

Machine Learning evaluation

  • ELI5: It is a Python package which helps to debug machine learning classifiers and explain their predictions.

Code quality and debuging

ML/DS projects control versions

  • DagsHub: Es un GitHub pero especialmente diseñado para proyectos ML. Mediante DVC y otras herramientas resuelve los problemas de git con notebooks, modelos pre-entrenados en ficheros binarios, pipelines, etc.

  • DVC: Open-source Version Control System for Machine Learning Projects.

IDEs

Other projects

  • ObsPy: It is an open-source project dedicated to provide a Python framework for processing seismological data.

  • The Altorithms: Hello, algorithms!: Welcome to GitHub’s largest open-source algorithm library.


Table of contents