Docker est devenu l’outil idéal pour les développeurs, mais aussi pour les data scientist qui souhaite tester et déployer leur modèles. Pyspark demande souvent de configurer plein de machin bidules et ne marche pas à tous les coups. Dans ce chapitre, je vous explique de manière simple comment obtenir via Docker et de le lancer avec Jupyter lab ou Jupyter notebook sans problème et commencer à écrire ces codes.

NB: Avant de se lancer vous devez avoir docker installé sur votre machine.

Sur Docker-Hub, le port ou les conteneurs sont livrés, une simple recherche de “pyspark” suffit.

Lien: pyspark-notebook

Sur…

Abdoulaye Diallo

data, machine learning, research

Get the Medium app

A button that says 'Download on the App Store', and if clicked it will lead you to the iOS App store
A button that says 'Get it on, Google Play', and if clicked it will lead you to the Google Play store