PyData Paris 2024#

Aperçu de la conférence#

En septembre 2024, DataLab a été présenté lors de la PyData Paris 2024, une conférence dédiée à Python dans la science des données, l’apprentissage automatique et l’analyse. Cette conférence française a permis de présenter DataLab en profondeur à la communauté scientifique Python locale.

Présentation de DataLab#

Titre de la présentation : DataLab : Unir les mondes scientifique et industriel pour un traitement avancé des signaux et des images

Orateur : Pierre Raybaut (Directeur Général Ingénierie, CODRA)

Cette présentation a offert un aperçu complet des capacités de DataLab à travers des démonstrations pratiques et des cas d’utilisation pertinents tant pour la recherche scientifique que pour les applications industrielles.

Structure de la présentation#

Introduction

DataLab en tant qu’outil fusionnant la recherche scientifique et les applications industrielles.

Démonstration en direct

La démonstration intégrée mettant en avant :

  • Traitement du signal : opérations de base, détection de pics, ajustement de courbes, mesures de FWHM

  • Traitement d’images : calcul d’histogrammes, rotation, gestion des ROI, calcul de centroïdes, détection de contours

  • Fonctionnalités avancées : profils d’intensité, filtres de restauration, filtres morphologiques, détection de contours

Prise en main
  • Documentation complète (tutoriels, API, directives de contribution)

  • Méthodes d’installation multiples : pip, conda, installateur Windows

  • Canaux de distribution variés

Quatre cas d’utilisation clés#

La présentation a détaillé la polyvalence de DataLab à travers quatre cas d’utilisation distincts :

1. Analyser les signaux et les images

Utiliser DataLab comme une application autonome - un couteau suisse pour l’analyse de données avec des fonctionnalités prêtes à l’emploi et une extensibilité par plugins.

2. Prototyper des pipelines de traitement

Mélanger le code Python avec les fonctionnalités de DataLab en échangeant des données entre votre IDE/notebook et DataLab, bénéficiant des deux mondes.

3. Déboguer des applications de traitement

Établir une connexion entre votre application et DataLab pour inspecter les données à différents stades du pipeline avec un retour visuel.

Exemple : Développement d’un logiciel de mosaïque d’images automatique pour le CEA, utilisant DataLab pour visualiser les images et les résultats à chaque étape de l’algorithme.

4. Améliorer les applications

Utiliser DataLab comme une bibliothèque ou une application compagnon pour ajouter des fonctionnalités de traitement avancées.

Exemple : Système de contrôle de diagnostic plasma pour le CEA - l’application envoie des images à DataLab pour visualisation et calcul, recevant en retour des résultats et des paramètres traités.

Approche de validation#

La présentation a mis en évidence le processus de validation en deux étapes de DataLab :

Validation fonctionnelle

Tests automatisés classiques (approche TDD, workflows CI/CD) atteignant 90 % de couverture de code - exceptionnel pour une application GUI.

Validation technique (scientifique)

Assurer l’exactitude des résultats avec 84 % de couverture des fonctionnalités scientifiques, avec tous les statuts de validation suivis et automatiquement documentés.

Regarder la présentation complète#

Ressources#

Points clés#

La présentation PyData Paris a mis en évidence plusieurs aspects critiques :

Philosophie de l’outil compagnon

DataLab ne remplace pas votre IDE ou votre notebook Jupyter - il les complète en fournissant :

  • Fonctionnalités prêtes à l’emploi pour la lecture, l’édition et la visualisation des données

  • Capacités de réglage fin pour le développement d’algorithmes

  • Support de débogage visuel

Applications du monde réel

Des exemples concrets de projets du CEA ont démontré la valeur pratique de DataLab dans des environnements de production.

Extensibilité

La possibilité de personnaliser DataLab via des plugins et des macros tout en maintenant une fiabilité de niveau industriel.

Excellence de la documentation

Documentation de l’état de validation générée automatiquement renforçant la confiance des utilisateurs.

Impact sur DataLab#

La présentation PyData Paris et les retours ont contribué à :

  • Accent accru sur la documentation des cas d’utilisation

  • Accent accru sur le positionnement en tant qu’outil compagnon

  • Résolution des problèmes d’installation des packages Conda