Onyxia : une plateforme de traitement de données moderne

Séminaire RUSS - Ined

Shiraz Adamaly, Romain Avouac, Frédéric Comte

03/02/2023

Comment travaillez-vous ?

L’informatique dans le SSP

  • Une “communauté d’artisans”
    • Diversité des langages de programmation
    • Diversité des environnements de travail

Le poste de travail

  • Avantages :
    • Simplicité
  • Inconvénients :
    • Puissance limitée
    • Reproductibilité limitée
    • Sécurité faible

Les infrastructures mutualisées traditionnelles

  • Avantages :
    • Simplicité
    • Puissance
    • Sécurité des données
    • Couvre la majorité des usages
  • Inconvénients :
    • Reproductibilité faible
    • Difficultés à innover

L’enjeu de la reproductibilité

Source : Peng R., Reproducible Research in Computational Science, Science (2011)

Donner les moyens d’innover

  • Fournir des ressources adaptées aux nouveaux usages
    • Parallélisation
    • Calcul distribué
    • Entraînement de modèles d’apprentissage sur GPUs
  • Passer du développement à la mise en production
    • Automatisation d’une récupération de données
    • Déploiement d’applications R Shiny

Le projet Onyxia

Le SSP Cloud

Un Datalab dimensionné pour les usages innovants

 

Des technologies modernes qui favorisent la reproductibilité

Source

Une plateforme ouverte et collaborative

Une plateforme de formation

Un espace dédié à l’expérimentation

  • Hébergement d’hackathons

  • Déploiement de dataviz

  • Travail sur données ouvertes

Un projet, plusieurs instances

  • Un projet open-source pour déployer des plateformes de datascience modernes

Une communauté d’utilisateurs