Aller au contenu principal
NumériqueData

Databricks — Lakehouse, Spark & Delta Lake

Construisez une plateforme Lakehouse moderne pour unifier data engineering, analytique et IA à grande échelle.

4.8· 0 apprenants
Demander un devis
Durée
4 jours - 28 heures
Niveau
Intermédiaire
Formats
Présentiel · Distanciel

Présentation

Cette formation présente Databricks comme plateforme de traitement, stockage et exploitation des données. Les participants apprennent les fondamentaux Lakehouse, Spark, notebooks, jobs et Delta Lake. L'accent est mis sur la fiabilité des pipelines, la performance et la gouvernance des données. Elle est adaptée aux équipes data qui veulent industrialiser leurs traitements batch et analytics.

À qui s'adresse cette formation ?

• Data engineers • Data scientists • Architectes data • Développeurs Python/SQL • Équipes BI avancées

Prérequis

• Bases SQL indispensables. • Notions Python recommandées. • Compréhension générale des architectures data lake ou data warehouse. • Connaissance cloud utile mais non obligatoire.

Objectifs pédagogiques

  • 1Comprendre l'architecture Lakehouse Databricks.
  • 2Manipuler notebooks, clusters et jobs.
  • 3Utiliser Spark SQL et PySpark sur des jeux de données.
  • 4Exploiter Delta Lake pour fiabiliser les traitements.
  • 5Comprendre les principes de gouvernance et d'industrialisation.

Compétences visées

Créer des notebooks de transformation.Lire, transformer et écrire des données avec Spark.Structurer des tables Delta fiables.Planifier des jobs data simples.Appliquer les bonnes pratiques de développement collaboratif.

Programme

  1. 01

    Concept Lakehouse

    Concept Lakehouse Situer Databricks entre data lake, data warehouse, BI et IA.

  2. 02

    Notebooks et environnement

    Prendre en main workspace, notebooks, clusters, catalogues et collaboration.

  3. 03

    Spark SQL et PySpark

    Transformer des données avec SQL et Python dans un environnement distribué.

  4. 04

    Delta Lake

    Gérer fiabilité, historique, schémas, transactions et optimisation des tables.

  5. 05

    Industrialisation

    Créer des jobs, surveiller les traitements et structurer une chaîne data maintenable.

Méthodes pédagogiques

Apports théoriques structurés et contextualisés. Démonstrations guidées sur la solution ou environnement simulé. Travaux pratiques et cas d'usage métier. Échanges avec le formateur et retours d'expérience. Support numérique remis aux participants.

Évaluation & validation

TP fil rouge sur pipeline Lakehouse. QCM technique et restitution d'un workflow Databricks documenté.

Documents délivrés : Support de cours PDF. Fiches mémo Spark/Delta. Exemples notebooks. Checklist industrialisation. Attestation de fin de formation.

Accessibilité handicap

Nos formations sont accessibles aux personnes en situation de handicap. Contactez notre référent handicap pour un accompagnement personnalisé.

Prochaines sessions

Chargement des sessions…

Ce qui est inclus

  • Attestation

Nos garanties

Certification Qualiopi

Organisme certifié Qualiopi

Session 100 % garantie

Session garantie dès 1 apprenant

Questions fréquentes

2 600 €
HT / participant