Apprenti R&D DevOps/SysOps
- Gestion et automatisation d'un pipeline CI/CD sur GitHub Enterprise.
- Mise en place d'une stack de monitoring pour serveurs avec Prometheus et Grafana.
- Élaboration de dashboards Grafana pour le suivi en temps réel de l’état et des performances des machines GPU.
- Automatisation de l’installation des serveurs GPU (RAID, NFS, crontab, pilotes NVIDIA).
- Standardisation des configurations des clusters GPU.
- Création de visualisations de données avec Looker Studio et BigQuery.
- Archivage et compression des données avec Google Cloud Storage et Python.
- Configuration as Code d’un cluster GCP avec Terraform.
- Réduction des vulnérabilités CVE des images Docker grâce à JFrog Xray.
- Implémentation de Docker dans un environnement de production pour la gestion des applications.