Summary
Overview
Work History
Education
Skills
Certification
LANGUAGE
Hobbies and Interests
Timeline
Generic
AMINE AMARZOUK

AMINE AMARZOUK

Alfortville

Summary

Data & AI Engineer expérimenté, je conçois et industrialise des pipelines de données robustes sur le Cloud AWS/GCP. J’automatise les flux pour supporter les initiatives de Data Science et contribue directement à la création d’applications et d’agents d’Intelligence Artificielle.

Overview

4
4
years of professional experience
1
1
Certification

Work History

Data/AI Engineer

Squiiver
10.2024 - 10.2025
  • Création d’un framework d’ingestion de données pour 6+ filiales internationales, réduisant le temps d’intégration d’une nouvelle source de plusieurs semaines à moins de 3 jours via une architecture générique. (DLT, Api Rest, Airbyte, Airflow, GCS, Docker, CloudRun)
  • Transformation du prototype "Orbit" en une solution industrialisée et déployée en production, après validation par les comités d'architecture et de sécurité.
  • Co-conception de la plateforme multi-agents “Orbit” visant à accélérer le cycle de développement en automatisant les tâches des ingénieurs.(LangChain, Vertex AI, Docker, Cloud Run, Cloud SQL, Terraform, Chainlit)
  • Développement de l’agent RAG (ConfluenceAssistant) de la solution, divisant par trois les temps de recherche sur +20000 documents Confluence. (LangChain, pygector, Google Cloud Storage, SQL)
  • Développement d’un pipeline CI/CD sur GitLab-CI pour “Orbit”, intégrant des tests de non-régression sémantique pour valider la qualité de chaque nouvelle version.
  • Production d'assets de données fiables sur BigQuery en orchestrant des transformations testées et documentées avec dbt.
  • Conception sur Grafana d'un dashboard de diagnostic pour l'agent RAG, corrélant la performance de la recherche vectorielle (pgvector) avec la latence de génération du LLM pour une optimisation ciblée.


Data Engineer

GROUPE AVEC
12.2022 - 07.2024
  • Déploiement et administration d’un cluster Spark (15 nœuds) pour le traitement quotidien de plus de 500 Go de données médicales brutes, réduisant le temps des tâches d’analyse de 80% (de 5 heures à moins d’1 heure).
  • Conception de 12+ pipelines ETL avec PySpark pour l’intégration de sources de données hétérogènes, augmentant la fiabilité des données de 95% grâce à des contrôles de qualité stricts et automatisés.
  • Mise en place de workflows d'orchestration avec Apache Airflow pour automatiser, planifier et monitorer l'exécution des pipelines de données.
  • Création de dashboards de monitoring avec Power BI pour visualiser la santé des pipelines et la qualité des données, réduisant le temps de détection d'anomalies de 50%.
  • Développement de 4 API REST avec FastAPI pour exposer les données traitées aux Data Scientists, leur donnant un accès en temps réel et accélérant leurs cycles d'expérimentation.

IT Support Stage

AMAZON
02.2022 - 08.2022
  • Résolution de +400 tickets d’incidents techniques pour les employés de l’entrepôt.
  • Interventions IT au cœur de l’entrepôt pour minimiser le “downtime” des systèmes logistiques critiques, des convoyeurs aux aux stations d’emballage.

Education

Master of Science - Cloud Data Engineer

DataScientest
Paris, France
09-2025

Master of Science -

Epitech
Paris, France
07-2024

Bac+3, 1ère Année Du Cycle Ingénieur - IT

Ecole Centrale D’Electronique ECE Paris
09-2022

Classe préparatoire physique et sciences de l’ingénieur -

PSI-CPGE IBN GHAZI
07-2021

Skills

  • Langages de programmation: Python, SQL, C, Bash, Html
  • Cloud : AWS, GCP, Snowflake
  • Data Engineering : Spark, Kafka, Hadoop, HDFS Airflow, Dagster, dbt
  • Bases de Données : MySQL, PostgreSQL, MongoDB, Pinecone, ChromaDB
  • Monitoring : Prometheus, Grafana
  • IA / Machine Learning : TensorFlow, PyTorch, LangChain, LangGraph, SDK OpenAI
  • DevOps & CI/CD : Docker, Kubernetes, GitLab, Jenkins, Ansible, Terraform, Git
  • Back-end : FastAPI, Flask, Django
  • Visualisation & Outils : Power BI, Matplotlib, Jira, Confluence, Trello
  • Applications interactives : Streamlit, Chainlit

Certification

AWS Certified Cloud Practitioner

LANGUAGE

Français : Nv Avancé.
Anglais : Nv Avancé.
Arabe : Nv Maitrise.
Tamazight : Langue maternelle.

Hobbies and Interests

Calisthenics, Fitness, Intelligence Artificielle.

Timeline

Data/AI Engineer

Squiiver
10.2024 - 10.2025

Data Engineer

GROUPE AVEC
12.2022 - 07.2024

IT Support Stage

AMAZON
02.2022 - 08.2022

Master of Science - Cloud Data Engineer

DataScientest

Master of Science -

Epitech

Bac+3, 1ère Année Du Cycle Ingénieur - IT

Ecole Centrale D’Electronique ECE Paris

Classe préparatoire physique et sciences de l’ingénieur -

PSI-CPGE IBN GHAZI
AMINE AMARZOUK