Projet personnel — Exécution locale de modèles LLM sur Apple Silicon:
Objectif : tester l’exécution locale de modèles de langage (LLM) sur architecture Apple Silicon et analyser les contraintes de performance hors environnement CUDA.
Réalisations :
• Création d’un environnement IA avec Conda (Python 3.10)
• Installation et configuration de PyTorch, Transformers, Datasets
• Téléchargement et exécution locale de modèles GPT-1/2/3 (Hugging Face)
• Tests de modèles Mistral AI (Zephyr-7B, versions alpha et bêta)
• Quantisation 4-bits pour réduction mémoire (plafond atteint à ~7B paramètres)
• Analyse des limites matérielles (latence, allocation mémoire, erreurs OOM, “invalid buffer size”)
Compétences / Technologies :
Python, Conda, PyTorch, Hugging Face Transformers, Datasets, LLM (GPT-1/2/3, Mistral Zephyr-7B), quantisation 4-bits, optimisation mémoire, Apple Silicon (architecture unifiée), benchmarking performance.
Projets de cours :
• Mini-ERP Java — gestion d’entités + persistance SQL (Java / JDBC / SQL)
• Jeu en langage C — programmation modulaire + logique de jeu (C / POO)
• Application web PHP — gestion de tâches + authentification (PHP / SQL)
• Projet NoSQL MongoDB — modélisation de documents + requêtes (MongoDB / NoSQL)