🧠Déployer DeepSeek R1 sur AWS EC2 : Comparatif CPU vs GPU, AMI, Instances & Scripts
Cet article s'adresse aux développeurs avertis ayant l'habitude de déployer des instances de serveurs AWS.
Le développement des modèles de langage (LLMs) open source
comme DeepSeek R1 ouvre la porte à l’auto-hébergement de
puissants assistants IA. Grâce à Ollama, il est aujourd’hui
possible d’exécuter ces modèles facilement sur une instance EC2 d’AWS, que ce
soit avec ou sans GPU. Ce guide vous explique quelle configuration
choisir, quelle AMI utiliser, et fournit des scripts
pour lancer votre environnement complet.
⚔️ Comparatif : CPU vs GPU
Critère |
CPU (ex : t3.large, c5.xlarge) |
GPU (ex : g4dn.xlarge) |
🧠Modèles supportés |
DeepSeek R1 1.5B / 7B (lent) |
DeepSeek R1 7B / 14B (rapide) |
⏱️ Temps de réponse |
Lents (5–15s) |
Rapides (< 1s) |
đź’ľ RAM minimale |
8–16 Go |
16 Go (en plus du GPU) |
💰 Coût par heure |
🟢 Bas |
🔴 Moyen/élevé |
🧰 Simplicité
d'installation |
Facile |
NĂ©cessite pilotes NVIDIA |
📦 AMI recommandées
âś… Pour les configurations CPU
only
- Nom
AMI : Ubuntu Server 22.04 LTS (HVM), SSD Volume Type
- AMI
ID (Paris - eu-west-3) : ami-0ebc281c20e89ba4b
âś… Pour les configurations GPU
- Nom
AMI : Deep Learning AMI GPU PyTorch 1.13 (Ubuntu 20.04)
- AMI
ID (Paris - eu-west-3) : ami-0d3dc2ecfc070dd6e
Ou bien une AMI Ubuntu 22.04 + installation manuelle des
drivers NVIDIA.
đź’» Recommandation de type d'instance EC2
Type d’instance |
GPU |
RAM |
Pour quel usage ? |
t3.large |
❌ |
8 Go |
Modèles légers en CPU (DeepSeek 1.5B) |
c5.xlarge |
❌ |
8 Go |
Modèle 1.5B ou 7B quantifié |
g4dn.xlarge |
âś… T4 |
16 Go |
DeepSeek 7B ou 14B avec bonne perf |
g5.xlarge |
âś… A10G |
16 Go |
Meilleures perfs pour DeepSeek R1 |
p3.2xlarge |
âś… V100 |
61 Go |
Inférence/entraînement haut de gamme |
âś… Conclusion
Pour un usage rapide et pas cher | → CPU c5.xlarge + DeepSeek R1 1.5B |
Pour des perfs sérieuses | → GPU g4dn.xlarge + DeepSeek R1 7B/14B |
Pour une interface web | → Ajouter Open WebUI avec Docker |
Related Tags:
Questions Fréquemment Posées
Développer un MVP (Minimum Viable Product) avec notre agence vous permet de tester rapidement votre idée sur le marché avec un investissement initial réduit. Cela vous aide à valider vos hypothèses, recueillir des retours utilisateurs précieux et itérer efficacement avant de lancer un produit complet.
Nous suivons une méthodologie en quatre étapes : Découverte et Analyse, Conception et Planification, Développement et Itération, puis Lancement et Support Post-lancement. Chaque étape est conçue pour assurer une progression structurée et flexible, garantissant ainsi la qualité et la rapidité de livraison de votre MVP.
Nous utilisons une variété de technologies modernes et open-source telles que React, Node.js, Python, PHP, Angular, etc., pour garantir que votre MVP est à la fois performant et évolutif. Nous sélectionnons les technologies en fonction des besoins spécifiques de votre projet.
Nous mettons en place des mécanismes de suivi et d'analyse des performances dès le lancement. Nous recueillons activement les retours des utilisateurs, analysons les données pour identifier les améliorations nécessaires et intégrons ces retours dans les itérations suivantes pour optimiser votre produit.
Oui, nous offrons un support continu après le lancement du MVP, incluant l'assistance technique, les mises à jour régulières et les optimisations pour assurer la croissance et la scalabilité de votre produit. Notre équipe reste disponible pour vous accompagner à chaque étape.
Le coût de développement d'un MVP dépend de la complexité des fonctionnalités et des technologies utilisées. Nous travaillons avec vous pour définir un budget adapté à vos besoins, en garantissant une transparence totale et un retour sur investissement optimal.
En partant d'une feuille blanche pour une première version d'une application, il faut compter entre 20k€ et 30k€ pour un MVP de qualité.
Ci-dessous, un exemple de répartition d'un budget sur un projet "from scratch".
Phase | Etape | % du budget |
---|---|---|
Conception et planification | Cadrage | 5% |
Design UI/UX | 10% | |
Développement et itérations | Delivery du MVP | 50% |
Outils relation client | 5% | |
Gestion de projets | 15% | |
Post lancement | Support | 10% |
Marketing / Ads | 5% | |
TOTAL | 100% |