Loading...

🧠 Déployer DeepSeek R1 sur AWS EC2 : Comparatif CPU vs GPU, AMI, Instances & Scripts

Cet article s'adresse aux développeurs avertis ayant l'habitude de déployer des instances de serveurs AWS.

Le dĂ©veloppement des modèles de langage (LLMs) open source comme DeepSeek R1 ouvre la porte Ă  l’auto-hĂ©bergement de puissants assistants IA. Grâce Ă  Ollama, il est aujourd’hui possible d’exĂ©cuter ces modèles facilement sur une instance EC2 d’AWS, que ce soit avec ou sans GPU. Ce guide vous explique quelle configuration choisirquelle AMI utiliser, et fournit des scripts pour lancer votre environnement complet.



⚔️ Comparatif : CPU vs GPU

Critère

CPU (ex : t3.large, c5.xlarge)

GPU (ex : g4dn.xlarge)

🧠 Modèles supportés

DeepSeek R1 1.5B / 7B (lent)

DeepSeek R1 7B / 14B (rapide)

⏱️ Temps de réponse

Lents (5–15s)

Rapides (< 1s)

đź’ľ RAM minimale

8–16 Go

16 Go (en plus du GPU)

💰 Coût par heure

🟢 Bas

🔴 Moyen/élevé

🧰 Simplicité d'installation

Facile

NĂ©cessite pilotes NVIDIA


 

📦 AMI recommandées

âś… Pour les configurations CPU only

  • Nom AMI : Ubuntu Server 22.04 LTS (HVM), SSD Volume Type
  • AMI ID (Paris - eu-west-3) : ami-0ebc281c20e89ba4b

âś… Pour les configurations GPU

  • Nom AMI : Deep Learning AMI GPU PyTorch 1.13 (Ubuntu 20.04)
  • AMI ID (Paris - eu-west-3) : ami-0d3dc2ecfc070dd6e

Ou bien une AMI Ubuntu 22.04 + installation manuelle des drivers NVIDIA.


 đź’» Recommandation de type d'instance EC2

Type d’instance

GPU

RAM

Pour quel usage ?

t3.large

❌

8 Go

Modèles légers en CPU (DeepSeek 1.5B)

c5.xlarge

❌

8 Go

Modèle 1.5B ou 7B quantifié

g4dn.xlarge

âś… T4

16 Go

DeepSeek 7B ou 14B avec bonne perf

g5.xlarge

âś… A10G

16 Go

Meilleures perfs pour DeepSeek R1

p3.2xlarge

âś… V100

61 Go

Inférence/entraînement haut de gamme


 

âś… Conclusion

Pour un usage rapide et pas cher→ CPU c5.xlarge + DeepSeek R1 1.5B
Pour des perfs sĂ©rieuses→ GPU g4dn.xlarge + DeepSeek R1 7B/14B
Pour une interface web→ Ajouter Open WebUI avec Docker


Pattern Pattern Pattern

Questions Fréquemment Posées

Développer un MVP (Minimum Viable Product) avec notre agence vous permet de tester rapidement votre idée sur le marché avec un investissement initial réduit. Cela vous aide à valider vos hypothèses, recueillir des retours utilisateurs précieux et itérer efficacement avant de lancer un produit complet.

Nous suivons une méthodologie en quatre étapes : Découverte et Analyse, Conception et Planification, Développement et Itération, puis Lancement et Support Post-lancement. Chaque étape est conçue pour assurer une progression structurée et flexible, garantissant ainsi la qualité et la rapidité de livraison de votre MVP.

Nous utilisons une variété de technologies modernes et open-source telles que React, Node.js, Python, PHP, Angular, etc., pour garantir que votre MVP est à la fois performant et évolutif. Nous sélectionnons les technologies en fonction des besoins spécifiques de votre projet.

Nous mettons en place des mécanismes de suivi et d'analyse des performances dès le lancement. Nous recueillons activement les retours des utilisateurs, analysons les données pour identifier les améliorations nécessaires et intégrons ces retours dans les itérations suivantes pour optimiser votre produit.

Oui, nous offrons un support continu après le lancement du MVP, incluant l'assistance technique, les mises à jour régulières et les optimisations pour assurer la croissance et la scalabilité de votre produit. Notre équipe reste disponible pour vous accompagner à chaque étape.

Le coût de développement d'un MVP dépend de la complexité des fonctionnalités et des technologies utilisées. Nous travaillons avec vous pour définir un budget adapté à vos besoins, en garantissant une transparence totale et un retour sur investissement optimal.
En partant d'une feuille blanche pour une première version d'une application, il faut compter entre 20k€ et 30k€ pour un MVP de qualité. Ci-dessous, un exemple de répartition d'un budget sur un projet "from scratch".

Phase Etape % du budget
Conception et planification Cadrage 5%
Design UI/UX 10%
Développement et itérations Delivery du MVP 50%
Outils relation client 5%
Gestion de projets 15%
Post lancement Support 10%
Marketing / Ads 5%
TOTAL 100%

Top