Guide Pratique de l'IA — Outils & Méthodes Marie "Assisté par IA, vérifié par notre équipe" ⏱ 6 min de lecture

Installer une IA locale gratuite sur PC avec Ollama

Une IA sur votre PC, sans abonnement, sans connexion internet obligatoire

Vous en avez assez des limites de messages sur ChatGPT gratuit, des coupures en pleine session de travail ou de l’idée que vos données transitent sur des serveurs américains ? Il existe une alternative concrète : faire tourner un modèle de langage directement sur votre machine, sans compte, sans carte bancaire, sans quota.

L’outil qui rend ça possible s’appelle Ollama. C’est un logiciel open source qui installe et exécute des modèles IA (Llama 3, Mistral, Phi-3…) localement sur votre PC Windows, Mac ou Linux. Ce guide vous accompagne de l’installation à votre première conversation — comptez 10 à 15 minutes.

Pourquoi c’est compliqué sans un outil comme Ollama

Avant Ollama, faire tourner un LLM en local relevait du parcours d’obstacle : environnement Python à configurer, dépendances à installer manuellement, modèles de plusieurs gigaoctets à télécharger via des lignes de commande obscures. Un développeur expérimenté y consacrait une demi-journée. Un non-technicien abandonnait avant.

Les IA gratuites en ligne comme ChatGPT ou Gemini règlent le problème de la simplicité — mais elles imposent leurs conditions : des limites cachées que la plupart des utilisateurs ne voient pas venir. Ollama supprime cette dépendance. Votre IA, vos données, votre machine.

Ce qu’il vous faut avant de commencer

PC Windows 10/11, macOS 11+ ou Linux — Ollama tourne sur les trois
8 Go de RAM minimum (16 Go recommandés pour les modèles 7B)
10 à 15 Go d’espace disque libre selon le modèle choisi
GPU optionnel mais bienvenu : Ollama exploite automatiquement NVIDIA ou AMD si présent — les réponses sont alors 5 à 10× plus rapides
Une connexion internet pour le téléchargement initial uniquement

Pas de GPU dédié ? Pas de panique. Un CPU moderne (Intel i5/i7 de 10e génération ou Ryzen 5/7) suffit pour des modèles légers comme Mistral 7B ou Phi-3 Mini.

Installation d’Ollama : étape par étape

Étape 1 — Télécharger Ollama

Rendez-vous sur ollama.com et cliquez sur le bouton de téléchargement correspondant à votre système. Le fichier pèse moins de 100 Mo. Sur Windows, c’est un installateur classique (.exe) — double-clic, suivant, terminé. Sur Mac, un fichier .dmg à glisser dans Applications. Sur Linux, une seule commande suffit :

curl -fsSL https://ollama.com/install.sh | sh

L’installation prend moins d’une minute. Ollama se lance automatiquement en arrière-plan, visible dans la barre des tâches.

Étape 2 — Télécharger votre premier modèle

Ouvrez un terminal (PowerShell sur Windows, Terminal sur Mac/Linux) et tapez :

ollama run mistral

Ollama télécharge automatiquement Mistral 7B (~4 Go) et lance une session de chat directement dans le terminal. Première fois : comptez 5 à 10 minutes de téléchargement selon votre connexion. Les fois suivantes : démarrage en 5 secondes.

Autres modèles disponibles avec la même commande :

llama3 — le modèle de Meta, excellent en anglais et bon en français
phi3 — très léger (2 Go), idéal sur PC modeste
gemma2 — le modèle open source de Google DeepMind
mistral — la fierté française, solide en français

Étape 3 — Votre première conversation

Une fois le modèle chargé, vous êtes directement en mode chat dans le terminal. Testez avec un prompt concret :

Rédige un email professionnel pour relancer un client qui n’a pas répondu depuis 2 semaines. Ton sobre, 5 lignes maximum.

La réponse arrive en quelques secondes sur un CPU récent, quasi-instantanée avec GPU. Rien ne sort de votre machine. Aucun log envoyé à un serveur, aucune donnée collectée.

Étape 4 — Ajouter une interface graphique (optionnel mais confortable)

Le terminal, c’est fonctionnel. Pour une expérience plus proche de ChatGPT, installez Open WebUI — une interface web locale qui se connecte à Ollama. Elle tourne dans votre navigateur et propose l’historique des conversations, le choix du modèle, et même le support des fichiers.

Installation via Docker en une commande, ou via l’installateur standalone disponible sur le dépôt GitHub d’Open WebUI. Une fois lancée, accédez à http://localhost:3000 depuis votre navigateur. C’est votre ChatGPT privé, hébergé chez vous.

Pour aller plus loin dans la comparaison des approches gratuites vs payantes, notre Guide Pratique de l’IA — Outils & Méthodes couvre l’ensemble des outils testés par notre rédaction.

Points forts / Points faibles d’Ollama

Points forts	Points faibles
100 % gratuit, aucun abonnement	Performances limitées sans GPU dédié
Données 100 % privées, rien ne quitte le PC	Téléchargement initial lourd (4–8 Go par modèle)
Fonctionne hors ligne après installation	Qualité légèrement inférieure à GPT-4o ou Claude 3.5
Dizaines de modèles disponibles	Pas d’accès web natif, pas de plugins
Installation simple, même sur Windows	Terminal obligatoire sans Open WebUI

Verdict

Score : 8,5/10 pour un usage privé et professionnel sans contraintes de quota.

Ollama est l’option la plus accessible pour faire tourner une IA performante en local. Mistral 7B répond correctement à 80 % des tâches courantes : rédaction, résumé, reformulation, code simple. Pour des tâches complexes ou multimodales, Claude ou GPT-4o restent supérieurs — mais ils ont un coût et des limites selon votre abonnement.

Si la confidentialité de vos données est une priorité ou si vous travaillez sans connexion stable, Ollama n’a pas d’équivalent gratuit sérieux sur le marché.

FAQ — Questions fréquentes

Ollama fonctionne-t-il sans connexion internet ?

Oui, une fois le modèle téléchargé, Ollama fonctionne entièrement hors ligne. La connexion n’est nécessaire que pour télécharger de nouveaux modèles ou mettre à jour l’application.

Quelle est la configuration PC minimale pour Ollama ?

8 Go de RAM et un processeur de moins de 5 ans suffisent pour les modèles légers (Phi-3 Mini, Mistral 7B quantisé). Pour Llama 3 70B, comptez 32 Go de RAM ou un GPU avec 16 Go de VRAM.

Les modèles locaux sont-ils aussi bons que ChatGPT ?

Pour des tâches courantes en français — rédaction, résumé, traduction, code basique — Mistral 7B atteint 75-80 % de la qualité de GPT-4o. Pour les raisonnements complexes ou les analyses longues, l’écart reste mesurable.

Peut-on utiliser Ollama à des fins professionnelles sans risque juridique ?

Oui. Les modèles disponibles via Ollama (Mistral, Llama 3, Phi-3…) sont distribués sous licences open source permettant l’usage commercial pour la plupart. Vérifiez la licence spécifique de chaque modèle sur la page Ollama correspondante.