🖥️ Guide de Setup — Raspberry Pi 5

Installation, configuration et déploiement d'un Raspberry Pi 5 (16 Go) pour l'IA locale
Généré le 03-06-2026 · Par Alfred · Usage : bureau / expérimentation
📖 Documentation officielle Raspberry Pi →

📋 Table des matières

1. Introduction

Ce guide a pour objectif de fournir une procédure complète, étape par étape, pour mettre en place un Raspberry Pi 5 (16 Go de RAM) destiné à l'expérimentation d'IA locale. Il s'adresse à des profils peu techniques mais désireux d'accéder à une interface graphique à distance, à la manière de LM Studio sur un PC.

đź’ˇ Contexte

Contrairement à un PC classique, le Raspberry Pi est un ordinateur monocartelle (SBC) basé sur l'architecture ARM 64-bit. Il nécessite donc des binaires et des modèles adaptés (format GGUF pour ARM64). Le setup diffère de votre configuration maison (LM Studio + RDP) mais l'objectif est similaire : un accès graphique à distance avec des modèles LLM locaux.

Le guide couvre :

2. Présentation du matériel

Illustration du Raspberry Pi 5
Illustration du Raspberry Pi 5 — carte monocartelle ARM64

📊 Spécifications techniques du Raspberry Pi 5 (16 Go)

ComposantSpécification
Processeur (CPU)Broadcom BCM2712 — Quad-core Arm Cortex-A76 @ 2.4 GHz (64-bit)
GPUVideoCore VII — OpenGL ES 3.1, Vulkan 1.2
RAM16 Go LPDDR4X-4267 (mémoire partagée avec le GPU)
ConnectivitéWi-Fi 802.11ac (bi-bande 2.4/5 GHz), Bluetooth 5.0 / BLE
Connectique2 Ă— USB 3.0 (5 Gbps), 2 Ă— USB 2.0, Gigabit Ethernet
Affichage2 Ă— micro-HDMI (dual 4Kp60 avec HDR)
StockagemicroSD (SDR104 haute vitesse) + interface PCIe 2.0 x1 (via M.2 HAT)
AlimentationUSB-C PD — 5V/5A (27W) recommandé
AutresPort 40 broches GPIO, RTC (horloge temps réel), bouton d'alimentation, 2 connecteurs MIPI 4-lanes
Dimensions85 Ă— 56 Ă— 17 mm (format standard Raspberry Pi)
⚠️ Point important : la RAM partagée

Le GPU VideoCore VII partage la RAM avec le CPU. Sur un Pi 5 à 16 Go, environ 1 à 2 Go sont alloués au GPU selon la configuration. Cela laisse ~14 Go disponibles pour les modèles LLM, ce qui est suffisant pour des modèles de 7B quantisés en Q4/Q5.

âś… Pourquoi 16 Go est un bon choix

La version 16 Go du Pi 5 permet de charger des modèles de taille moyenne (7B Q4, certains 8B) tout en gardant le système réactif. C'est le bon compromis pour l'expérimentation sans avoir besoin de NPU (AI HAT+).

3. Premier allumage

Voici la procédure pour le premier branchement de la machine, en local avec écran, clavier et souris.

1

Préparer la carte microSD

Sur votre PC principal, téléchargez Raspberry Pi Imager depuis raspberrypi.com/software.

Ouvrez-le, sélectionnez Raspberry Pi 5 comme device, Raspberry Pi OS (64-bit) with Desktop comme OS, et votre carte microSD.

đź’ˇ Conseil

Privilégiez une carte rapide (U3 / A2). Une carte classe 1 bas de gamme ralentira significativement le système. Minimum 64 Go recommandé pour installer Docker et des modèles LLM.

2

Brancher le Pi 5

  • InsĂ©rer la microSD dans le slot du Pi 5
  • Brancher un câble Ethernet (recommandĂ© pour la configuration initiale)
  • Brancher un câble micro-HDMI vers un moniteur/TV
  • Brancher clavier et souris USB
  • Brancher l'alimentation USB-C (27W PD recommandĂ©) en dernier
3

Configuration initiale (first-boot wizard)

Le Pi 5 démarre sur Raspberry Pi OS Desktop. Un assistant de configuration apparaît :

  1. Langue / clavier / fuseau horaire — configurer selon votre environnement
  2. Wi-Fi — se connecter au réseau du bureau
  3. Compte utilisateur — créer un compte (ne pas utiliser le compte pi par défaut pour des raisons de sécurité)
  4. Mises à jour — le système proposera d'installer les mises à jour disponibles
4

Mise à jour du système

# Ouvrir un terminal et exécuter : sudo apt update && sudo apt full-upgrade -y sudo rpi-update # Redémarrer après la mise à jour du firmware sudo reboot

4. Installation de Raspberry Pi OS

Deux options s'offrent Ă  vous selon l'usage :

Option A : Raspberry Pi OS with Desktop (recommandé pour débuter)

C'est l'option la plus proche de votre expérience LM Studio sur PC. Elle inclut un environnement graphique complet (PIXEL desktop), un navigateur, et un terminal. Idéal pour les profils peu techniques.

Option B : Raspberry Pi OS Lite (headless)

Version sans interface graphique. Tout se fait en ligne de commande. À adopter une fois le setup stabilisé.

⚠️ Choix pour votre usage

Puisque vous avez 16 Go de RAM et que des utilisateurs peu techniques utiliseront la machine, l'option A (Desktop) est recommandée en phase 1. Vous pourrez passer à Lite plus tard si besoin.

5. Accès distant via RDP (xrdp)

Pour accéder au bureau du Pi 5 depuis un autre PC (Windows, Mac, Linux), nous installons xrdp, un serveur RDP open-source.

Installation de xrdp

# Sur le Pi 5 (terminal local ou SSH) : sudo apt update sudo apt install xrdp -y # Le service démarre automatiquement sudo systemctl enable xrdp sudo systemctl status xrdp

Configuration de sécurité

# Empêcher le compte pi par défaut (sécurité) sudo systemctl stop xrdp-sesman echo "disable-session=true" | sudo tee -a /etc/xrdp/sesman.ini # Ou mieux : créer un utilisateur dédié sudo adduser goulwen # (remplacer par le nom d'utilisateur souhaité)

Connexion depuis un PC distant

đź’ˇ Trouver l'IP du Pi
hostname -I

Ou vérifier dans les paramètres réseau de l'interface graphique du Pi.

⚠️ Limitation XRDP + Wayland

XRDP ne fonctionne pas avec le serveur d'affichage Wayland. Raspberry Pi OS Bookworm utilise Xorg par défaut pour le Pi 5, donc ça devrait fonctionner. Si vous rencontrez un écran noir, vérifiez que Xorg est actif : echo $XDG_SESSION_TYPE doit retourner x11.

6. Setup LM Studio (CLI + serveur API)

LM Studio n'est pas disponible en version GUI native sur ARM64/Linux. Cependant, sa CLI (lms) et son serveur headless fonctionnent parfaitement sur le Pi 5. Voici le setup recommandé :

Étape 1 : Installer Docker

# Option 1 : Script officiel Docker (recommandé) curl -fsSL https://get.docker.com | sh # Ajouter l'utilisateur au groupe docker sudo usermod -aG docker $USER # Déconnecter / reconnecter pour appliquer # Vérifier l'installation docker --version docker compose version

Étape 2 : Installer la CLI LM Studio (lms)

# Installer lms CLI (LM Studio Line) curl -fsSL https://lmstudio.ai/install.sh | bash # Vérifier l'installation lms --version # Doit retourner une version (ex: lms 0.9.x)

Étape 3 : Démarrer le daemon LM Studio

# Démarrer le daemon (llmster) en arrière-plan lms daemon up # Vérifier qu'il tourne lms daemon status

Étape 4 : Télécharger un modèle

# Lister les modèles disponibles lms search qwen3 # Exemple : télécharger Qwen3 8B quantisé (adapté 16GB Pi) lms get qwen3-8b-instruct-q4_k_m.gguf # Ou pour un modèle plus léger (démarrage rapide) lms get qwen3-4b-instruct-q4_k_m.gguf

Étape 5 : Démarrer le serveur API

# Démarrer le serveur OpenAI-compatible sur le port 1234 lms server start --model <nom_du_modèle> --bind 0.0.0.0 -p 1234 # Exemple concret : lms server start --model qwen3-8b-instruct-q4_k_m.gguf --bind 0.0.0.0 -p 1234

Étape 6 : Vérifier que le serveur répond

# Depuis un autre terminal : curl http://localhost:1234/v1/models # Test de chat : curl http://localhost:1234/v1/chat/completions \ -H "Content-Type: application/json" \ -d '{ "model": "qwen3-8b-instruct-q4_k_m.gguf", "messages": [{"role": "user", "content": "Bonjour, comment vas-tu ?"}], "max_tokens": 50 }'
✅ Résultat attendu

Le serveur LM Studio expose une API compatible OpenAI sur http://<IP-du-Pi>:1234/v1. Tout outil compatible OpenAI (Open WebUI, scripts, etc.) peut s'y connecter.

Automatisation au démarrage (systemd)

Pour que le daemon et le serveur démarrent automatiquement :

# Créer le fichier de service pour le daemon sudo nano /etc/systemd/system/lms-daemon.service
[Unit] Description=LM Studio Daemon (llmster) After=network.target docker.service User=goulwen Group=goulwen [Service] Type=simple ExecStart=/home/goulwen/.lmstudio/bin/lms daemon up ExecStop=/home/goulwen/.lmstudio/bin/lms daemon down Restart=always RestartSec=10 [Install] WantedBy=multi-user.target
# Activer et démarrer sudo systemctl enable lms-daemon sudo systemctl start lms-daemon # Idem pour le serveur (lms-server.service) sudo systemctl enable lms-server sudo systemctl start lms-server

7. Setup Ollama (alternative)

Ollama est une alternative plus simple à configurer mais avec moins de flexibilité que LM Studio. Voici comment l'installer :

Installation

# Script d'installation officiel curl -fsSL https://ollama.com/install.sh | sh # Vérifier ollama --version

Télécharger et lancer un modèle

# Lister les modèles disponibles ollama list # Télécharger un modèle (ex: Qwen3 4B) ollama pull qwen3:4b # Lancer le chat interactif ollama run qwen3:4b

Configuration pour le Pi 5

# Variables d'environnement recommandées pour le Pi 5 # À ajouter dans ~/.bashrc ou /etc/environment : # Augmenter le contexte (défaut 4096, recommandée 8192) export OLLAMA_CONTEXT_LENGTH=8192 # Limiter les threads CPU (laisser du CPU pour le bureau) export OLLAMA_NUM_PARALLEL=2 # Désactiver le keep-alive pour économiser de la RAM export OLLAMA_KEEP_ALIVE=0 # Bind sur toutes les interfaces (accessible en réseau) export OLLAMA_HOST=0.0.0.0:11434
⚠️ Limitations d'Ollama sur Pi 5

Par défaut, Ollama utilise tous les 4 cœurs CPU, ce qui peut ralentir le bureau. Il faut configurer OLLAMA_NUM_PARALLEL pour limiter cela. De plus, Ollama ne permet pas de sélectionner finement les quantisations comme LM Studio.

8. Comparaison LM Studio vs Ollama sur Pi 5

CritèreLM Studio (lms)Ollama
InstallationScript curl (CLI)Script curl (CLI)
InterfaceCLI + API HTTPCLI + API HTTP
Sélection de modèles✅ Large choix GGUF, tout formatRegistry limité
Quantization✅ Q2 à Q8, K_M, K_S, etc.Pré-quantifiés
API OpenAIâś… Natif (port 1234)âś… Natif (port 11434)
Contrôle threads CPU✅ Via paramètres serveur✅ OLLAMA_NUM_PARALLEL
Headless / systemd✅ Supporté✅ Supporté
GUI desktop❌ Pas sur ARM64/Linux❌ Pas sur ARM64/Linux
Performanceâś… ~10-20% plus rapideBon
ÉcosystèmeOpen WebUI, scriptsOpen WebUI, scripts
RecommandationRecommandéAlternative
âś… Recommandation pour votre usage

LM Studio (lms) est recommandé en priorité car il offre un contrôle plus fin des modèles et des performances légèrement supérieures. Utilisez Ollama comme fallback si LM Studio pose des problèmes.

9. Modèles recommandés pour Pi 5 (16 Go)

Voici les modèles les plus adaptés à votre configuration, classés par taille :

ModèleTaille (Q4)RAM estiméeTPS attenduUsage
Qwen3 4B~2.5 Go~4 Go~30-50 tok/sRéponse rapide, tâches générales
Qwen3 8B~5 Go~7-8 Go~15-25 tok/sMeilleur compromis
Gemma 3 4B~2.5 Go~4 Go~35-55 tok/sLéger et performant
Llama 3.2 8B~5 Go~7-8 Go~12-20 tok/sBon pour la compréhension
Gemma 3 1B~1 Go~2 Go~60-100 tok/sUltra-rapide, tâches simples
Phi-3.5 Mini 3.8B~2.3 Go~4 Go~35-50 tok/sMicrosoft, bon rapport qualité/poids
💡 Stratégie de déploiement

Commencez par Qwen3 4B pour tester le setup rapidement (chargement en ~10s). Une fois stable, passez à Qwen3 8B Q4_K_M pour de meilleures capacités. Vous avez 16 Go de RAM, donc vous pouvez même essayer des modèles de 13B en Q3 si besoin (chargement plus lent mais faisable).

10. Interface web (Open WebUI) — Optionnel

Pour une expérience proche de LM Studio (interface graphique de chat), déployez Open WebUI en Docker :

# Créer le dossier de configuration mkdir -p /opt/stacks/open-webui # Créer un fichier docker-compose.yml : nano /opt/stacks/open-webui/docker-compose.yml
version: "3.8" services: open-webui: image: ghcr.io/open-webui/open-webui:main restart: always ports: - "3000:8080" environment: - OLLAMA_BASE_URL=http://host.docker.internal:1234 - WEBUI_SECRET_KEY=change_this_to_a_random_string volumes: - open-webui-data:/app/backend/data volumes: open-webui-data:
# Démarrer : cd /opt/stacks/open-webui docker compose up -d # Accéder à http://<IP-du-Pi>:3000
âś… Configuration de la connexion

Dans Open WebUI → Admin Panel → Settings → Connections, définir l'URL de l'API LM Studio comme http://127.0.0.1:1234/v1 (ou l'IP du Pi selon la configuration).

11. Vers le cluster — Perspectives futures

Une fois le premier Pi 5 stable, voici les étapes pour passer au cluster de 3 Pi :

Architecture envisageable

Améliorations matérielles possibles

⚠️ Ne pas installer d'AI HAT+ maintenant

Concentrez-vous d'abord sur le setup logiciel du Pi 5 nu. L'AI HAT+ est une étape ultérieure pour l'inférence accélérée.

12. Dépannage rapide

ProblèmeSolution
Écran noir au démarrageVérifier l'alimentation (27W PD requis), carte microSD, câble HDMI
Pas d'accès réseauip a pour vérifier l'IP, ping 8.8.8.8, vérifier le routeur
xrdp ne se connecte pasVérifier sudo systemctl status xrdp, pare-feu (sudo ufw allow 3389), session X11
LM Studio ne démarre paslms daemon status, vérifier les logs : journalctl -u lms-daemon -f
Modèle ne se charge pas (OOM)Modèle trop gros pour la RAM disponible. Réduire la quantization (Q4 → Q3) ou utiliser un modèle plus petit
Performance lenteVérifier la température : vcgencmd measure_temp. Activer le ventilateur. Vérifier la carte microSD (passer en NVMe si possible)
Docker ne fonctionne passudo usermod -aG docker $USER, déconnecter/reconnecter, docker run hello-world

13. Sources officielles