Chapitre 5

Le Seuil de Doherty : L'Anatomie d'une Milliseconde

La neurobiologie de la vitesse perçue et l'illusion du temps réel

14 min de lecture

Sommaire

Quand l'attente brise le flux

Il y a un moment précis — mesuré à la milliseconde — où l'expérience bascule. En dessous de ce seuil, l'utilisateur est dans un état de flux : il pense, l'interface répond, il avance. Au-delà, quelque chose se brise. Le cerveau décroche. La frustration s'installe. Ce seuil a été découvert en 1982 par deux ingénieurs d'IBM.

Chaque 100ms de latence supplémentaire coûte 1% de ventes à Amazon. Le temps n'est pas un détail technique — c'est une décision de design.

IBM, 1982 : La Découverte du Seuil

Walter Doherty et Ahrvind Thadani ont mené une étude exhaustive sur la productivité humaine face aux délais de réponse. Leur conclusion a redéfini la conception logicielle : en dessous de 400ms, les utilisateurs restent engagés et productifs. Au-delà, leur attention se fragmente.

< 400ms : l'utilisateur perçoit la réponse comme instantanée — état de flux maintenu

400ms – 2s : conscience de la latence — l'attention commence à se fragmenter

2s – 10s : frustration active — l'utilisateur envisage d'abandonner

> 10s : décrochage cognitif — le cerveau cherche une autre tâche

Le Cerveau Face à la Latence

La neurologie explique pourquoi ce seuil est universel. En dessous de 400ms, le cortex préfrontal traite l'interaction comme un mouvement naturel : l'interface devient une extension du corps. Au-delà, le cerveau émet un signal d'alerte électrique mesuurable : la composante P300.

⚡

0 – 400msFlux

L'interface semble être une extension du corps. L'utilisateur ne perçoit aucune latence.

👁

400ms – 2sConscience

L'attention se fragmente. L'utilisateur remarque l'attente mais reste engagé.

😤

2s – 10sFrustration

Frustration active. L'utilisateur commence à envisager l'abandon ou l'alternative.

🚫

> 10sDécrochage

Décrochage cognitif total. Le cerveau cherche activement une autre tâche.

La composante P300 — une onde EEG mesurée à 300-400ms — est le signal électrique de la surprise cognitive. Chaque latence visible déclenche cette alarme dans le cerveau de l'utilisateur.

Le Spectre RAIL : Quatre Seuils Critiques

Google a formalisé le modèle RAIL (Response, Animation, Idle, Load) pour organiser les seuils temporels selon le contexte d'interaction. Chaque seuil correspond à un état cognitif différent, et donc à une stratégie de design différente.

16ms

Animation

60fps — mouvement fluide

100ms

Réponse

Retour visuel immédiat

400ms

Seuil de Doherty

Limite du flux cognitif

1 000ms

Continuité

Perte du fil narratif

10 000ms

Abandon

Décrochage total

Le Seuil de Doherty à 400ms est le point de bascule entre flux et friction.

Concevoir l'Illusion de la Vitesse

La vitesse perçue n'est pas la vitesse réelle. C'est là que le design intervient. Deux équipes peuvent avoir le même temps de chargement côté serveur, mais des expériences utilisateur radicalement différentes selon la façon dont elles gèrent le temps visuel. La formule est simple : Vitesse Perçue = Vitesse Réelle + Rétroaction Visuelle.

Un indicateur de progression fait paraître une attente de 8 secondes plus courte qu'une attente silencieuse de 3 secondes. La perception prime sur la réalité.

Spinners vs Squelettes : Le Débat Décidé par les Données

Le spinner (roue tournante) est l'indicateur de chargement le plus répandu — et l'un des moins efficaces. Il communique une seule information : « attend ». L'écran squelette, lui, projette la structure du contenu à venir, ancrant l'attention de l'utilisateur dans la continuité.

Indicateur standard

Chargement…

Spinner

Anxiogène — ne donne aucune information sur ce qui charge

Approche optimisée

Écran Squelette

Perçu 20–30% plus rapide — projette la structure du contenu à venir

Les squelettes sont perçus 20 à 30% plus rapides que les spinners, à temps réel identique
Les écrans squelettes réduisent le taux de rebond de 9 à 20% sur les pages à fort contenu
Facebook, LinkedIn, YouTube et Slack ont tous migré vers les squelettes entre 2014 et 2018
La règle : si le contenu a une structure prévisible, utiliser un squelette — sinon, un spinner avec progression

Anatomie d'un Écran Squelette

Un écran squelette efficace suit trois phases précises qui correspondent aux états cognitifs de l'utilisateur. Chaque phase a un rôle : ancrer, engager, résoudre. La transition entre elles doit être imperceptible.

Structure

Phase 1 — Structure (0–300ms) : afficher immédiatement la mise en page — blocs gris là où le contenu apparaîtra

Animation

Phase 2 — Animation (300ms–1s) : ajouter un effet shimmer (brillance glissante) pour signaler que le chargement est actif

Résolution

Phase 3 — Résolution (> 1s) : dissoudre le squelette avec une transition douce vers le contenu réel

Ressentez le seuil

Simulez différents temps de réponse. Observez comment votre perception change de chaque côté du seuil de 400ms.

Simulateur de latence

Déclenchez une action et ressentez la différence de perception

Choisissez une action

L'Impact Économique de la Milliseconde

La vitesse n'est pas un critère esthétique. C'est une variable économique directement mesurable. Les données des plus grandes plateformes numériques convergent vers la même conclusion : chaque milliseconde de latence a un coût réel.

Google : +100ms de latence = +32% de taux de rebond sur les résultats de recherche

Amazon : +100ms de latence = -1% de chiffre d'affaires (soit des milliards annuels)

Netflix : migration vers les squelettes sur le streaming adaptatif = réduction mesurable du churn

Walmart : chaque seconde de chargement économisée = +2% de conversions

La Check-list du Designer Rapide

Concevoir pour la vitesse perçue ne nécessite pas d'optimisations serveur. Ce sont des décisions de design, applicables dès la maquette.

⚡

Retour visuel immédiat (< 100ms) sur chaque action utilisateur — même si le résultat prend plus longtemps

🦴

Squelettes plutôt que spinners pour tout contenu à structure prévisible

🔮

Optimistic UI : afficher le résultat supposé avant confirmation serveur, annuler si erreur

📊

Progression visible avec étapes nommées pour les processus > 3 secondes

🎬

Animations fluides à 60fps pour masquer les transitions de chargement

Le Temps est un Matériau de Design

Le Seuil de Doherty révèle quelque chose de fondamental sur la relation entre les humains et les machines : l'expérience ne se joue pas dans les pixels, mais dans les intervalles entre eux. La latence n'est pas une contrainte technique à subir — c'est une dimension à sculpter.

L'objectif n'est pas de construire des serveurs plus rapides. C'est de concevoir pour les rythmes cognitifs naturels du cerveau.

Sources & Références

[1]Doherty, W. & Thadani, A. (1982). The Economic Value of Rapid Response Time. IBM Systems Journal.
[2]Sutcliffe, A. (1995). Human-Computer Interface Design. Macmillan.
[3]Google Developers. (2018). RAIL Model — A user-centric performance model. web.dev.
[4]Perlin, B. (2017). The Perception of Skeleton Screens vs. Spinners. Luke Wroblewski's research series.
[5]Amazon. (2007). Latency and Revenue — internal performance study. Cited in: The Performance Inequality Gap.
[6]Nielsen, J. (1993). Usability Engineering. Academic Press. Chapter 5: Responsiveness.

Retour aux cours Chapitre suivant — L'Affordance selon Don Norman