Crashs d'avions: la loi des séries a-t-elle encore frappé?
Pourquoi croyons-nous qu'un malheur n'arrive jamais seul?
- -
Le 4 novembre, le crash d'un avion à Cuba fait 68 morts. Le lendemain, un avion transportant des employés du groupe pétrolier italien ENI s'écrase, faisant 21 morts. Au cours de ces deux même jours, deux avions de la compagnie australienne Quantas frôlent la catastrophe en atterrissant d'urgence.La loi des séries a-t-elle encore frappé? Slate republie un article sur le sujet paru en juillet 2009 pour que les anxieux voyagent en connaissance de causes.
***
Disparition énigmatique du vol Paris-Rio d'Air France, crash d'un Airbus de Yemenia Airlines au large des Comores, 168 morts en Iran. Trois catastrophes aériennes en moins de six semaines... Cette fois c'est sûr, la loi des séries a encore frappé; c'est reparti pour un été noir comme celui de 2005, quand la planète avait assisté avec horreur à l'incroyable série de cinq crashs meurtriers pour le seul mois d'août. Les plus prévenants ont déjà annulé leurs déplacements estivaux en avion au profit du train ou du bateau, espérant «laisser passer l'orage» et attendre la fin de la série noire. Faut-il vraiment éviter de prendre l'avion cet été?
Selon les chiffres officiels de l'Association internationale du transport aérien (IATA), la moyenne sur les dix dernières années se situe autour d'un accident pour un million de vols. Cette statistique ne prend en compte que les avions de ligne construits dans les pays occidentaux et les accidents ayant entraîné une destruction partielle ou totale de la carlingue de l'appareil. En recoupant avec d'autres statistiques, on arrive plutôt à une moyenne autour d'un accident tous les 500.000 vols.
Probabilités
A la lecture de ces chiffres, il semble en effet très peu probable que cinq crashs majeurs se produisent en 22 jours, comme en août 2005. Les études portant sur la probabilité des crashes selon le jour de l'année ou le mois ont été abandonnées depuis les années 1990, car on s'est vite rendu compte qu'elles étaient inutiles. Il n'y a pas de mois ou de jour de l'année plus propice aux accidents. Tout juste peut on affirmer qu'il y a légèrement plus de crashs en été: mais comme le trafic est plus intense, cela ne change rien à la probabilité.
En fait, si l'on accepte le chiffre d'un crash tous les 500.000 vols, et qu'on arrondit le nombre de vols commerciaux par jour dans le monde à 20.000 80 000, la probabilité pour que l'événement «5 accidents d'avions en 22 jours» se réalise est d'environ... 1/10. Une probabilité faible mais loin d'être impossible.
D'un point de vue mathématique donc, les séries noires s'expliquent parfaitement. En revanche, nulle trace dans les livres de science d'une quelconque «loi des séries». Pourquoi alors avons-nous l'impression que les événements arrivent par séries? La première réponse se retrouve dans le calcul ci-dessus: l'homme a une mauvaise connaissance innée des probabilités. Un exemple est souvent utilisé pour illustrer ce constat: quand on demande à une classe de 23 élèves la probabilité pour que deux d'entre eux au moins aient la même date de naissance, les réponses tournent en général autour d'une chance sur cinq. Et pourtant, la bonne réponse est une chance sur deux.
Un résultat qui prouve que les probabilités sont souvent contre-intuitives. Cette mauvaise compréhension des statistiques nous pousse à chercher des explications irrationnelles à des évènements certes peu probables mais parfaitement «normaux».
L'Homme a appris à décoder son environnement et à déterminer, consciemment ou non, des corrélations significatives. C'est même un des traits qui lui a permis de survivre à la sélection naturelle. L'adaptation à des événements à occurrence régulière a façonné nos civilisations (les marées, les cycles du soleil et de la lune etc.), d'où l'importance de noter et d'essayer d'expliquer ceux qui sortent de l'ordinaire et des cycles connus.
Psychologie
La psychologie explique aussi notre croyance en la loi des séries. La tendance à la validation subjective, qui consiste à valider une information parce qu'on la trouve signifiante pour soi-même, est assez commune. Ce concept, additionné à celui de la mémoire sélective, explique pour beaucoup l'impression de coïncidence chez l'Homme: nous avons tendance à nous souvenir seulement des événements qui confirment la théorie en laquelle nous croyons et à oublier les contres vérifications, même si elles sont plus nombreuses. Les événements traumatiques marquent plus les esprits, d'où l'expression «un malheur n'arrive jamais seul.» De même, on se souvient longtemps d'un crash d'avion vu à la télévision, mais on ne pense jamais aux milliers de vols quotidiens qui se déroulent sans incidents.
La médiatisation joue évidemment un grand rôle dans notre perception de la fréquence des accidents d'avion: les crashs d'avion sont moins nombreux qu'il y a trente ans mais beaucoup plus médiatisés. Il y a fort à parier que si tous les accidents de voiture étaient médiatisés à la manière des crashs d'avion, avec envoyés spéciaux et émissions spéciales en direct, beaucoup se poseraient plus de questions sur la sécurité routière.
Si la loi des séries n'existe pas, on peut en revanche parler de séries noires, un enchaînement d'événements peu probable mais qui n'a pas de signification ou d'origine particulière. Pas plus dans le domaine des catastrophes aériennes que celui des décès de personnalités. Et pourtant, là aussi, beaucoup ont l'impression que 2009 n'est pas une année comme les autres: Michael Jackson, Farah Fawcett, Pina Bausch, Karl Malden, Robert Louis-Dreyfus, Omar Bongo, Alain Bashung, David Carradine...
Grégoire Fleurot
Merci à Ronan Hubert, expert en accidentologie aérienne et fondateur du Bureau d'archives des accidents aéronautiques.
(Photo: Abstract seba, Flickr, CC)
Mis à jour le 06/11/2010 à 10h13












































Bonjour,
Comment est calculée la probabilité égale à 1/10 ?
Cordialement,
Michaël
"si l'on accepte le chiffre d'un crash tous les 500.000 vols, et qu'on arrondit le nombre de vols
commerciaux par jour dans le monde à 20.000, la probabilité pour que l'événement «5 accidents
d'avions en 22 jours» se réalise est de... 1/10."
=> 1/10? Aberration! Cela signifierait que 5 accidents sur 22 jours sont plus probables qu'un seul
accident en un jour! ( alors qu'évidemment le 1er évènement implique le second donc c'est absurde!)
Démonstration:
la probabilité d'avoir au moins 1 accident sur 1 journée (=20000 vols) est:
p1= 1- (499999/500000)^20000 = 0.039 soit environ 4 %
la probabilité d'avoir 5 accidents sur 22 journées est donc:
p5 = C(5,22)x(0.039)^5x(1-0.039)^(22-5) = 0.0012 soit environ 1 CHANCE SUR 1000 !
Cordialement.
Je trouve p = 0.0018241.
Je pense qu'il y a du y avoir une confusion : il s'agit de 1/10 % et non 1/10.
Je fais l'hypothèse qu'il s'agit d'un processus de Bernouilli, dans lequel chaque vol est un tirage avec une probabilité de succès (c'est à dire de crash) égale à p=1/500000. Il y a 22 jours avec 20 000 vols / jour soit n = 22*20 000 essais dans le processus de Bernouilli. On étudie la probabilité que le nombre de succès (i.e. de crash !) est égale à j = 5. La probabilité est donc égale à
p = c(n,j) * p^j * (1 - p)^(n-j)
Voici le script Scilab qui permet de retrouver le résultat :
function c = combinations ( n , j )
c = prod ( n : -1 : n-j+1 )/prod(1:j)
endfunction
n = 22*20000
j = 5
p = 1 / 500000
q = 1-p
p = combinations(n,j) * p^j * q^(n-j)
La différence entre nos deux approches est que la probabilité donnée par "bonobo" dépend de l'unité de temps choisie. J'ai fait 3 calculs avec les résultats suivants :
unité = jour, p = 0.0012366
unité = 1/2 jour, p = 0.0015155
unité = h, p = 0.0017973
Le résultat tend vers la loi de Poisson, qui donne le même résultat que le processus de Bernouilli :
n = 22*20000
j = 5
lambda = n * p
p = 1 / 500000
pc = lambda^j * exp(-lambda) / factorial(j) // 0.0018241
Bien cordialement,
Michaël
Merci pour vos commentaires et votre attention !
En effet le calcul est faux, j'ai écrit qu'il y a 20 000 vols par jour alors qu'il y en a en fait 80 000 selon le Quid 2007. C'est avec ce dernier chiffre que l'on trouve un résultat de 1/10. Erreur de déconcentration, excusez-moi.
Pour être encore plus précis, il y a 13,32% de chances d'avoir EXACTEMENT 5 accidents en 22 jours et 27.83% de chances d'avoir AU MOINS 5 accidents en 22 jours si l'on prend le chiffre de 80 000 vols par jour.
Voici le détail du calcul:
Pour 5 crashs en 22 jours EXACTEMENT: C_1760000^5 * (1/500000)^5 * (1-1/500000)^{1 759 995}
Pour 5 crashs en 22 jours AU MOINS: 1 - (\sum_{p=0}^4 { C_N^p * (1/M)^p * (1- 1/M)^(N-p) })
avec N = 1 760 000 et M = 500000
Cordialement,
Remerciements à deux agrégés de mathématiques
Bonjour,
Je confirme votre calcul. Avec un nombre de vol plus importants,
il est logique d'obtenir des nombres de crash plus élevées.
Je profite de ce message pour vous féliciter de cet article
qui m'a intrigué et permis de faire quelques calculs.
Avec 80 000 vols par jours, j'obtiens 29.2 millions de vols par an.
Avec 1 crash tous les 500 000 vols, j'obtiens 58.4 crash par an, soit environ 5 par mois.
En tant qu'humain, je ne peux pas m'empêcher de m'attendre à ce qu'il y ait
exactement 5 crash par mois, ce qui est exactement le contraire d'un
phénomène aléatoire ! L'aléa, c'est justement le fait que le nombre d'événements
est imprévisible, car il n'a qu'un probabilité de réalisation, et pas une certitude.
J'ai calculé la table du nombre de crash sur 22 jours et
j'obtiens les résultats suivants, qui montrent
que le nombre de crash le plus probable en 2005 était autour de 3 crash
(sous l'hypothèse que le nombre de vols était le même).
P(0 crash en 22 jours)=0.02959933 ~ 1/33
P(1 crash en 22 jours)=0.10418985 ~ 1/9
P(2 crash en 22 jours)=0.18337440 ~ 1/5
P(3 crash en 22 jours)=0.21515949 ~ 1/4
P(4 crash en 22 jours)=0.18934040 ~ 1/5
P(5 crash en 22 jours)=0.13329561 ~ 1/7
P(6 crash en 22 jours)=0.07820002 ~ 1/12
P(7 crash en 22 jours)=0.03932339 ~ 1/25
P(8 crash en 22 jours)=0.01730226 ~ 1/57
P(9 crash en 22 jours)=0.00676709 ~ 1/147
P(10 crash en 22 jours)=0.00238201 ~ 1/419
En ce qui concerne la séquence de 2009, c'est à dire 3 crash en
6 semaines (=6*7=42 jours), voici ce que j'obtiens.
P(0 crash en 42 jours)=0.00120653 ~ 1/828
P(1 crash en 42 jours)=0.00810790 ~ 1/123
P(2 crash en 42 jours)=0.02724259 ~ 1/36
P(3 crash en 42 jours)=0.06102348 ~ 1/16
P(4 crash en 42 jours)=0.10251956 ~ 1/9
P(5 crash en 42 jours)=0.13778639 ~ 1/7
P(6 crash en 42 jours)=0.15432084 ~ 1/6
P(7 crash en 42 jours)=0.14814804 ~ 1/6
P(8 crash en 42 jours)=0.12444434 ~ 1/8
P(9 crash en 42 jours)=0.09291841 ~ 1/10
P(10 crash en 42 jours)=0.06244113 ~ 1/16
Donc, la probabilité d'obtenir exactement 3 crash en 42 jours est égale à 0.06,
mais la probabilité d'obtenir 3 crash ou plus est égale à 0.9634430 ~ 96 % !
C'était donc un événement assez probable.
Le calcul ne tient pas compte du nombre de français dans l'avion,
ce qui modifie l'impact des crash dans les médias.
Je me rassure en comptant que sur 30 millions de vols par an, 58 crash c'est
quand même peu.
Bien cordialement,
Michaël
En fait le calcul avec 20000 vols par jour est bon mais il est un peu plus complexe qu'une simple loi binomiale.
Il y a une explication de principe dans ce lien:
http://www.google.fr/url?sa=t&source=web&ct=res&cd=5&url=http%3A%2F%2Fwww.univ-rouen.fr%2FLMRS%2FPersopage%2FJanvresse%2FPubli%2Fseries_noires.pdf&ei=P0dmSrKPBc-TjAe5_e2ZAQ&usg=AFQjCNFY0uvblQIlfj97L4Ha67VfFifz3w
Pas tout à fait d'accord.
Il ne s'agit pas de calculer la probabilité d'avoir 5 crashs sur une période de 22jours (enfin on le peut ;) )mais plutôt de calculer la probabilité que sur 1 an il y ait 5 accidents sur un intervalle de 22 jours en faisant appel à la notion de statistique de balayage. Or sur 1 an il y a plein d'intervalles de 22 jours possibles...
Donc la proba donnée initialement de 0.10 (0.11 d'après l'article dont la source est relativement fiable) pour un trafic de 20000 est exacte.
http://www.univ-rouen.fr/LMRS/Persopage/Janvresse/Publi/series_noires.pdf
En fait tout le monde a raison mais on ne parle pas de la même chose!
Merci pour cette intéressante référence. La page internet de l'un des deux auteurs donne la référence suivante :
La loi des séries noires. Élise Janvresse, Thierry de la Rue. La Recherche. 393 Janvier 2006. p 52--53.
Les deux auteurs apprécieront d'avoir étés cités... Eux-même citent la référence suivante :
Scan statistics and applications. Edité par J. Glaz et N. Balakrishnan. Birkhauser Boston, 1999.
Du coup, l'hypothèse de 80 000 vols par jour n'est plus nécessaire pour justifier la probabilité égale à 1/10, puisque l'article de Janvresse et de la Rue s'appuie sur l'hypothèse de 20 000 vols par jour. Mais le calcul exact n'est pas donné dans le papier de Janvresse et de la Rue, et je suppose qu'il est nécessaire de lire le livre de Glaz et Balakrishnan pour avoir des informations
plus détaillées.
Bien cordialement,
Michaël
D'après vos chiffres, on devrait avoir des séries de crash chaque mois.... (la proba de zéro crash par mois étant faible) . Or ce n'est pas ce qu'on observe. J'en déduis que les médias passent sous silence certains crashs. Mais lequels? Moi il ne me semble pas qu'ils s'abstiennent de parler d'un crash sous prétexte qu'il n'y a pas de français impliqués... Il y a quelque chose de pas cohérent là-dedans.
2 possiblités:
- soit les chiffres présentés dans l'article ne concernent pas seulement les crash de gros avions, mais aussi des accidents plus mineurs (dont on ne parle pas aux infos). Dans ce cas, on ne peut pas se baser sur ces chiffres pour calculer la probabilité de crash, et donc on n'explique pas les fameuses "séries noires" (qui elles sont des accidents majeurs).
- soit les chiffres présentés dans l'article concernent bien les gros crash. Dans ce cas les médias en occultent certains, mais je vois pas pour quelle raison.