L'utilisation des mathématiques durant l'affaire Dreyfus Repères chronologiques Sources

1894

Le « bordereau »

1895

1896

Le télégramme (« petit bleu ») de
Schwartzkoppen à Esterhazy (1896).

1897

1898

1899

1900 à 1906

Réhabilitation de Dreyfus en 1906
Le système Berthillon Le système Bertillon était une méthode utilisée pour analyser l'écriture manuscrite, développée par Alphonse Bertillon, un criminologue français du XIXe siècle. Dans l'affaire Dreyfus, cette méthode a été utilisée pour comparer l'écriture de Dreyfus avec celle du bordereau.
Bertillon avançait l'argument selon lequel Dreyfus aurait intentionnellement modifié son écriture dans le bordereau pour dissimuler son identité. Cette théorie s'appuyait sur l'idée que l'auteur du bordereau avait délibérément tenté de masquer sa véritable écriture en imitant une autre.
Selon Bertillon, les différences apparentes entre l'écriture de Dreyfus habituelle et celle du bordereau étaient le résultat d'une tentative délibérée de dissimulation. Il soutenait que l'auteur du bordereau avait volontairement altéré son style d'écriture pour rendre difficile l'identification de l'écrivain.
Cette hypothèse était fondée sur l'observation de divergences dans les traits d'écriture entre les documents écrits présumément par Dreyfus et le bordereau incriminé. Bertillon interprétait ces différences comme des signes d'une volonté délibérée de masquer l'identité réelle de l'auteur du bordereau.
Bertillon, pour prouver sa thèse effectua plusieurs mesures sur des photos du « bordereau » selon plusieurs caractéristiques. Il appliqua une démarche similaire à celle qu'il avait déjà mise en place dans ses travaux en anthropométrie (mesures physiques du corps humain). Il calqua cette approche à l'analyse de l'écriture en utilisant des mesures précises telles que la taille des lettres, l'espacement entre elles, l'inclinaison de l'écriture, la pression du stylo, etc.
Bertillon identifia ensuite des caractéristiques spécifiques dans l'écriture, comme la forme et la courbure des lettres, les boucles, les liaisons entre les lettres, ainsi que la régularité ou l'irrégularité des traits.
Il compara ces caractéristiques entre les écritures connues de Dreyfus et celle du bordereau pour compter le nombre de similitudes. Il en dénombre $4$ parmi $26$ possibles. Il estime de plus que la probabilité d'avoir une coïncidence est de $0,2$, et donc que d'en avoir $4$ est de $0,2^4$ soit $0,001\,6$. Il conclut en disant que puisque cette probabilité est faible, Dreyfus est l'auteur du bordereau. Le rapport de Poincaré En 1904, la Commission de révision, qui était chargée de réexaminer les preuves et les éléments du dossier de l'affaire Dreyfus après la découverte de nouveaux éléments et de possibles erreurs judiciaires, avait chargé les mathématiciens Henri Poincaré, Gaston Darboux et Paul Appel de rédiger un rapport sur le système Bertillon. Dans les faits, c'est Henri Poincaré qui est le principal auteur de ce document.
Nous présentons ci-dessous la première partie du rapport où il est question de probabilités.
Le système de M. BERTILLON, ainsi que les autres systèmes soumis à notre examen, ont la prétention d'être une application de calcul des probabilités : nous somme donc conduits avant d'en commencer l'étude détaillée, à rechercher à quelles conditions ce calcul peut être légitimement appliqué à des questions de cette nature. Les premières tentatives faites par M. BERTILLON pour l'évaluation des probabilités avaient été tout à fait malheureuses.
Dans son mémoire présenté à la Cour de Cassation en 1899 il avait employé un raisonnement entièrement fautif qu'il a répété ensuite devant le Conseil de Guerre de Renne.
Ayant constaté quatre coïncidences sur les $26$ initiales et finales des polysyllabes redoublés, il se demande quelle conclusion on peut en tirer. Il évalue à $0,2$, la probabilité d'une coïncidence isolée et il en conclut que la probabilité de $4$ coïncidences est $(0,2)^4 = 0,001\,6$.
Mais l'examen le plus superficiel montre que c'est là la probabilité pour qu'il y ait $4$ coïncidences sur $4$ : celle de $4$ coïncidences sur $26$ est de $0,7$, c'est à dire $400$ fois plus grande.
Quand cette erreur a été signalée, on a répondu qu'il y avait en réalité plus de $4$ coïncidences et que la probabilité de chacune d'elles était plus petite que $0,2$ ; la raisonnement n'en demeure pas moins faux, puisqu'il conduit l'auteur à un résultat $400$ fois plus faible que celui que donnerait un calcul correct fait avec les même données.
M. BERTILLON y a, croyons-nous, renoncé; mais l'histoire même de son erreur nous montre la nécessité de bien établir les principes fondamentaux à appliquer.
Si l'on met en évidence certaines coïncidences, et qu'on montre qu'il y avait à priori peu de chances pour qu'elles se produisissent, avons-nous la droit d'en conclure qu'elles ne peuvent être l'effet du hasard ?
Si le n°25 sort à la loterie, ce sera un évènement dont la probabilité à priori était très faible, puisque les billets étaient fort nombreux; mais cela ne veut pas dire que le tirage n'a pas été loyal, car il fallait bien qu'un numéro sortît ou un autre.
Ce n'est donc pas ainsi qu'il faut raisonner; il ne s'agit pas de calculer la probabilité de telle ou telle coïncidence que vous choisissez précisément parce que vous l'avez constatée ; ce qu'il faut introduire, c'est la probabilité d'une coïncidence quelconque parmi celles que vous compteriez à votre actif si elle se produisait.
Supposons qu'il y ait $1\,000$ lettres dans le bordereau, avec les différences des abscisses et des ordonnées, cela fait $999\,000$ nombres ; qu'on trouve ensuite $10\,000$ coïncidences, y aura-t-il lieu de s'étonner ? La probabilité qu'il faudrait chercher, ce serait celle pour que sur $999\,000$ nombres, il y en eût $10\,000 $ qui après $10$ ans de recherche, paraissent remarquable à un esprit aussi attentif que M. BERTILLON ; c'est presque la certitude.
Si on reproduisait un million de documents, il n'y en aurait pas un où l'on retrouverait les mêmes particularités, cela est vrai, mais il y en aurait $900\,000$ où l'on retrouverait d'autres particularités que vous ne jugeriez pas moins remarquables.
Nous en avons dit assez pour faire comprendre la nécessité d'une base de raisonnement plus solides. C'est ce que les fondateurs du calcul des probabilités ont cherché, pour les questions de ce genre, mais nous ne pouvons l'expliquer sans entrer dans quelques détails techniques.
Ils ont distingué la probabilité des effets et la probabilité des causes. Comme exemple de probabilité des effets, on choisit d'ordinaire une urne contenant $90$ boules blanches et $10$ boules noires ; si l'on tire au hasard une boule de cette urne, quelle est la probabilité pour que cette boule soit noire ; c'est évidemment $\frac{1}{10}$.
Les problèmes de probabilité des causes sont beaucoup plus compliqués, mais beaucoup plus intéressants.
Supposons par exemple deux urnes d'aspect extérieur identique; nous savons que l'une contient $90$ boules blanches et $10$ boules noires, et l'autre an contraire $90$ boules noires et $10$ boules blanches. Nous tirons au hasard une boule de l'une des urnes, sans savoir de laquelle, et nous constatons qu'elle est blanche. Quelle est la probabilité pour que ce soit dans la première urne que nous ayons puisé ?
Dans ce nouveau problème, l'effet est connu, on a constaté que la boule tirée était blanche ; mais la cause est inconnue, on ne sait pas dans quelle urne on a fait le tirage.
Le problème qui nous occupe ici est de même nature : l'effet est connu, ce sont les coïncidences signalées, sur le bordereau, et c'est la cause (forgerie ou écriture naturelle) qu'il s'agit de déterminer.
Ce sont donc les formules dites de probabilité des causes qu'il convient d'appliquer. Mais l'application de ces formules exige quelques précautions.
Dans l'exemple cité plus haut, la probabilité cherchée est de $\frac{9}{10}$, mais c'est parce que nous supposons qu'il n'y a à priori aucune raison pour qu'on soit tombé sur l'une des urnes, plutôt que sur l'autre. Mais, les choses auraient été bien différentes si nous avion eu $11$ urnes dont $10$ composées comme la première et une seulement comme la seconde. A priori la probabilité pour qu'on tombe sur une urne où les blanches dominent aurait été déjà grande; et les résultats auraient dû être notablement modifiés.
Pour pouvoir calculer, d'après un évènement constate, la probabilité d'une cause, il nous faut donc plusieurs données :
  1. Il faut savoir quelle était à priori, avant l'évènement, la probabilité de cette cause.
  2. Il faut savoir ensuite quelle serait pour chacune des causes possibles, la probabilité de l'évènement constaté. (C'est ainsi que dans l'exemple cité il faut connaître la composition des urnes).
Or, cette probabilité à priori, dans des questions comme celle qui nous occupe, est uniquement formée d'éléments moraux qui échappent absolument au calcul, et si, comme nous venons de le voir, nous ne pouvons rien calculer sans la connaître, tout calcul devient impossible.
Aussi Auguste CONTE, a-t-il dit avec juste raison que l'application du calcul des probabilités aux sciences morales était le scandale des mathématiques.
Vouloir éliminer les éléments moraux et y substituer des chiffres, cela est aussi dangereux que vain.
En un mot, le calcul des probabilités n'est pas, comme on paraît le croire, une science merveilleuse qui dispense le savant d'avoir du bon sens.
C'est pour quoi il faudrait s'abstenir absolument d'appliquer le calcul aux choses morale ; si nous le faisons ici, c'est que nous y sommes contraints.
C'est des éléments moraux que doit dépendre le jugement, nous n'avons pas à en parler ici ; mais il est évident que si l'auteur du bordereau avait voulu faire croire à une simulation, il aurait choisi un système simple qui ne pût manquer d'être remarqué par des experts et sur lequel aucune contestation n'aurait été possible.
Il suffit, pour condamner le système BERTILLON, d'observer qu'il ne satisfait pas à cette condition.
On nous dira que ce n'est pas notre rôle d'examiner la question à ce point de vue. Nous devons donner des chiffres, mais nous ne pourrons le faire que sous la forme suivante.
Dans l'impossibilité de connaître la probabilité à priori, nous ne pourrons pas dire telle coïncidence prouve que le rapport de la probabilité de la forgerie à la probabilité inverse a telle valeur. Nous pourrons dire seulement, par la constatation de cette coïncidence, ce rapport devient tant de fois plus grand qu'avant la constatation.
Même, après nous être ainsi restreints, il nous reste bien des pièges à éviter. On n'est jamais sûr d'avoir fait une énumération complète des causes possibles, et c'est ainsi que LAPLACE s'est laissé entraîner dans une mémorable erreur au sujet du ses probable de la rotation des planètes.
Ici cette énumération est à peu près impossible, puisqu'il faudrait rechercher toutes les manières possibles de truquer un document. Et si nous nous restreignons artificiellement à deux causes, le hasard et le mode particulier de forgerie imaginé par M. BERTILLON, une importante difficulté subsiste encore.
Il faut, avons-nous dit, connaître la composition des deux urnes. Or nous connaissons l'une d'elles, celle qui corresponde à l'écriture naturelle, sa composition est déterminée par les lois du hasard, mais nous ne connaissons pas l'autre, nous ne savons pas quelle est la probabilité pour qu'une coïncidence de nature donnée sa produire, à supposer que l'auteur du bordereau ait employé le système BERTILLON.
Faute de pouvoir la déterminer, nous admettrons toujours dans les calculs qui suivront l'hypothèse la plus favorable au système BERTILLON.
Cette rapide discussion nous a montré combien sont fragiles tous ces échafaudages logique d'où on voudrait faire dépendre l'honneur d'un homme ; et s'il fallait quelque chose de plus, la multiplicité même de ces système nous fournirait une démonstration éclatante de cette fragilité.
Nous avons deux système en présence, celui de M. BERTILLON et celui de M. CORPS, ils sont absolument incompatibles, les procédés qu'aurait employés le traire ne sont pas les mêmes, d'après ces deux inventeurs, non plus que les mobiles qui l'auraient fait recourir à la forgerie. Et cependant M. CORPS comme M. BERTILLON accumule les coïncidences, et s'efforce, par des arguments également probants, de montrer qu'elles ne peuvent être dues au hasard.5 Mais si les coïncidences de M. BERTILLON ne sont pas dues au hasard, c'est que le traître s'est biens servi du système imagine par cet expert ; et alors c'est que M. CORPS a tort. Et si celles de M. CORPS qui ne le cèdent en rien aux premières, ne peuvent pas être dues au hasard, c'est que M. CORPS a raison et que M. BERTILLON a tort.
A moins que le mode de raisonnement lui-même ne soit vicieux et ce sera là notre conclusion. Pour réfuter à la fois M. CORPS et M. BERTILLON, il suffit donc de les opposer l'un à l'autre. Bien mieux il suffirait d'opposer M. BERTILLON à lui-même. Et, en effet, il y a deux systèmes BERTILLON sur lesquels nous reviendrons plu loin en détail, mais dont on peut se rendre compte rapidement en consultant une brochure anonyme intitulée Le Bordereau par un ancien élève de l'École Polytechnique (Paris Hardy 1904) et que nous appellerons pour abréger la brochure verte. Cette brochure est accompagnée d'un atlas où l'on remarquera deux planches, la planche 6 et la planche 9 qui représentent les deux systèmes BERTILLON.
Si alors les coïncidences de la planche 9 étaient réelles, comme elles ne pourraient être dues au hasard, elles prouveraient que le bordereau n'a pas été calqué sur le gabarit de la planche 6, c'est à dire sur le mot intérêt.
S'il s'agissait d'un travail scientifique, nous nous arrêterions là ; nous jugerions inutile d'examiner les détails d'un système dont le principe même ne peut soutenir l'examen : mais la Cour nous a confié une mission que nous devons accomplir jusqu'au bout.
Voir le rapport complet Les probabilités dans le rapport Loi binomiale Nous analysons ici la partie suivante du rapport :

« Ayant constaté quatre coïncidences sur les $26$ initiales et finales des polysyllabes redoublés, il se demande quelle conclusion on peut en tirer. Il évalue à $0,2$, la probabilité d'une coïncidence isolée et il en conclut que la probabilité de $4$ coïncidences est $(0,2)^4 = 0,001\,6$.
Mais l'examen le plus superficiel montre que c'est là la probabilité pour qu'il y ait $4$ coïncidences sur $4$ : celle de $4$ coïncidences sur $26$ est de $0,7$, c'est à dire $400$ fois plus grande.
Quand cette erreur a été signalée, on a répondu qu'il y avait en réalité plus de $4$ coïncidences et que la probabilité de chacune d'elles était plus petite que $0,2$ ; la raisonnement n'en demeure pas moins faux, puisqu'il conduit l'auteur à un résultat $400$ fois plus faible que celui que donnerait un calcul correct fait avec les même données. »

On considère une épreuve de Bernoulli où la probabilité du succès est de $0,2$. En la répétant $4$ fois de manière identique et indépendante et en comptant le nombre de succès (ici les coïncidences) on obtient une variable aléatoire que l'on peut noter $X$ qui suit une loi binomiale de paramètres $4$ et $0,2$.
On a alors $\displaystyle{P(X=4)=\binom{4}{4}0,2^4\times 0,8^0}$ $=$ $0,4^4$ $=$ $0,001\,6$.
On retrouve bien l'argument de Poincaré qui affirme que le résultat obtenu par Bertillon est celui de $4$ coïncidences sur $4$ possibles.

En répétant $26$ l'épreuve de Bernoulli et non pas $4$ fois, on obtient une variable aléatoire $Y$ suivant une loi binomiale de paramètres $26$ et $0,2$.

On a alors $P(Y=4)\approx0,17$ ce qui n'est pas le résultat donné par le rapport. Par contre $P(Y\geq4)\approx0,79$ ce qui est plus proche de la valeur de $0,7$ présentée.
Sachant que pour déterminer $P(Y\geq4)$ il faut calculer :
$1-P(Y\leq3)$ $=$ $1-P(Y=0)-P(Y=1)-P(Y=2)-P(Y=3)$
$=$ $1-0,8^{26}-26\times0,2\times0,8^{25}-325\times0,2^4\times0,8^{24}$.
On peut estimer que, sans calculatrice, en effectuant diverses approximations pour gagner du temps, on puisse trouver $0,7$ à la place de $0,79$. Ainsi Poincaré semble plus parler d'au moins $4$ coïncidences plutôt que d'exactement $4$ coïncidences. Probabilités conditionnelles Poincaré affirme ensuite que de constaster que la réalisation d'un événement élémentaire qui possède une faible probabilité, n'est pas une preuve de modification de la situation.
Il évoque l'exemple d'une loterie où sortirait le numéro 25, qui nécessairement possède une faible probabilité qui la même pour tous les numéros. La personne gagnante avec le numéro 25 n'est bien sûr pas une tricheuse.
Il explique donc que Bertillon fait une erreur grossière en usant de tels arguments probabilistes et qu'il aurait dû calculer des probabilités conditionnelles.
Reprenons la partie du rapport suivante :

« Pour pouvoir calculer, d'après un évènement constaté, la probabilité d'une cause, il nous faut donc plusieurs données :
  1. Il faut savoir quelle était à priori, avant l'évènement, la probabilité de cette cause.
  2. Il faut savoir ensuite quelle serait pour chacune des causes possibles, la probabilité de l'évènement constaté. (C'est ainsi que dans l'exemple cité il faut connaître la composition des urnes). »
Poincarré décrit ici une situation de probabilité conditionnelle où la « cause » serait un évènement $A$ et « l'évènement constaté » un autre que l'on note $B$.


Traduisons les phrases de l'extrait à l'aide de nos notations.
« Pour pouvoir calculer, d'après un évènement constaté, la probabilité d'une cause », on cherche $P_B(A)$.
« Il faut savoir quelle était à priori, avant l'évènement, la probabilité de cette cause », on doit connaître $P(A)$.
« Il faut savoir ensuite quelle serait pour chacune des causes possibles, la probabilité de l'évènement constaté. », il faut connaître $P_A(B)$.

D'après nos formules nous avons :
$P_B(A)$ $=$ $\dfrac{P(A\cap B)}{P(B)}$
$=$ $\dfrac{P(A)P_A(B)}{P(B)}$.
Poincaré évoque plusieurs causes possibles donnant $B$, c'est-à-dire en fait qu'il peut y avoir plusieurs causes $A_1$, $A_2$, $\dots$, $A_n$, avec par exemple $A_1=A$ et $n\in\mathbb{N}^*$.
D'après la formule des probabilités totales nous avons : $\displaystyle{P(B)=\sum_{k=1}^nP(A_k)P_{A_k}(B)}$ et la formule qu'évoque Poincaré est donc : $$P_B(A)=\dfrac{ P(A)P_A(B) } { \sum_{k=1}^n P(A_k)P_{A_k}(B) }.$$ Formule qui est appellée formule de Bayes dans la littérature des probabilités.