Philosophie des essais cliniques (2)

Dans la première partie de ce propos, je reprenais l’article des Carnets de la drôle de guerre dans lequel le philosophe des sciences Adrien Barton répond par l’affirmative à la question essentielle de savoir s’il est légitime d’en passer par de longs essais cliniques même en situation d’urgence. La référence à l’hydroxychloroquine prônée par le Pr Raoult y est explicite.

Cet article renvoie, dans ses références, à deux autres articles publiés sur la plate-forme web medium.com. Le premier, signé par Juliette Ferry-Danini, a fait l’objet d’un large résumé dans la première partie de ce propos. Je passe donc au second papier, signé d’un Maître de Conférence en philosophie des sciences, Cédric Paternotte.

Contre la méthode ?

par Cédric Paternotte

En introduction l’auteur reprend les deux tribunes que le Pr Raoult a fait paraître dans le journal Le Monde. Je n’y reviens pas dans le détail puisque le sujet est largement abordé dans le premier article cité. Le Pr Raoult s’y prononce clairement contre les essais cliniques randomisés, notamment parce qu’il pense que cette méthodologie n’est pas supérieure à d’autres, et aussi parce que, argument habituel des complotistes, ce serait sous la pression des lobbies pharmaceutiques et des « méthodologistes » que les essais randomisés seraient devenus le standard scientifique en médecine. Le Pr Raoult privilégie d’autres méthodes telles que « l’observation anecdotique », qui seraient, selon lui, au moins équivalentes.

Cédric Paternotte indique que, si les essais randomisés sont devenus un standard des études cliniques, c’est pour des raisons claires et précises, à savoir l’identification d’effets réels, et non par goût malsain de la méthodologie, et que la présence d’un groupe contrôle n’est nullement imposée par des méthodologistes procéduriers.

La question qui est posée aux scientifiques est de savoir comment on peut mettre en évidence l’effet causé par un traitement, que nous appellerons « T » par convention (que T soit un médicament ou un traitement d’une autre nature). Ce qui est recherché, c’est un lien de causalité : la prise de T entraîne-t-elle un état différent chez les patients « P » atteints de la même maladie « M » ? Pour évaluer l’effet de T sur un individu P, il faudrait pouvoir comparer ce qui se passerait au même moment chez le même individu P s’il prenait T et s’il ne le prenait pas. Il faudrait pouvoir dédoubler P en deux entités identiques, P1 et P2, et n’administrer T qu’à P1 et pas à P2. On saurait alors que la différence d’état clinique entre P1 et P2 ne serait due qu’à la prise de T.

Cependant on ne peut exclure que l’effet de T sur P ne soit dû à une interaction de T avec une caractéristique particulière de cet individu. Il faut donc pouvoir vérifier, en renouvelant l’expérience un grand nombre de fois avec des individus différents, qu’il y a beaucoup plus d’individus P chez qui T a été efficace que d’individus chez qui T ne l’a pas été.

On comprend aisément que tout cela est impossible de cette façon et qu’il va falloir recourir à un artifice méthodologique, le groupe contrôle.

Dans l’idéal, il faudrait que les deux populations de patients, ceux qui ont reçu T (P1) et ceux qui ne l’ont pas reçu, (P2) soient strictement identiques, ce qui, là encore, est un idéal impossible à atteindre. Mais on peut s’en approcher avec l’artifice du tirage au sort, que l’on appelle la randomisation (d’où l’expression d’essais randomisés). Le tirage au sort permet de distribuer à peu près à égalité dans les deux groupes les caractéristiques des patients, comme le sexe, l’âge, l’origine ethnique, l’appartenance sociale, etc. Bien sûr cette distribution n’est jamais parfaite, il se peut que, sur 200 patients, il y ait 101 femmes et 99 hommes, ou un peu plus de jeunes que de vieux sans que cela n’invalide les résultats de l’essai. Et plus il y a de patients inclus dans l’essai, plus grandes sont les chances que les groupes soient homogènes.

Telle est la définition d’un essai contrôlé randomisé : il compare l’état clinique d’un groupe de patients P1 ayant pris le traitement T à celui d’un autre groupe de patients P2 n’ayant pas reçu le traitement, l’administration de T se faisant par tirage au sort, de manière que les caractéristiques du groupe P1 soient les plus proches possible de celles du groupe P2 (dans la terminologie des essais cliniques, on remplace « groupe » par « bras »).

Les patients ignorent toujours s’ils ont pris ou pas le traitement T, car le fait d’être au courant influencerait l’effet du traitement ou de son absence (effet placebo ou nocebo). C’est la raison pour laquelle leur consentement est toujours indispensable. Si les scientifiques qui mènent l’étude savent quels sont les patients qui ont reçu T, l’essai est dit « en simple aveugle » ; s’ils l’ignorent, il s’agit d’un essai « en double aveugle ».

En l’absence d’un groupe contrôle, comme c’est le cas dans « l’observation anecdotique », le fait de constater que la prise d’un traitement T est associée à un certain taux d’efficacité (le taux de guérison dans le cas du Covid-19 ) ne suffit pas à tirer des conclusions car on ne peut pas savoir ce qui se serait passé si les mêmes patients n’avaient pas reçu le traitement T. Ceci est encore plus vrai quand il s’agit d’une maladie nouvelle comme le Covid-19, dont on ne connaît pas encore avec précision le taux de guérison spontanée ni celui de létalité (nombre de décès chez les patients malades).

La méthodologie des essais randomisés vaut aussi pour les éventuels effets secondaires du traitement, qu’ils soient délétères ou bénéfiques. Le fait que certains effets secondaires du traitement soient bien connus quand il est utilisé dans d’autres pathologies n’implique pas qu’ils seront également constatés dans le cadre du Covid-19.

Un exemple : il semble que la nicotine ait un effet protecteur contre le Covid-19, ce qui n’est constaté pour aucune autre maladie.

Tout ceci tend à démontrer qu’il est inexact d’affirmer, comme le fait le Pr Raoult, que « les essais randomisés ne sont pas supérieurs aux essais observationnels ».

Affirmer la supériorité des essais randomisés sur les essais observationnels ne signifie pas qu’ils soient la seule méthode utilisable en recherche clinique. On a également recours à des essais non randomisés comme les études de cas et les données anecdotiques, qui ne sont ni inutiles ni dénués de valeur scientifique, mais qui donnent un niveau de preuve moins fort que les essais randomisés. C’est ce que les scientifiques appellent la « hiérarchie des données probantes » , qui attribue un « niveau de preuve » supérieur aux essais randomisés sur les autres. Et c’est cette hiérarchie du niveau de preuve, admise par l’ensemble de la communauté scientifique, que réfute le Pr Raoult.

Bien entendu il ne s’agit nullement d’affirmer ici une quelconque perfection des essais randomisés ; ils sont critiquables et critiqués, pour plusieurs raisons que nous allons détailler, en précisant d’emblée que ces critiques s’appliquent aussi à toutes les autres méthodes.

Première critique : les essais randomisés ne sont qu’une approximation d’une situation de test idéale, puisqu’ils reposent sur l’artifice d’un groupe contrôle. Ils ne peuvent donc pas mener à des conclusions absolument certaines. Par rapport aux autres méthodes, il ne s’agit que d’une différence de degré. C’est ce que l’on veut exprimer quand on dit que « la médecine n’est pas une science exacte ».

Les conclusions des essais randomisés ne sont valables que si le groupe testé et le groupe témoin sont suffisamment similaires. Et ils le seront d’autant plus que leurs effectifs seront nombreux. Cet effectif, calculé avant de démarrer l’essai, dépend en grande partie de l’importance de la différence que l’on veut démontrer : plus la différence est faible (par exemple faire passer un taux de guérison de 98% à 99% ), plus il faudra inclure de patients dans chacun des deux groupes. Par ailleurs, un essai contrôlé ne peut répondre qu’à la question posée en préambule. Si cette réponse est négative, les promoteurs de l’étude sont souvent tentés d’apporter quand même une réponse. Mais toute réponse secondaire est a priori dénuée de valeur.

Pour pallier ces limites, on combine parfois les résultats de plusieurs essais randomisés qui peuvent être contradictoires, en « méta-analyses » (analyses d’analyses), ce qui permet d’élargir la base observationnelle.

Deuxième critique : un essai randomisé n’est pas toujours réalisable, que ce soit pour des raisons pratiques ou éthiques. Exemple de raison pratique : il est très difficile de comparer deux types de pansements dans la mesure où ils ne se présentent jamais sous des apparences strictement identiques. Quant aux raisons éthiques, elles sont parfaitement détaillées dans le papier de Juliette Ferry-Danini que je cite largement dans la première partie de ce billet.

Troisième critique : les essais randomisés sont manipulables par des scientifiques qui voudraient favoriser l’obtention d’un certain type de résultats. Là encore cette critique s’applique à toutes les méthodologies, et les scientifiques peu scrupuleux n’utilisent pas que les essais randomisés pour arriver à de telles fins.

Quatrième et dernière critique : le résultat d’un essai randomisé, réalisé nécessairement sur une population donnée (par exemple celle d’un pays ou d’un continent), n’est pas forcément transposable à l’ensemble de la population. Là encore cette limite est valable pour tous les essais, randomisés ou pas.

L’auteur poursuit : « Ce qui compte n’est pas d’utiliser une méthode scientifique menant à des certitudes (une telle méthode n’existe d’ailleurs pas), mais de pouvoir choisir la meilleure parmi celles disponibles, c’est-à-dire la plus à même d’identifier des relations de cause à effet dans un contexte complexe. Les essais randomisés ne sont pas toujours nécessaires et ne sont pas la seule méthode de détection de liens de cause à effet : on n’a effectivement pas besoin d’eux pour déterminer l’effet positif des parachutes. » Cédric Paternotte fait ici à allusion à un exemple pris par le Pr Raoult dans sa tribune.

« Si (…) l’hydroxychloroquine a véritablement un effet causal sur une maladie, alors cet effet devrait être détectable (et quantifiable) par un test randomisé bien mené ; et si un tel test ne détecte pas d’effet notable, alors le poids de ce résultat négatif sera supérieur à celui des résultats (éventuellement négatifs) d’une étude non randomisée. Cette conclusion ne résulte pas d’un dogme arbitraire mais simplement d’une prise en considération de la capacité de telle ou telle méthode expérimentale à plus ou moins identifier des liens de cause à effet. Que toutes les méthodes soient imparfaites n’implique pas qu’elles sont équivalentes. La meilleure façon de procéder consistera à utiliser les diverses méthodes à disposition et à quantifier (ou du moins pondérer) le soutien respectif qu’apportent leurs données à l’hypothèse selon laquelle le traitement (en l’occurrence l’hydroxychloroquine) a une efficacité. »

En outre, dans le cas particulier de l’hydroxychloroquine, il convient de noter que sommes dans une situation où les données observationnelles (non issues de tests contrôlés randomisés) sont équivoques : « En effet, le taux de guérison ou d’amélioration n’est pas sensiblement différent de celui observé par ailleurs dans la population (et d’ailleurs mal connu). Si l’effet est réel mais faible, il ne pourra être détecté qu’à l’issue d’observations nombreuses impliquant un groupe contrôle et par la comparaison de groupes formés de façon randomisée — sans quoi une petite fluctuation d’effet pourrait toujours être attribuée à la composition particulière du groupe observé. »


Cédric Paternotte évoque ensuite le livre du philosophe des sciences Paul Feyerabend, Contre la méthode - Esquisse d’une théorie anarchiste de la connaissance (1975), dans lequel ce philosophe autrichien naturalisé américain défend la théorie de « l’anarchisme épistémologique ». Il fut largement influencé par le grand épistémologue Karl Popper, d’abord en accord avec sa pensée, puis en opposition contre elle.

C’est ce titre, Contre la méthode, que le Pr Raoult a choisi pour son intervention de février 2020 pour s’opposer à une méthode particulière, celle des essais randomisés, alors que « Feyerabend s’opposait à l’idée qu’il existait une méthode unique correcte dans tous les contextes, mais surtout dans la création et l’exploration de théories et le changement scientifique. »


Cédric Paternotte conclut ainsi son papier : « Il n’y a pas de mauvaise façon d’avoir des idées et de proposer des traitements (ce pour quoi ingéniosité, inventivité et originalité sont précieuses) ; quant à leur procurer un soutien empirique, c’est une autre affaire. Les méthodes scientifiques d’obtention de données probantes, pour multiples qu’elles soient, ne se valent pas pour autant ; et c’est leur combinaison pondérée qui mène en général à la plus grande confiance en leurs résultats. Si ce qui nous importe est d’identifier l’effet causal d’un médicament potentiel sur une maladie, alors se fonder sur des données observationnelles simples ou anecdotiques ne conduira qu’à des conclusions dont l’incertitude élevée sapera toute décision politique qui se fonderait sur elles. »


Ma propre conclusion est la suivante : la communauté scientifique a le sentiment que le Pr Raoult ne préconise pas une nouvelle façon de réaliser des essais cliniques, ce qui serait en soi une excellente nouvelle, mais le retour pur et simple à une ancienne façon de procéder qui n’a plus cours depuis longtemps. S’il ne croit pas à l’efficacité des essais randomisés, qu’il propose donc à ses collègues une façon inédite de faire avancer la recherche clinique. En attendant, il n’est pas possible de valider ses conclusions quant à l’efficacité supposée mais non prouvée de l’hydroxychloroquine. Et sa façon de faire n’est pas conforme avec l’éthique médicale, comme l’a très bien démontré Juliette Ferry-Danini.


Paul Feyerabend

Posts récents

Voir tout
Restez informé des nouveaux billets publiés

© Christian Thomsen