CRITIQUE DES ECHELLES DEVALUATION
DE LA SCLEROSE EN PLAQUES
LE POINT DE VUE DU NEUROLOGUE
Pr Etienne Roullet, Dr Pierre Le Canuet, Dr Dominique Pez, Dr Olivier Heinzlef
Lévaluation des diverses composantes du handicap causé par la Sclérose en Plaques (SEP) est nécessaire au cours du suivi clinique, des études épidémiologiques et économiques, et surtout des essais thérapeutiques (15). La multiplication de ces derniers a dailleurs conduit à dimportants progrès méthodologiques dans ce domaine. La redécouverte des troubles cognitifs dûs à la SEP, la prise en compte du symptôme le plus fréquent, la fatigue, lapparition de la notion si mal définie de "qualité de vie", enfin la commercialisation des premiers traitements de fond ont plus récemment fait naître de nouveaux impératifs. Bien que des échelles simples, axées sur la marche comme celle de Mac Alpine, aient été employées dès le début des années 50, lhistoire de lévaluation du handicap fonctionnel dans la sclérose en plaques (SEP) se confond avec le nom de Kurtzke : Disability Status Scale (1955), Systèmes Fonctionnels (1961), Expanded Disability Status Scale (EDSS, 1983). Cette dernière échelle est très utilisée, mais aussi très critiquée (Kurtzke, 1989), et de multiples autres échelles ont été proposées (tableau 1), dont les qualités et défauts ont donné lieu à de nombreuses réunions consacrées à la recherche de léchelle idéale (tableau 2). Plutôt que de détailler ces différents outils (9), nous prendrons pour exemple léchelle de Kurtzke, la plus connue et la mieux étudiée, avant denvisager les sujets qui prêtent encore à discussion dans ce domaine.
Léchelle de Kurtzke LEDSS a été élaborée à partir des observations cliniques de John F. Kurtzke, neurologue américain, danciens combattants de la 2ème guerre mondiale, qui avaient contracté leur maladie pendant leur service actif. Le principe en est simple : lexamen neurologique est divisé en 8 Systèmes Fonctionnels (SF), 4 majeurs (pyramidal, cérébelleux, sensitif, tronc cérébral) et 4 mineurs (sphincters, vision, "cérébral", autres). Un score chiffré (de 0 à 6 ou 7, de sévérité croissante) est donné par le plus souvent par l'examen, mais parfois par linterrogatoire seulement. Chaque niveau du score est défini par une courte phrase, voire par un seul adjectif. Le score global se mesure sur une échelle en 20 points (de 0 à 10 par demi-points). Jusquau niveau 3.5, le score obtenu dans chaque SF et le nombre de SF atteints déterminent automatiquement le score EDSS. De 4.0 à 7.0, la définition de chaque niveau est aussi donnée par lincapacité de marche (périmètre, aides) ; ce double système de cotation est parfois source de discordances. Les déterminants du score final de lEDSS varient ainsi selon celui-ci : de 0 à 3,5, il sagit avant tout des signes dexamen, de 4.0 à 6.5, de la marche ; au-delà de 7.0, lEDSS évalue lincapacité des membres supérieurs, et aux niveaux les plus élevés la fonction bulbaire. La contribution des SF au score global varie selon le niveau : ainsi chez un patient dont lEDSS est de 3.5, sans signe cérébelleux, lapparition dun syndrome cérébelleux dintensité modérée (SF de niveau 3) ne modifie pas le score EDSS. La sensibilité de léchelle (capacité à détecter en un temps relativement court une variation cliniquement significative) est faible et varie selon le niveau. Ainsi dans les études dhistoire naturelle de la SEP, le temps passé à chaque niveau varie dans un rapport de 1 à 3, et la courbe de répartition des patients est bimodale. Le caractère ordinal (et non linéaire) de lEDSS ne permet pas dutiliser de test statistiques simples (comme les moyennes). Les concordances inter- et intra-observateur, pour l'examen dun même patient dans des conditions prédéterminées, sont variables. Lagrément parfait entre deux observateurs varie selon les études entre 10 et 69 % ; il est plus important pour les niveaux dEDSS les plus élevés. Pour les scores 1.0 à 3.5, la concordance intra-observateur dépasse 90% (agrément à 0.5 points).Tous ces inconvénients ont conduit au cours des 20 dernières années à deux attitudes opposées qui parfois se rejoignaient dans certains essais thérapeutiques : la mise en point de nouvelles échelles, et lutilisation, malgré tout et avec des aménagements, de lEDSS. En effet cette échelle a fini par devenir familière aux neurologues, et tous reconnaissent sa facilité dutilisation. Elle permet des comparaisons simples mais robustes pour le suivi longitudinal des patients et entre séries différentes. Ainsi le temps mis par les patients pour atteindre certains niveaux-clés (4.0, 6.0 ou 7.0) varie peu selon les études. LEDSS peut être utilisé dans les essais thérapeutiques à condition de tenir compte de ses faiblesses et dy remédier : évaluation préalable de la variabilité inter- et intra-observateur pour la catégorie de patients inclus, harmonisation des conditions de passation et formation des examinateurs, utilisation de méthodes statistiques appropriées, comme lanalyse par courbes de survie du délai daggravation du score EDSS.
Faut-il de nouvelles échelles ? La multiplicité des échelles existantes fait que cette question mérite dêtre posée : une meilleure connaissance et une utilisation adaptée au but recherché des échelles connues permettent le plus souvent de répondre à la question posée.En pratique clinique quotidienne, suivi longitudinal de patients dans le cadre dune consultation de neurologie, spécialisée ou non dans la prise en charge des patients atteints de SEP, lEDSS et une échelle dincapacité dont le choix dépend des habitudes de chacun sont habituellement employées. Il est facile en effet de déterminer le score EDSS daprès lexamen et linterrogatoire du patient sur sa marche. Cependant lestimation par les patients (et par leur médecin) de distances courantes et supposées être connues est très variable... (7).
Des auto-questionnaires dont la concordance avec lEDSS est satisfaisante sont validés pour les études épidémiologiques (11). Plusieurs échelles de qualité de vie, génériques ou dérivées de celles-ci, ont été employées dans des études récentes (3) ; elles paraissent satisfaisantes, bien que certaines soient encore incomplètement validées (11).
Dans le cadre du bilan et du suivi de la rééducation, dont lintérêt a été récemment démontré (1), le choix se fait entre plusieurs échelles, génériques ou non.
Le principal sujet de discussion concerne les essais de traitements de fond. Dans les formes rémittentes, la fréquence moyenne des poussées et le handicap fonctionnel, mesuré par lEDSS, avec ou sans imagerie par résonance magnétique, ont permis la commercialisation récente des premiers traitements de fond (cf article O. Heinzlef et Coll. dans ce même numéro). Dans les formes progressives, où seul linterféron ß1-b) a montré une certaine efficacité, le choix du critère principal de jugement est primordial. Le niveau de handicap (EDSS) des patients inclus est habituellement de 3.0 à 6.5, zone dans laquelle la faible sensibilité et la restriction (topographique et fonctionnelle) de lEDSS posent des difficultés. Ladjonction dautres échelles (Index Ambulatoire) permet daccroître la sensibilité et daugmenter le champ du handicap mesuré (comme le "Nine-Hole-Peg Test" (9-HPT), ou le Box-and-Block-Test (BBT) évaluant lincapacité des membres supérieurs). Néanmoins, le choix du critère principal de jugement des essais thérapeutiques reste un problème non résolu dans ces formes évolutives, doù lapparition d"échelles composites" (12).
Un groupe de travail composé de cliniciens (spécialistes de lhistoire naturelle de la SEP, des essais thérapeutiques ou des troubles cognitifs), de statisticiens, et de représentants des firmes pharmaceutiques a publié récemment une partie de ses conclusions (6). Ce groupe a analysé les données-source de 15 études utilisant lEDSS et dautres échelles dans 4 domaines de handicap (membres inférieurs et supérieurs, vision, troubles cognitifs), et a vérifié la validité et la pertinence de ces échelles par rapport à lEDSS. Aucune autre échelle, prise isolément, ne peut remplacer lEDSS, et toute nouvelle échelle doit comporter des composantes mesurant différents domaines. Plus précisément, après analyse de 4 études portant avant tout sur des formes progressives une échelle composite faite de 3 sous-échelles a été proposée. Les scores chiffrés obtenus aux "Timed Ambulation Index" (temps mis pour franchir une distance de 25 pieds), "Nine-Hole-Peg-Test", et au PASAT (Paced Auditory Serial Addition Test, version 3) sont combinés en un "z-score" global statistiquement lié au score EDSS. Cette échelle ne comporte pas de mesure de la vision, et les conclusions prudentes du groupe de travail sont dévaluer précisément les qualités de cette nouvelle échelle en fonction des différents niveaux de handicap et en référence à lEDSS. La validation pourrait être faite en utilisant cette échelle composite comme critère secondaire de jugement dans les prochains essais thérapeutiques.
Conclusion La mise au point de nouvelles échelles ne peut se faire sans référence constante aux buts dans lesquels elles sont construites. A cet égard, quelques points doivent être soulignés. Lanalyse statistique doit utiliser des outils adaptés ; le "Timed Ambulation", par exemple, est plus sensible que lEDSS et que lIndex Ambulatoire, mais dimportantes variations du score sont observées pour un même niveau dEDSS (8). Les essais thérapeutiques sont parfois décalés, à lusage, de la pratique clinique. Ainsi en est-il du méthotrexate, utilisé depuis 1995 à la suite des résultats prometteurs dun essai où le critère principal de jugement était une échelle composite comprenant, outre lEDSS, lIndex Ambulatoire, le 9 HPT et le BBT. Surtout, la perception des patients et des médecins de lincapacité physique liée à la SEP peut-être très différente, comme la montré une étude récente du "British Medical Journal" (4).| Tableau 1 : Liste des principales échelles
utilisées dans SEP, classées par domaine 1 - Déficit/déficience
2 - Incapacité
3 - Handicap
4 - Autres
|
| Tableau 2 : Qualités de l'échelle idéale 1 - Sensibilité : Capacité de détecter une évolution de la maladie sur un intervalle de temps relativement court. 2 - Fiabilité : utilisation de critères objectifs, bonne reproductibilité inter- et intra-observateur. 3 - Validité : mesure du déficit causé directement par la maladie, de lincapacité cliniquement pertinente. 4 - Pertinence clinique : les composantes de léchelle reflètent les dimensions principales de la sclérose en plaques (en évitant les mesures redondantes). 5 - Application possible à toute létendue du déficit, absence deffet-plafond. 6 - Facilité et rapidité dadministration. 7 - Bon rapport qualité/coût. 8 - Echelle chiffrée et linéaire. |
Références
1 Freeman JA., Langdon DW, Hovart JC., Thompson AJ. The impact of in patient rehabilitation on progressive multiple sclerosis. Ann Neurol, 1997 ; 42 : 236-244.
2 Kurtzke JF. The Disability Status Scale for multiple sclerosis. Apologia pro DSS sua. Neurology, 1989 ; 39 : 291-302.
3 Murphy N., Confavreux C., Haas J., König, Roullet E., Sailer M., Swash M., Young C., the "Cost of Multiple Sclerosis Study Group", Mérot J-L. Quality of life in Multiple Sclerosis in France, Germany and the UK. J. Neurol. Neurosurg. Psychiatr.,1998 ; 65 : 460-466.
4 Rothwell PM, Mc Dowell A, Young CK, Dorman PJ. Doctors and patients dont agree: cross sectional study of patients and doctors perceptions and assessment of disablity in multiple sclerosis. Br Med J, 1997 ; 314 : 1580-3.
5 Roullet E,. Basque V, Coste M et al. Echelle Minimale dInvalidité (MRD) et SEP. Résultats de létude de 200 patients. Rev. Neurol., 1988 ; 144 : 805-816.
6 Rudick R et al. Recommendations from the National Multiple Sclerosis Society Clinical Outcomes Assessment Task Force. Ann Neurol, 1997 ; 42 : 379-382.
7 Sharrack B, Hughes RAC. Reliability of distance estimation by doctors and patients : cross sectional study. Br Med J, 1997 ; 315 : 1652-4.
8 Schwid SR, Goodman AD, Mattson DH et al. The measurement of ambulatory impairment in multiple sclerosis. Neurology, 1997 ; 49 : 1419-1424.
9 Thompson AG. Measurement in Multiple Sclerosis. In: "MS Management", AJ Thompson ed., 1995 , 2 : 4-5, IFMSS, London.
10 Verdier-Taillefer M-H., Roullet E., Cesaro P., Alperovitch A. Validation of self-reported neurological disablity in multiple sclerosis. Int J Epidemiol, 1994 ; 23 : 148-154.
11 Vernay D, Gerbaud L, Biolay S, Clavelou P. Pain, multiple sclerosis and health-related quality of life questionnaire. Multiple Sclerosis 1998 ; 4 : 311.
12 Whitaker JN, McFarland HF, Rudge P, Reingold SC. Outcomes assessment in multiple sclerosis clinical trials: a critical analysis. Multiple Sclerosis, 1995 ; 1 : 37-47.
Consultation Spécialisée "Sclérose en Plaques"
Service de Neurologie - Hôpital Tenon
4 rue de La Chine 75020 Paris.
Email: etienne.roullet@tnn.ap-hop-paris.fr
[Document émis le 09/03/2000]
Copyright ANMSR
retour page d'accueil ANMSR