CRITIQUE DES ECHELLES D’EVALUATION

DE LA SCLEROSE EN PLAQUES

LE POINT DE VUE DU NEUROLOGUE

Pr Etienne Roullet, Dr Pierre Le Canuet, Dr Dominique Pez, Dr Olivier Heinzlef

 

L’évaluation des diverses composantes du handicap causé par la Sclérose en Plaques (SEP) est nécessaire au cours du suivi clinique, des études épidémiologiques et économiques, et surtout des essais thérapeutiques (15). La multiplication de ces derniers a d’ailleurs conduit à d’importants progrès méthodologiques dans ce domaine. La redécouverte des troubles cognitifs dûs à la SEP, la prise en compte du symptôme le plus fréquent, la fatigue, l’apparition de la notion si mal définie de "qualité de vie", enfin la commercialisation des premiers traitements de fond ont plus récemment fait naître de nouveaux impératifs. Bien que des échelles simples, axées sur la marche comme celle de Mac Alpine, aient été employées dès le début des années 50, l’histoire de l’évaluation du handicap fonctionnel dans la sclérose en plaques (SEP) se confond avec le nom de Kurtzke : Disability Status Scale (1955), Systèmes Fonctionnels (1961), Expanded Disability Status Scale (EDSS, 1983). Cette dernière échelle est très utilisée, mais aussi très critiquée (Kurtzke, 1989), et de multiples autres échelles ont été proposées (tableau 1), dont les qualités et défauts ont donné lieu à de nombreuses réunions consacrées à la recherche de l’échelle idéale (tableau 2). Plutôt que de détailler ces différents outils (9), nous prendrons pour exemple l’échelle de Kurtzke, la plus connue et la mieux étudiée, avant d’envisager les sujets qui prêtent encore à discussion dans ce domaine.

L’échelle de Kurtzke

L’EDSS a été élaborée à partir des observations cliniques de John F. Kurtzke, neurologue américain, d’anciens combattants de la 2ème guerre mondiale, qui avaient contracté leur maladie pendant leur service actif. Le principe en est simple : l’examen neurologique est divisé en 8 Systèmes Fonctionnels (SF), 4 majeurs (pyramidal, cérébelleux, sensitif, tronc cérébral) et 4 mineurs (sphincters, vision, "cérébral", autres). Un score chiffré (de 0 à 6 ou 7, de sévérité croissante) est donné par le plus souvent par l'examen, mais parfois par l’interrogatoire seulement. Chaque niveau du score est défini par une courte phrase, voire par un seul adjectif. Le score global se mesure sur une échelle en 20 points (de 0 à 10 par demi-points). Jusqu’au niveau 3.5, le score obtenu dans chaque SF et le nombre de SF atteints déterminent automatiquement le score EDSS. De 4.0 à 7.0, la définition de chaque niveau est aussi donnée par l’incapacité de marche (périmètre, aides) ; ce double système de cotation est parfois source de discordances. Les déterminants du score final de l’EDSS varient ainsi selon celui-ci : de 0 à 3,5, il s’agit avant tout des signes d’examen, de 4.0 à 6.5, de la marche ; au-delà de 7.0, l’EDSS évalue l’incapacité des membres supérieurs, et aux niveaux les plus élevés la fonction bulbaire. La contribution des SF au score global varie selon le niveau : ainsi chez un patient dont l’EDSS est de 3.5, sans signe cérébelleux, l’apparition d’un syndrome cérébelleux d’intensité modérée (SF de niveau 3) ne modifie pas le score EDSS. La sensibilité de l’échelle (capacité à détecter en un temps relativement court une variation cliniquement significative) est faible et varie selon le niveau. Ainsi dans les études d’histoire naturelle de la SEP, le temps passé à chaque niveau varie dans un rapport de 1 à 3, et la courbe de répartition des patients est bimodale. Le caractère ordinal (et non linéaire) de l’EDSS ne permet pas d’utiliser de test statistiques simples (comme les moyennes). Les concordances inter- et intra-observateur, pour l'examen d’un même patient dans des conditions prédéterminées, sont variables. L’agrément parfait entre deux observateurs varie selon les études entre 10 et 69 % ; il est plus important pour les niveaux d’EDSS les plus élevés. Pour les scores 1.0 à 3.5, la concordance intra-observateur dépasse 90% (agrément à 0.5 points).

Tous ces inconvénients ont conduit au cours des 20 dernières années à deux attitudes opposées qui parfois se rejoignaient dans certains essais thérapeutiques : la mise en point de nouvelles échelles, et l’utilisation, malgré tout et avec des aménagements, de l’EDSS. En effet cette échelle a fini par devenir familière aux neurologues, et tous reconnaissent sa facilité d’utilisation. Elle permet des comparaisons simples mais robustes pour le suivi longitudinal des patients et entre séries différentes. Ainsi le temps mis par les patients pour atteindre certains niveaux-clés (4.0, 6.0 ou 7.0) varie peu selon les études. L’EDSS peut être utilisé dans les essais thérapeutiques à condition de tenir compte de ses faiblesses et d’y remédier : évaluation préalable de la variabilité inter- et intra-observateur pour la catégorie de patients inclus, harmonisation des conditions de passation et formation des examinateurs, utilisation de méthodes statistiques appropriées, comme l’analyse par courbes de survie du délai d’aggravation du score EDSS.

Faut-il de nouvelles échelles ?

La multiplicité des échelles existantes fait que cette question mérite d’être posée : une meilleure connaissance et une utilisation adaptée au but recherché des échelles connues permettent le plus souvent de répondre à la question posée.

En pratique clinique quotidienne, suivi longitudinal de patients dans le cadre d’une consultation de neurologie, spécialisée ou non dans la prise en charge des patients atteints de SEP, l’EDSS et une échelle d’incapacité dont le choix dépend des habitudes de chacun sont habituellement employées. Il est facile en effet de déterminer le score EDSS d’après l’examen et l’interrogatoire du patient sur sa marche. Cependant l’estimation par les patients (et par leur médecin) de distances courantes et supposées être connues est très variable... (7).

Des auto-questionnaires dont la concordance avec l’EDSS est satisfaisante sont validés pour les études épidémiologiques (11). Plusieurs échelles de qualité de vie, génériques ou dérivées de celles-ci, ont été employées dans des études récentes (3) ; elles paraissent satisfaisantes, bien que certaines soient encore incomplètement validées (11).

Dans le cadre du bilan et du suivi de la rééducation, dont l’intérêt a été récemment démontré (1), le choix se fait entre plusieurs échelles, génériques ou non.

Le principal sujet de discussion concerne les essais de traitements de fond. Dans les formes rémittentes, la fréquence moyenne des poussées et le handicap fonctionnel, mesuré par l’EDSS, avec ou sans imagerie par résonance magnétique, ont permis la commercialisation récente des premiers traitements de fond (cf article O. Heinzlef et Coll. dans ce même numéro). Dans les formes progressives, où seul l’interféron ß1-b) a montré une certaine efficacité, le choix du critère principal de jugement est primordial. Le niveau de handicap (EDSS) des patients inclus est habituellement de 3.0 à 6.5, zone dans laquelle la faible sensibilité et la restriction (topographique et fonctionnelle) de l’EDSS posent des difficultés. L’adjonction d’autres échelles (Index Ambulatoire) permet d’accroître la sensibilité et d’augmenter le champ du handicap mesuré (comme le "Nine-Hole-Peg Test" (9-HPT), ou le Box-and-Block-Test (BBT) évaluant l’incapacité des membres supérieurs). Néanmoins, le choix du critère principal de jugement des essais thérapeutiques reste un problème non résolu dans ces formes évolutives, d’où l’apparition d’"échelles composites" (12).

Un groupe de travail composé de cliniciens (spécialistes de l’histoire naturelle de la SEP, des essais thérapeutiques ou des troubles cognitifs), de statisticiens, et de représentants des firmes pharmaceutiques a publié récemment une partie de ses conclusions (6). Ce groupe a analysé les données-source de 15 études utilisant l’EDSS et d’autres échelles dans 4 domaines de handicap (membres inférieurs et supérieurs, vision, troubles cognitifs), et a vérifié la validité et la pertinence de ces échelles par rapport à l’EDSS. Aucune autre échelle, prise isolément, ne peut remplacer l’EDSS, et toute nouvelle échelle doit comporter des composantes mesurant différents domaines. Plus précisément, après analyse de 4 études portant avant tout sur des formes progressives une échelle composite faite de 3 sous-échelles a été proposée. Les scores chiffrés obtenus aux "Timed Ambulation Index" (temps mis pour franchir une distance de 25 pieds), "Nine-Hole-Peg-Test", et au PASAT (Paced Auditory Serial Addition Test, version 3) sont combinés en un "z-score" global statistiquement lié au score EDSS. Cette échelle ne comporte pas de mesure de la vision, et les conclusions prudentes du groupe de travail sont d’évaluer précisément les qualités de cette nouvelle échelle en fonction des différents niveaux de handicap et en référence à l’EDSS. La validation pourrait être faite en utilisant cette échelle composite comme critère secondaire de jugement dans les prochains essais thérapeutiques.

Conclusion

La mise au point de nouvelles échelles ne peut se faire sans référence constante aux buts dans lesquels elles sont construites. A cet égard, quelques points doivent être soulignés. L’analyse statistique doit utiliser des outils adaptés ; le "Timed Ambulation", par exemple, est plus sensible que l’EDSS et que l’Index Ambulatoire, mais d’importantes variations du score sont observées pour un même niveau d’EDSS (8). Les essais thérapeutiques sont parfois décalés, à l’usage, de la pratique clinique. Ainsi en est-il du méthotrexate, utilisé depuis 1995 à la suite des résultats prometteurs d’un essai où le critère principal de jugement était une échelle composite comprenant, outre l’EDSS, l’Index Ambulatoire, le 9 HPT et le BBT. Surtout, la perception des patients et des médecins de l’incapacité physique liée à la SEP peut-être très différente, comme l’a montré une étude récente du "British Medical Journal" (4).

Tableau 1 : Liste des principales échelles utilisées dans SEP,
classées par domaine

1 - Déficit/déficience

Standard Neurological Examination (SNE)
EDSS (Kurtzke, 1983)
Neurological Rating Scale (Sipe, 1984)
Illness Severity Scale (Mickey, 1984)

2 - Incapacité

Ambulation Index (Hauser, 1983)
Timed Ambulation (Schwid, 1997)
EDSS (Kurtzke, 1983)
Nine-Hole-Peg Test (9-HPT)
Box-and-Block-Test (BBT)
Incapacity Status Scale (MRD, 1985)
Index de Barthel
Mesure de l’Indépendance Fonctionnelle (MIF)
Functional Limitation Profile (Hutchinson, 1993)

3 - Handicap

Environmental Status Scale (MRD, 1985)
London Handicap Scale (Harwood, 1994)

4 - Autres

Fatigue : MS Fatigue Severity Scale (Krupp, 1984)
Qualité de Vie : SEP-59 (Vernay, 1998)

 

Tableau 2 : Qualités de l'échelle idéale

1 - Sensibilité : Capacité de détecter une évolution de la maladie sur un intervalle de temps relativement court.

2 - Fiabilité : utilisation de critères objectifs, bonne reproductibilité inter- et intra-observateur.

3 - Validité : mesure du déficit causé directement par la maladie, de l’incapacité cliniquement pertinente.

4 - Pertinence clinique : les composantes de l’échelle reflètent les dimensions principales de la sclérose en plaques (en évitant les mesures redondantes).

5 - Application possible à toute l’étendue du déficit, absence d’effet-plafond.

6 - Facilité et rapidité d’administration.

7 - Bon rapport qualité/coût.

8 - Echelle chiffrée et linéaire.

 

Références

1 • Freeman JA., Langdon DW, Hovart JC., Thompson AJ. The impact of in patient rehabilitation on progressive multiple sclerosis. Ann Neurol, 1997 ; 42 : 236-244.

2 • Kurtzke JF. The Disability Status Scale for multiple sclerosis. Apologia pro DSS sua. Neurology, 1989 ; 39 : 291-302.

3 • Murphy N., Confavreux C., Haas J., König, Roullet E., Sailer M., Swash M., Young C., the "Cost of Multiple Sclerosis Study Group", Mérot J-L. Quality of life in Multiple Sclerosis in France, Germany and the UK. J. Neurol. Neurosurg. Psychiatr.,1998 ; 65 : 460-466.

4 • Rothwell PM, Mc Dowell A, Young CK, Dorman PJ. Doctors and patients don’t agree: cross sectional study of patients’ and doctors’ perceptions and assessment of disablity in multiple sclerosis. Br Med J, 1997 ; 314 : 1580-3.

5 • Roullet E,. Basque V, Coste M et al. Echelle Minimale d’Invalidité (MRD) et SEP. Résultats de l’étude de 200 patients. Rev. Neurol., 1988 ; 144 : 805-816.

6 • Rudick R et al. Recommendations from the National Multiple Sclerosis Society Clinical Outcomes Assessment Task Force. Ann Neurol, 1997 ; 42 : 379-382.

7 • Sharrack B, Hughes RAC. Reliability of distance estimation by doctors and patients : cross sectional study. Br Med J, 1997 ; 315 : 1652-4.

8 • Schwid SR, Goodman AD, Mattson DH et al. The measurement of ambulatory impairment in multiple sclerosis. Neurology, 1997 ; 49 : 1419-1424.

9 • Thompson AG. Measurement in Multiple Sclerosis. In: "MS Management", AJ Thompson ed., 1995 , 2 : 4-5, IFMSS, London.

10 • Verdier-Taillefer M-H., Roullet E., Cesaro P., Alperovitch A. Validation of self-reported neurological disablity in multiple sclerosis. Int J Epidemiol, 1994 ; 23 : 148-154.

11 • Vernay D, Gerbaud L, Biolay S, Clavelou P. Pain, multiple sclerosis and health-related quality of life questionnaire. Multiple Sclerosis 1998 ; 4 : 311.

12 • Whitaker JN, McFarland HF, Rudge P, Reingold SC. Outcomes assessment in multiple sclerosis clinical trials: a critical analysis. Multiple Sclerosis, 1995 ; 1 : 37-47.


Consultation Spécialisée "Sclérose en Plaques"

Service de Neurologie - Hôpital Tenon

4 rue de La Chine 75020 Paris.

Email: etienne.roullet@tnn.ap-hop-paris.fr


[Document émis le 09/03/2000]
Copyright ANMSR

retour page d'accueil ANMSR