Un score IPSS modifié : valeur d'un choix de réponses qualitatif

08 juillet 2006

Mots clés : IPSS, Troubles urinaires, Questionnaires, miction.
Auteurs : PERRIN P., NEMOZ C., PAPAREL P., RUFFION A
Référence : Prog Urol, 2006, 16, 2, 168-173
Introduction : Le score IPSS est un auto-questionnaire reconnu comme l'instrument de référence pour évaluer l'impact des troubles mictionnels du bas appareil urinaire de l'homme. Les patients peuvent avoir des difficultés à répondre aux intitulés standard du questionnaire. Cette étude a pour but d'analyser si la modification de ces items "standards" (ou numériques, N) par des choix de réponses littérales (L) entraïne des modifications des caractéristiques psychométriques du questionnaire IPSS.
Matériel et méthodes : L'étude monocentrique prospective a comparé les deux questionnaires appliqués dans le même ordre à une cohorte de 109 patients souffrant de troubles mictionnels. Ces questionnaires ont été donnés aux patients à deux reprises après un intervalle de 15 jours.
Résultats : Le coefficient alpha de Cronbach calculé à J0 était de 0,78 (L) et 0.81 (N). Les coefficients de corrélation (Pearson entre les deux scores IPSS à J0 et J15 étaient élevés (0,89 et 0,95)). La comparaison des questionnaires N et L montre une moyenne de différence des scores de -0.25 avec intervalle normal de fluctuation [-7.6 ; 7.1] à J0, respectivement -0.89 [-6.3 ; -4.5] à J15. Le test-retest au 15ème jour montre une bonne corrélation pour les deux questionnaires (0.87 pour N et 0.85 pour L).
Conclusion : La modification des choix de réponses du questionnaire IPSS que nous proposons n'altère pas ses qualités psychométriques. Les patients semblent préférer la version "littérale" du questionnaire par rapport au questionnaire standard : 62% contre 31%.

Le score IPSS est un auto-questionnaire structuré et validé qui évalue les troubles mictionnels du bas appareil urinaire. Introduit dans les années 90, il s'est imposé comme l'instrument de mesure de la réponse au traitement des troubles mictionnels du bas appareil urinaire en particulier ceux associés à l'hypertrophie bénigne de la prostate [1, 2].

Son utilisation est parfois difficile du fait des problèmes de compréhension rencontrés par les patients tant au niveau des questions que des choix de réponses [3, 4]. Ceci explique peut-être pourquoi le score IPSS n'est pas systématiquement utilisé lors du bilan clinique [5].

Les options de réponses aux questions de l'IPSS sont exprimées en fréquence et nous avons constaté, lors d'une utilisation en routine du questionnaire, que parmi les 6 possibilités, 3 d'entre elles posaient problèmes : "moins d'une fois sur 5", "moins d'une fois sur 2", et "plus d'une fois sur 2". Par contre les autres : "jamais", "environ 1 fois sur 2", "presque toujours", étaient facilement comprises.

Pour faciliter la réponse au questionnaire, nous avons remplacé les choix de réponses qui posaient problèmes par "rarement", "quelquefois" et "souvent". Ce questionnaire modifié par des choix de réponses littérales (IPSS littéral : L) a été comparé au questionnaire standard (IPSS numérique : N). Nous avons évalué si cette modification facilitait la réponse des patients et nous avons vérifié les caractéristiques psychométriques de cette nouvelle version.

Matériel et méthode

La population d'étude correspond aux patients qui se sont présentés à la consultation d'urologie et qui étaient volontaires pour cette étude. Une cohorte de 109 patients souffrant de troubles mictionnels du bas appareil, associés à une pathologie prostatique, a d'abord rempli le questionnaire modifié dont le choix de réponse est qualitatif (Questionnaire littéral : annexe 1) puis le questionnaire standard dont le choix de réponse est en fréquence de symptômes (Questionnaire numérique : annexe 2).

A l'issue de la présentation des deux questionnaires à J0, le patient devait désigner celui qui était le plus facile à répondre (Enquête sur la facilité à répondre aux questionnaires : annexe 3).

Par ailleurs, 15 jours plus tard (J15), les mêmes patients devaient remplir de nouveau les questionnaires (L) et (N) dans le but d'étudier la reproductibilité de chaque version (test-retest).

Analyse statistique

L'étude statistique a été réalisée en plusieurs étapes : description de la population, puis évaluation des réponses aux questionnaires.

Pour chaque questionnaire, les réponses à chacun des 7 items et le score global ont été analysés et décrits avec des graphiques, puis comparés avec un test t de Student pour données appariées. La reproductibilité de chaque questionnaire a été étudiée entre J0 et J15. Les 2 types de questionnaires ont été comparés à J0, puis à J15.

La cohérence interne de chacun des 2 questionnaires a été mesurée avec le coefficient alpha de Cronbach : ce coefficient, compris entre 0 et 1, indique une bonne cohérence interne lorsqu'il est égal ou supérieur à 0.7. La stabilité de chaque questionnaire a été mesurée avec le coefficient de corrélation de Pearson pour les réponses à chaque item et le score, entre les résultats obtenus à J0 et à J15. La cohérence externe entre le questionnaire littéral et le questionnaire numérique a été mesurée également avec le coefficient de corrélation de Pearson à J0, puis à J15.

La corrélation étant forte dans tous les cas, la concordance entre les questionnaires a été ensuite évaluée selon la méthode de Bland et Altman [3, 4] qui analyse la différence des scores en fonction de la moyenne des 2 scores et calcule l'intervalle normal de fluctuation autour de la moyenne des différences (md ± 2 sd à 95%). Un graphique permet de situer les points dans cet intervalle et de mettre en évidence les possibles valeurs éloignées

Résultats

Les caractéristiques démographiques de cette population sont présentées dans le Tableau I.

Les scores observés à partir des questionnaires numériques et littéraux à J0 et à J15 sont habituels chez les hommes se plaignant de troubles mictionnels (Tableau II).

Le coefficient alpha de Cronbach calculé à J0 est 0.78 (L) et 0.81 (N), indiquant une bonne cohérence interne de chaque questionnaire. Les coefficients de corrélation (Pearson) entre les 2 scores IPSS, 0.89 (à J0) et 0.95 (à J15) sont très significatifs (p < 0.0001) (Tableau III).

La comparaison à J0 entre le questionnaire numérique et littéral montre une moyenne des différences des scores (N-L) de -0.25 et une fluctuation dont les bornes à 95% sont -7.6 et 7.1 (Tableau V). La distribution des différences entre les scores en fonction de la moyenne des 2 scores est présentée dans la Figure 1.

Figure 1 : Concordance à J0 des scores IPSS standard (N) et modifié (L).

La comparaison à J15 entre le questionnaire numérique et littéral montre une moyenne des différences des scores (N-L) de -0.89 et une fluctuation dont les bornes à 95% sont -6.3 et 4.5 (Tableau V). La distribution des différences entre les scores en fonction de la moyenne des 2 scores est présentée dans la figure 2.

Figure 2 : Concordance à J15 des scores IPSS standard (N) et modifié (L).

La reproductibilité est étudiée par le test-retest au 15ème jour. Le coefficient de corrélation (Pearson) entre les scores IPSS à J0 et J15 est 0.87 (p<0.0001) pour le questionnaire standard (N) et 0.85 (p<0.0001) pour le questionnaire modifié (L) (Tableau IV). La distribution de la différence de ces 2 scores est présentée dans le Tableau V et par les Figures 3 et 4. Les différences moyennes de 0.51 (Q. standard) et 0.16 (Q modifié) ne sont pas significatives (Tableau V).

Figure 3 : Variabilité entre J0 et J15 du score IPSS standard (N).
Figure 4 : Variabilité entre J0 et J15 du score IPSS modifié (L).

L'enquête auprès des patients confirme que 62% (parmi les 94 qui y ont répondu) ont préféré le questionnaire modifié (L), 7% n'ont pas de préférence et 31 % ont préféré le questionnaire standard (N) (Tableau VI).

Discussion

Le coefficient alpha de Cronbach confirme tant à J0 qu'à J15 que le changement dans les choix de réponses n'a pas modifié la cohérence interne du questionnaire. Ces valeurs élevées (supérieures à 0.70) autorisent l'utilisation du questionnaire pour une application clinique [3, 4]. Des valeurs similaires sont retrouvées sont dans la littérature (Cronbach a = 0.86 [1] 0.74 [6]).

Lors de la consultation initiale, l'utilisation du questionnaire modifié amène trois commentaires :

- Il n'y a pas de différence de réponse en moyenne entre les deux questionnaires. La différence moyenne de 0.25 est non significative. Ce qui permet d'envisager la substitution d'un questionnaire par l'autre dans le cadre d'étude de population.

- La fluctuation (à 95%) de la différence des scores individuels entre le questionnaire standard et le questionnaire modifié (-7.6 à + 7.1) montre qu'il est préférable de maintenir la même version du questionnaire pour un même patient, le long de son histoire clinique. Cette variation peut s'expliquer peut être par la répétition du test dans le temps puisque son étendue est similaire à la fluctuation générée par le test retest au 15ème jour.

L'enquête montre que deux tiers des patients ont préféré le questionnaire littéral. Il correspond sans doute mieux à la culture de la population française. En particulier, les patients ont du mal à comprendre le choix de réponse "moins d'une fois sur 5".

Dans la mesure où environ 30% des patients présentent des problèmes de compréhension du score IPSS [3, 4, 6-9], toute amélioration dans ce domaine doit être considérée comme positive. La validation linguistique du score IPSS obéit à des règles strictes et est disponible dans de nombreuses langues [2, 6, 10-13]. Cependant, malgré les efforts de validation, les incompréhensions culturelles persistent et nécessitent soit le recours à une aide extérieure [3, 4] soit à des programmes éducatifs [3]. L'originalité de notre étude consiste à améliorer la formulation des réponses afin que le score IPSS reste un auto-questionnaire facilement utilisable par les patients.

L'étude comparative des 2 questionnaires au 15ème jour confirme les données obtenues lors du bilan initial. Ces résultats peuvent servir, en quelque sorte, de validation interne de l'étude au temps 0.

Enfin, les test-retests obtenus pour les deux questionnaires entre J0 et J15 sont particulièrement intéressants. Les coefficients de corrélations sont r = 0.85 (L) et r = 0.87 (N) et confirment les données de la littérature (r = 0.92 [1]) (r = 0.76 [3,4]).

Les bornes des intervalles de fluctuation (à 95%) de la différence des scores, sont pour l'IPSS standard - 8.1 à 7.8 et pour l'IPSS modifié - 8.5 à 7.5. Les graphiques de dispersion (Figures 1 à 4) permettent de quantifier avec précision l'écart type des différences et l'absence de relation entre la différence moyenne et la moyenne des 2 scores (biais systématique). Des résultats similaires sont décrit dans la littérature : différence moyenne à 30 jours de -1.0 ± 3.8 (intervalle de fluctuation : - 8.6 à 6.6 ; étendue : -10 à +14 ) [15]. La dispersion de certains points explique la grande prudence qu'il faut avoir lorsque l'on veut juger d'une réponse thérapeutique à l'échelle individuelle. La répétition de la mesure diminue la variation intra individuelle et peut faciliter l'interprétation [15].

Si on rapporte l'étendue de la variation au nombre de questions, on constate qu'à 15 jours d'intervalle la variation moyenne pour une question est de ± 1 point sur une échelle de 5 points. Cette variation est somme toute modeste même si l'on n'en connaït pas sa signification clinique.

Le format de notre étude permet de vérifier que le changement des choix de réponses maintient les caractéristiques psychométriques (cohérence interne, reproductibilité) du questionnaire et que dans le même temps ce changement est préféré par les patients. Par contre nous n'avons pas démontré que ce changement s'accompagnait d'une amélioration de la compréhension par les patients. Enfin l'ordre de passage des questionnaires n'a pas fait l'objet d'une étude.

Conclusion

La modification des choix de réponses du questionnaire IPSS, qui sont habituellement présentés en terme de fréquence par des choix de réponses qualitatifs, n'altère pas ses qualités psychométriques. Par ailleurs cette modification est considérée par 62% des patients comme plus facile à répondre.

Remerciements : Nous remercions Michèle Canova pour son aide dans la réalisation de ce travail.

Références

1. Barry M.J., Fowler F.J., Jr., O'Leary M.P., Bruskewitz R.C., Holtgrewe H.L., Mebust W.K., Cockett A.T. : The American Urological Association symptom index for benign prostatic hyperplasia. The Measurement Committee of the American Urological Association. J. Urol., 1992 ; 148 : 1549-1557.

2. Sagnier P.P., Richard F., Botto H., Teillac P., Dreyfus J.P., Boyle P. : Adaptation et validation en langue française du score international des symptômes de l'hypertrophie bénigne de la prostate. Prog. Urol., 1994 ; 4: 532-538.

3. van Schaik P., Ahmed T., Suvakovic N., Hindmarsh J.R. : Effect of an educational multimedia prostate program on the International Prostate Symptom Score. Eur. Urol., 1999 ; 36 : 36-39.

4. Pupca G., Patard J.J., Ziade J., Guiraud P., Lobel B., Guille F.: Les scores symptômes : que décrivent-ils exactement ? Prog. Urol., 2000 ; 10 : 561-567.

5. de la Taille A., Desgrandchamps F., Saussine C., Lukacs B., Haillot O. : Les urologues appliquent-ils les recommandations sur la prise en charge de l'hyperplasie bénigne de la prostate ? Enquête sur les modalités de prescription des examens complémentaires en France. Prog. Urol., 2004 ; 14 : 320-325.

6. Lujan Galan M., Paez Borda A., Martin Oses E., Llanes Gonzalez L., Berenguer Sanchez A. : The validity of the IPSS questionnaire in a sample of 262 patients with benign prostatic hyperplasia. Arch. Esp. Urol., 1997 ; 50 : 847-853.

7. Netto Junior N.R., de Lima M.L.: The influence of patient education level on the International Prostatic Symptom Score. J Urol., 1995 ; 154 : 97-99.

8. Rodrigues Netto N., Jr., de Lima M.L., de Andrade E.F., Apuzzo F., da Silva M.B., Davidzon I.M., Moises M.J., Chamma E.J., Bogado H. : Latin American study on patient acceptance of the International Prostate Symptom Score (IPSS) in the evaluation of symptomatic benign prostatic hyperplasia. Urology, 1997 ; 49 : 46-49.

9. Cam K., Senel F., Akman Y., Erol A.: The efficacy of an abbreviated model of the International Prostate Symptom Score in evaluating benign prostatic hyperplasia. BJU Int., 2003 ; 91 : 186-189.

10. Badia X, Garcia-Losa M., Dal-Re R. : Ten-language translation and harmonization of the International Prostate Symptom Score: developing a methodology for multinational clinical trials. Eur. Urol., 1997 ; 31: 129-140.

11. Homma Y., Tsukamoto T., Yasuda K., Ozono S., Yoshida M., Shinji M. : Linguistic validation of Japanese version of International Prostate Symptom Score and BPH impact index. Nippon Hinyokika Gakkai Zasshi, 2002 ; 93 : 669-680.

12. Savchenko N.E., Skobeius I.A., Oliferko S.A., Ol'man V.E., Tataritskii O.L. : The establishment of the I-PSS in the CIS countries taking into account its cultural and linguistic features. International Prostate Symptom Score. Urol Nefrol (Mosk)1997 ; 26-27.

13. Shi J., Sun Z., Cai T., Yang L. : Development and validation of a quality-of-life scale for Chinese patients with benign prostatic hyperplasia. BJU Int., 2004 ; 94 : 837-844.

14. Bland J.M. and Altman D.G. : Statistical methods for assessing agreement between two methods of clinical measurement. Lancet. 1986 ; 1 : 307-310.

15. Barry M.J., Girman C.J., O'Leary M.P., Walker-Corkery E.S., Binkowitz B.S., Cockett A.T. and Guess H.A. : Using repeated measures of symptom score, uroflowmetry and prostate specific antigen in the clinical management of prostate disease. Benign Prostatic Hyperplasia Treatment Outcomes Study Group. J. Urol., 1995 ; 153 : 99-103.