SF-36 - Instituto Nacional de Estadistica.

pruebas psicométricas objetivas que incluyen las diferentes categorías .... 2.1 Conceptos básicos: tipos de cuestionarios ..... de 14 países, incluyendo España.
364KB Größe 315 Downloads 68 vistas
ESTADÍSTICA ESPAÑOLA Vol. 50, Núm. 167, 2008, págs. 147 a 192

Aspectos estadísticos del Cuestionario de Calidad de Vida relacionada con salud Short Form–36 (SF-36)(*) por INMACULADA AROSTEGUI MADARIAGA Departamento de Matemática Aplicada y Estadística e Investigación Operativa Universidad del País Vasco UPV/EHU

VICENTE NÚÑEZ-ANTÓN Departamento de Economía Aplicada III (Econometría y Estadística) Universidad del País Vasco UPV/EHU

RESUMEN La Calidad de Vida Relacionada con Salud (CVRS) es un parámetro destacado en la medición de resultados en salud. Es un concepto difícil de medir y su medición se realiza a través de cuestionarios. Las propiedades psicométricas de un cuestionario, su adaptación cultural, el diseño del estudio y el análisis de los resultados plantean cuestiones estadísticas importantes que deben tratarse con cautela. El Cuestionario de Salud SF-36 es uno de los instrumentos más utilizados, va(*) Agradecemos al editor de la revista y a los dos evaluadores anónimos por sus comentarios y sugerencias, que han servido de ayuda para mejorar considerablemente el trabajo que exponemos en este artículo. Asimismo, agradecemos a los investigadores de los proyectos aquí mencionados que nos han permitido utilizar los datos de CVRS recogidos de los pacientes reclutados en sus estudios, que nos han servido para ilustrar las características del SF-36 desde una perspectiva estadística. En particular, este agradecimiento se extiende a: J. M. Quintana, C. Anitua, N. González, A. Padierna, A. Valdivieso, A. Escobar, M. García, J. Pérez Izquierdo y C. Badiola. Este trabajo ha sido parcialmente financiado por el Ministerio de Educación y Ciencia y fondos FEDER (MTM2004-00341 y MTM2007-60112) y el Departamento de Educación del Gobierno Vasco UPV/EHU Econometrics Research Group IT-3334-07).

148

ESTADÍSTICA ESPAÑOLA

lidados y traducidos en el campo de la medición de la CVRS. Este trabajo quiere recalcar la importancia de contrastar las hipótesis del modelo a la hora de elegir y valorar un análisis estadístico en aquellos estudios donde se ha utilizado el SF-36. Se presentan ejemplos de aplicación del SF-36, así como análisis más concretos para mostrar las diferencias obtenidas mediante distintas técnicas de análisis estadístico y su repercusión en el ámbito clínico. Palabras clave: calidad de vida, SF-36, análisis estadístico, bondad de ajuste. Clasificación AMS: 62J05, 62J12, 62P10.

1. INTRODUCCIÓN La Organización Mundial de la Salud (OMS) definió hace ya varias décadas la salud como un estado de completo bienestar físico, mental y social, y no simplemente la ausencia de enfermedad o discapacidad (World Health Organization 1952). El modelo “biosicosocial” en medicina enmarca aspectos referidos al bienestar del paciente, como sus relaciones como persona, su comportamiento, el entorno en el que se desenvuelve y sus relaciones sociales, en lo que se conoce con el nombre de Calidad de Vida (CV) (Sanz 1991). Si bien el concepto de CV no es nuevo, en la década de los 80 se produjo un creciente e inusitado interés popular y médico por la CV, especialmente en los pacientes con cáncer. En 1973 eran únicamente 5 los artículos que aparecían en la base de datos Medline con la palabra clave “quality of life”. Este número se incrementó de forma casi exponencial, siendo durante los siguientes periodos de cinco años 195, 273, 490 y 1.252 los artículos localizados mediante el mismo criterio. Lo que significa CV es una cuestión personal. Así, el sentido subjetivo de bienestar de cada persona derivado de la experiencia diaria de su vida, se abre camino entre la medicina y las ciencias sociales. La evaluación de la CV debe incluir todas las áreas de la vida impactadas por la enfermedad o su tratamiento: la física, la psicológica, la social y la espiritual. El problema para medir la CV estaba en la falta de un instrumento único y global capaz de acomodar todas las componentes que definen el concepto de CV. Desde mediados del siglo pasado, existen múltiples pruebas psicométricas objetivas que incluyen las diferentes categorías funcionales del paciente y calculan una puntuación global de CV. La más antigua es el índice funcional de Karnofsky (Karnofsky y Burchernal 1949), que es aplicado por el médico y sólo mide capacidad física. En 1976 Katz y Akpom describen el Activities Daily Living (ADL) Index que mide las actividades sociobiológicas de la vida diaria:

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

149

bañarse, vestirse, alimentarse, etc. Durante la década de los años 80 se desarrollaron múltiples instrumentos para medir la CV en pacientes con cáncer, buscando el cumplimiento de las siguientes características: (i) evaluar la morbilidad subjetiva e impacto del tratamiento sobre el enfermo en sus aspectos físicos, psíquicos y sociales; (ii) basarse en el paciente como fuente de información, reflejando su opinión; y (iii) ser válido, sensible, sencillo y convincente. La CV, globalmente considerada, es algo difícil de definir, y depende en gran medida de la escala de valores por la que cada individuo ha optado, más o menos libremente, y de los recursos emocionales y personales de cada uno. Además, está sometida a determinantes económicos, sociales y culturales y se modifica, con el paso del tiempo, para un mismo individuo. Durante la década de los 90 se desarrolla un nuevo concepto, el de Calidad de Vida Relacionada con la Salud (CVRS) o salud percibida. Este integra aquellos aspectos de la vida directamente relacionados con el funcionamiento físico y mental y con el estado de bienestar (Guyatt et al. 1993). La medición de la CVRS hace posible obtener información sobre la enfermedad y su impacto en la vida del paciente de una forma estandarizada, comparativa y objetiva (Goldsmith 1972 y 1973). La mejor forma de medir la CVRS es utilizar un enfoque multidimensional, valorando tanto el estado objetivo de salud, de funcionalidad y de interacción del individuo con su medio, como los aspectos más subjetivos de satisfacción del individuo y la percepción de su propia salud (Testa y Simonson 1996). La CVRS tiene un lugar destacado en la investigación de resultados en salud (Clancy y Eisenberg 1998) como un parámetro de medición de los estados de salud y evaluación de los resultados de los cuidados médicos, en especial en el campo de las enfermedades crónicas. En Estados Unidos la Food and Drug Administration obliga a incluir la CVRS como un resultado para la evaluación de los nuevos tratamientos aplicables a las enfermedades crónicas. En Europa, la Agencia Europea del Medicamento no obliga aún, pero sí recomienda la inclusión de esta medida en la evaluación de nuevos tratamientos contra el cáncer. La evaluación de la CVRS es una disciplina joven y, por tanto, con muchas cuestiones sin resolver que muestran campos de investigación en desarrollo. El método clásico para determinar y evaluar de una forma válida el impacto de la enfermedad en la vida diaria del individuo y en la sensación de bienestar es la administración de cuestionarios. A través de éstos se pone de manifiesto que el estado de salud de los pacientes no siempre se corresponde con los datos que proporcionan las medidas biológicas habitualmente utilizadas para su evaluación clínica, y que los índices de actividad de la enfermedad no siempre son buenos predictores de la CVRS de los pacientes (Wilson y Kaplan 1995). Existen muchas publicaciones que recalcan la importancia de contrastar las hipótesis y las limitaciones de las medidas de CVRS y los métodos asociados al

150

ESTADÍSTICA ESPAÑOLA

diseño del estudio y al análisis de los datos antes de utilizar dichas medidas de CVRS como variables dependientes de interés (Testa y Nackley 1994). Tanto al diseñar un estudio, como al analizar los datos de CVRS existen cuestiones estadísticas importantes que deben considerarse con suma cautela (Cox et al. 1992). Una primera cuestión es el estudio de las propiedades psicométricas de los cuestionarios existentes, así como su adaptación cultural a nuestro entorno. Una segunda cuestión, no menos importante, es el plan de análisis estadístico de los datos recogidos que permita presentar los resultados de forma adecuada. Es en este punto donde el estudio de las propiedades estadísticas de las medidas de CVRS utilizadas adquiere especial importancia. Por ejemplo, la distribución de probabilidad de la variable resultado CVRS. Si se utilizan técnicas de análisis estadístico que requieren que la variable tenga una distribución normal, será necesario comprobar el cumplimiento de esta hipótesis y, en caso de que no se cumpla, habrá que estudiar la robustez de las técnicas utilizadas, además de las consecuencias prácticas de este incumplimiento en los resultados obtenidos. Otro aspecto, más específico, es la multiplicidad de la respuesta, debido a la naturaleza multivariante de las variables de CVRS. Existe bibliografía diversa sobre el tipo de análisis estadístico que debe utilizarse cuando se dispone de múltiples respuestas de CVRS (O´Brien 1984 y Pocock et al. 1987). Finalmente, aquellos estudios con un diseño longitudinal tienen un problema añadido en el tratamiento de los datos faltantes y pérdidas de seguimiento de carácter no aleatorio. Este tema se desarrolla de forma detallada por Mesbah et al. (2002) y Fairclough (2002) como aspectos importantes a tener en cuenta en el diseño y análisis de estudios de CVRS. Este trabajo se centra en la segunda de las cuestiones anteriormente mencionadas. En este sentido, es necesario recalcar la importancia de contrastar las hipótesis del modelo al elegir y valorar un análisis estadístico en aquellos trabajos donde la variable de estudio sea la CVRS. En la sección 2, se describen los distintos tipos de instrumentos de evaluación de la CVRS y sus características generales. La sección 3 se centra en uno de los cuestionarios de salud genéricos más difundidos, el denominado Short Form - 36 (SF-36). En esta sección se describe el cuestionario de salud SF-36, incluyendo su desarrollo, validación y adaptación cultural. Además, se incluye una revisión detallada de trabajos publicados en los que se ha utilizado el SF-36 como cuestionario de medición de CVRS y los métodos de análisis estadístico que se han aplicado para analizar los datos recogidos en estos estudios. También se incluye y comenta la bibliografía existente en la actualidad sobre las diferentes alternativas de análisis estadístico de datos de CVRS en general, y del cuestionario de salud SF-36 en particular. En la sección 4, se presentan ejemplos de aplicación del cuestionario SF-36. Más concretamente, se profundiza en las características de la distribución empírica de las áreas de CVRS obtenidas mediante el cuestionario de salud SF-36 en las diferentes muestras analizadas.

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

151

De esta forma, nos interesaremos en mostrar que, en general, los datos de CVRS recogidos por medio del cuestionario de salud SF-36 no siguen una distribución de probabilidad normal. Esta hipótesis se ilustrará con doce ejemplos procedentes de diferentes campos de la medicina, incluyendo áreas médicas y quirúrgicas, así como población sana. Asimismo, utilizaremos algunos ejemplos concretos para mostrar las diferencias obtenidas de resultados procedentes de distintas técnicas de análisis estadístico y su repercusión en el ámbito clínico. Finalmente, en la sección 5, presentamos algunas conclusiones del trabajo.

2. CUESTIONARIOS DE CVRS 2.1

Conceptos básicos: tipos de cuestionarios

Un cuestionario diseñado para medir CVRS debe basarse en el paciente como fuente de información, reflejando su opinión. Hay que tener en cuenta algunas consideraciones prácticas cuando se pretende administrar el cuestionario en condiciones habituales de la práctica clínica. Es decir, éste debe ser aceptado por los pacientes, profesionales sanitarios y por los investigadores. Por tanto, al diseñar el estudio y seleccionar el/los cuestionario/s de CVRS a utilizar es fundamental maximizar la información conseguida y minimizar la carga para investigadores y pacientes. Como norma general, se deben seleccionar instrumentos que hayan sido evaluados debidamente. Lohr (2002) realiza una revisión sobre los atributos para evaluar instrumentos. Los cuestionarios de CVRS pueden ser autoadministrados o realizarse mediante entrevista personal o telefónica. En general un cuestionario que pueda ser completado por el paciente es más práctico (Sanz 1991). Los cuestionarios de CVRS tienen dos partes. La primera parte contiene unas instrucciones de administración para el usuario, o el entrevistador si los datos se recogieran mediante entrevista. El formulario debe ir también acompañado de una declaración explícita de confidencialidad y garantía de anonimato. La segunda parte es el cuestionario propiamente dicho, que consta de unas dimensiones de la CVRS y unos ítems o preguntas que describen los diferentes niveles de estas dimensiones. Cada pregunta es respondida en forma de una escala. Al describir las respuestas obtenidas o compararlas entre grupos de individuos, pueden utilizarse los ítems originales, las dimensiones de salud específicas o incluso una medida global de CVRS. Los cuestionarios de CVRS se pueden clasificar en función de si se desea explorar las distintas dimensiones o aspectos del daño que ocasiona una enfermedad, o de si se pretende integrar las dimensiones en un único indicador que resuma y cuantifique las consecuencias de padecer una determinada enfermedad. El primer

152

ESTADÍSTICA ESPAÑOLA

caso es un enfoque multidimensional que refleja la naturaleza de la CVRS como un concepto tridimensional, recogiendo aspectos físicos, mentales y sociales (McDowell y Newell 1996). El segundo es un enfoque unidimensional donde se busca colapsar las distintas dimensiones para buscar un único indicador que pueda servir para medir o comparar distintas actuaciones o estados de salud. La obtención de las dimensiones y una medida global requieren de técnicas de ponderación. En muchas ocasiones la puntuación en una dimensión se obtiene simplemente sumando los resultados de los ítems correspondientes a dicha dimensión; mientras que, en otras ocasiones, los resultados de los ítems se ponderan de forma más o menos compleja. Sin embargo, la mayoría de los expertos coinciden en que es preferible obtener puntuaciones de manera simple y razonablemente justificada, realizando un análisis de sensibilidad posterior de los resultados bajo diferentes supuestos, que conducir experimentos muy elaborados para derivar escenarios de ponderación sofisticados (Cox et al. 1992). Una cuestión a debate a finales de la década de los 90 ha sido la fiabilidad de técnicas estadísticas como el análisis factorial múltiple como método de reducción de ítems y construcción de escalas de CVRS (Juniper et al. 1997 y Fayers y Hand 1997). Como norma general, Fayers et al. (1998), en su respuesta al trabajo de Juniper et al. (1997), sugieren que la construcción de escalas de CVRS no debe confiar ciegamente en la psicometría, sino que debe apoyarse más firmemente en la clinimetría. Los instrumentos de CVRS se pueden clasificar en genéricos y específicos (Patrick y Deyo 1989). Se denominan instrumentos genéricos aquellos que miden múltiples dimensiones o categorías y están diseñados para su aplicación en una gran variedad de pacientes. Los instrumentos específicos se centran en la medida de aspectos concretos de una determinada enfermedad (como, por ejemplo, cáncer o asma), de una población (como, por ejemplo, ancianos o adolescentes), una función (como, por ejemplo, sueño o actividad sexual) o un aspecto clínico (como, por ejemplo, dolor o disnea). En general, los instrumentos específicos tienen un mayor poder de discriminación; es decir, son más capaces de detectar diferencias entre tratamientos alternativos (Ferrer et al. 1997 y Torres et al. 1999). Sin embargo, cuando se pretende comprobar el impacto que una determinada intervención tiene en el estado de salud, hay que tener en cuenta que ésta también influye en las características más generales del paciente. Por tanto, al evaluar el estado de salud será conveniente utilizar también algún instrumento genérico (Guyatt et al. 1993). Cuando se pretende dar respuesta a problemas específicos de salud, se buscan instrumentos que sean sensibles a variaciones de CVRS en enfermedades específicas. Sin embargo, cuando el objetivo es comparar estados de salud entre sí, de cara al establecimiento de prioridades sanitarias o sociales, se busca un nivel de comparación abstracto y global sobre el daño que producen las enfermedades. Por tanto, los instrumentos deben ser generales. Como norma general, es aconse-

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

153

jable incluir en el estudio tanto instrumentos específicos como genéricos. Aunque los investigadores deberán tener en cuenta el tiempo necesario para realizar este trabajo en condiciones habituales de práctica clínica, siempre buscando un equilibrio entre conseguir la máxima información a su alcance y entorpecer al mínimo la labor de los profesionales sanitarios. Bowling (1991) muestra con detalle los instrumentos de CVRS existentes, su contenido, características y propósito y McHorney (1999) presenta un cronograma del desarrollo de los diferentes instrumentos de medición de CVRS, tanto genéricos como específicos, desde los años 40 hasta finales de la década de los 90. 2.2

Propiedades psicométricas

Las características básicas que definen a un buen instrumento de medida de la CVRS según Donovan et al. (1989) son: a) válido, en el sentido de ser capaz de medir aquellas características que se pretende medir y no otras; b) preciso o fiable, es decir con un mínimo error de medida; y c) sensible, o sea, capaz de detectar cambios tanto entre diferentes individuos como en la respuesta de un mismo individuo a lo largo del tiempo (sensibilidad al cambio o responsiveness). Los criterios de evaluación de un instrumento de medida de la salud se han estudiado ampliamente en el campo de la psicometría (Streiner y Norman 1992) y han sido también aplicados concretamente en el área de CVRS (van Knippenberg y de Haes 1988 y Hays et al. 1993). A continuación presentamos un breve resumen de estos criterios. De las características de un instrumento de CVRS anteriormente mencionadas, probablemente la validez es la característica más importante que debe exigirse a un buen cuestionario. El concepto de validez se puede desglosar en tres aspectos diferentes: validez de criterio, validez de contenido y validez de constructo. La validez de criterio, significa que el cuestionario es adecuado al problema que se quiere medir. Esto se comprueba comparando el instrumento con un patrón de referencia o gold standard. Teniendo en cuenta que los instrumentos de CVRS miden fenómenos subjetivos o abstractos, resulta difícil valorar hasta qué punto una medición representa el fenómeno de interés, dado que no existe tal patrón de referencia. La validez de contenido (face validity) consiste en comprobar si los ítems en un instrumento o una dimensión concreta cubren el área que se pretende cubrir de forma clara y precisa. Los expertos sugieren que la validez de contenido mejora considerablemente cuando se dispone de asesoramiento de origen diverso en el desarrollo del instrumento de CVRS (personal médico, de enfermería, asistentes sociales, pacientes, etc.) (Aaronson 1989). La validez de constructo se comprueba comparando el instrumento con otras medidas. Por ejemplo, se comprueba que los resultados de CVRS difieren entre grupos de individuos con diferentes

154

ESTADÍSTICA ESPAÑOLA

estados de salud, o se comprueba su correlación con resultados clínicos, radiológicos o de laboratorio que representen gravedad de la enfermedad. De manera formal, estos conceptos pueden contrastarse con técnicas estadísticas ampliamente utilizadas en la psicometría para tal fin (Campbell y Fiske, 1959 y McDowell y Newel, 1996) La segunda de las características de un instrumento es la fiabilidad o capacidad para medir lo mismo en repetidas ocasiones bajo las mismas condiciones. La opción básica para medir la fiabilidad interna de un instrumento es el coeficiente alfa de Cronbach (Cronbach, 1951). Una alternativa es el test-retest, aunque esto puede ser difícil de llevar a la práctica en contextos como el de los ensayos clínicos. Cuando el cuestionario no es autoadministrado hay que tener en cuenta que el grado de acuerdo entre entrevistadores también afecta a la fiabilidad. La tercera característica de un instrumento de CVRS es la sensibilidad al cambio o responsiveness. Un instrumento de CVRS debe ser capaz de detectar cambios en la CV, cuando los haya, especialmente cuando se utiliza para medir la efectividad de un tratamiento (Guyatt et al. 1987). Existe bibliografía reciente sobre cómo debe medirse e interpretarse la sensibilidad al cambio de un instrumento en cada contexto (Murawski y Miederhoff 1998 y Beaton et al. 2001). Además de las tres características básicas mencionadas, hay una cuarta que debemos mencionar: el grado de generalización de un instrumento. En general, un cuestionario no debe usarse en otro contexto a aquel para el cual ha sido diseñado (de Vet et al. 2001). 2.3

Validación de la traducción y adaptación cultural

El proceso de traducción y adaptación cultural de un cuestionario ha sido tratado con detalle en referencias diversas (Gandek y Ware, 1998). Badía et al. (1999) realizan una excelente recopilación de los instrumentos de evaluación de la CVRS adecuadamente traducidos al castellano. La lista incluye versiones castellanas de instrumentos genéricos y específicos.

3. CUESTIONARIO DE SALUD SF-36 3.1

Desarrollo, validación y adaptación cultural

El cuestionario de salud SF-36 es un instrumento genérico de medición de CVRS, que consta de 36, preguntas diseñado por Ware et al. a principios de los noventa (Ware y Sherbourne 1992 y Ware et al. 1993). El SF-36 proporciona un

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

155

perfil del estado de salud y es aplicable tanto a pacientes como a población sana. El cuestionario cubre 8 dimensiones, que representan los conceptos de salud empleados con mayor frecuencia cuando se mide CVRS, así como aspectos relacionados con la enfermedad y su tratamiento. Las dimensiones evaluadas son funcionamiento físico, rol físico, dolor corporal, salud general, vitalidad, funcionamiento social, rol emocional y salud mental del paciente. Adicionalmente, el SF-36 incluye una pregunta de transición sobre el cambio en el estado de salud general con respecto al año anterior. Este ítem no se utiliza para el cálculo de ninguna de las 8 dimensiones principales. Las puntuaciones de las 8 dimensiones del SF-36 están ordenadas de forma que a mayor valor mejor es el estado de salud. Para cada dimensión, los ítems son codificados, agregados y transformados en una escala con un rango de 0 (el peor estado de salud) a 100 (el mejor estado de salud). Además, el cuestionario permite el cálculo de dos puntuaciones resumen, física y mental, mediante la suma ponderada de las puntuaciones de las ocho dimensiones principales. Los pesos incorporados en el cálculo de las puntuaciones resumen se obtienen a partir de una población de referencia (Ware et al. 1994). La tabla 1 muestra las características de las ocho dimensiones principales, las dos resumen y la pregunta de transición del cuestionario de salud SF-36. El SF-36 está dirigido a personas de 14 o más años de edad y preferentemente debe ser autoadministrado, aunque también es aceptable la administración mediante entrevista personal o telefónica. Tabla 1

CARACTERÍSTICAS PRINCIPALES DEL CUESTIONARIO DE SALUD SF-36 Funcionamiento físico Rol físico Dolor corporal Salud general Vitalidad Funcionamiento social Rol emocional Salud mental Transición Resumen Físico Resumen Mental

Nº ÍTEMS

Nº NIVELES

PUNTUACIÓN(1)

10 4 2 5 4 2 3 5 1 35 35

21 5 11 21 21 9 4 26 5

0 − 100 0 − 100 0 − 100 0 − 100 0 − 100 0 − 100 0 − 100 0 − 100 − 50 (10) 50 (10)

− −

(1) Las puntuaciones 0 − 100 tienen ese rango y se interpretan como el peor o mejor estado de salud, respectivamente; en las puntuaciones 50 (10) la población de referencia tiene una media de 50 con una desviación estándar de 10, por lo que valores superiores o inferiores a 50 indican un mejor o peor estado de salud, respectivamente, que la población de referencia.

156

ESTADÍSTICA ESPAÑOLA

Ware et al. (1993) incluyen estudios de validación del SF-36 como herramienta para medir CVRS. Además, se han publicado diversos estudios de validación del SF-36 por otros autores, que lo comparan con otros instrumentos de medición de salud más generales y complejos (Brazier et al. 1992 y Stansfeld et al. 1997). Otros autores han utilizado el SF-36 en pacientes enfermos para medir su capacidad de discriminar entre diferentes diagnósticos o niveles de gravedad, validando así el instrumento en diferentes diagnósticos. Algunos ejemplos son: Harper et al. (1997) para la Enfermedad Pulmonar Obstructuva Crónica (EPOC), Dawson et al. (1996) para prótesis total de cadera y Wachtel et al. (1992) para infección por Virus de Inmunodeficiencia Humana (VIH). McDowell y Newell (1996) realizan una exhaustiva descripción del desarrollo del SF-36, incluyendo comentarios críticos. Ware (2000) ofrece un resumen actualizado y bien documentado de aspectos diversos relacionados con el cuestionario de salud SF-36. Más recientemente, el SF-36 ha sido calificado como la medida de salud genérica basada en el paciente más evaluada en un estudio bibliográfico sobre el incremento de las medidas de CVRS publicado en el British Medical Journal (Garratt et al. 2002). Sus buenas propiedades psicométricas, que han sido evaluadas en más de 400 artículos, y la multitud de estudios ya realizados, lo convierten en uno de los instrumentos con mayor potencial y aceptación en el campo de la CVRS. El cuestionario SF-36 ha sido traducido en más de 50 países como parte del International Quality of Life Assessment (IQOLA) Project (Aaronson et al. 1992, Ware et al. 1995 y 1996a y Gandek y Ware 1998). Este proyecto incluye investigadores de 14 países, incluyendo España. Las adaptaciones validadas y publicadas por el proyecto IQOLA incluyen el castellano (Alonso et al. 1995), el francés (Perneger et al. 1995), el alemán (Bullinger 1995), el sueco (Sullivan et al. 1995) y el italiano (Apolone et al. 1997), así como diferentes variaciones del inglés para su uso en Canadá, Reino Unido, Australia y Nueva Zelanda (McCallum 1995). Una década después de su creación, Vilagut et al. (2005) realizan una revisión crítica del contenido, propiedades métricas y nuevos desarrollos de la versión castellana del SF-36. Asimismo, existe una versión en catalán, que fue desarrollada a partir de la castellana. Recientemente, el SF-36 ha sido traducido al euskera y su validez contrastada, a partir de la versión original inglesa, siguiendo un método similar al utilizado para la versión castellana (González et al. 2005). Actualmente existen más de 500 publicaciones que usan traducciones o adaptaciones al inglés del SF-36. En 1996 se desarrolló la versión 2.0 del cuestionario original SF-36 con el objetivo, entre otros, de mejorar las características métricas de las escalas de rol físico y emocional (Ware et al. 2000). Actualmente ya se ha desarrollado la versión 2.0 del cuestionario en castellano, aunque por el momento no hay datos sobre su validación, ni estudios comparativos con la versión original (Vilagut et al. 2005).

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

157

La página web del SF-36 (http://www.sf-36.org) ofrece información detallada y periódicamente actualizada sobre el cuestionario de salud, así como un foro de discusión de antiguas y nuevas publicaciones e interpretación de resultados. 3.2

El SF-36 como medida de CVRS

Durante la última década, gran parte de la investigación en CVRS se ha concentrado en la evaluación de la CVRS como medida de resultado en ensayos clínicos (Fairclough 2002). El análisis estadístico de datos de CVRS en el ámbito de los ensayos clínicos está también ampliamente documentado (Olschewski y Schumacher 1990, Cox et al. 1992, Fayers y Machin 2000 y Mesbah et al. 2002). Asimismo, la información combinada sobre calidad de vida y cantidad de vida en lo que se denomina años de vida ajustados por calidad de vida se ha utilizado ampliamente en la evaluación económica y la toma de decisiones en la asignación de recursos sanitarios (Torrance 1987). Sin embargo, existe mucha menos literatura publicada en el ámbito de medición de resultados de CVRS en poblaciones tanto sanas como enfermas. Hay muchos contextos en los cuales no es posible diseñar un experimento en forma de ensayo clínico y, por tanto, donde la decisión sobre el tratamiento a seguir se toma basándose en estudios observacionales donde la CVRS se mide como resultado. Los estudios observacionales donde se recoge la CVRS tienen como objetivo, no sólo medir y comparar la CVRS entre las diferentes poblaciones, sino también estudiar la relación de la CVRS y su evolución con otras características del sujeto o la enfermedad. En este tipo de estudios no experimentales hay infinidad de variables que no pueden ser controladas por el investigador en la fase de diseño, como lo son en los ensayos clínicos. Es en este contexto donde se centra este trabajo, utilizando como medida de la CVRS el cuestionario de salud SF-36. El análisis de los datos obtenidos en estudios no experimentales de CVRS se resume en tres etapas: en primer lugar se pretende identificar las variables que influyen sobre la CVRS de los pacientes; en segundo lugar, se pretende realizar un análisis multivariante de los diversos factores que influyen en la CVRS, incluyendo en el modelo todos aquellos factores susceptibles de modificar la calidad de vida detectados en el primer paso; y en tercer lugar estudiar la evolución de la CVRS durante el periodo de seguimiento del estudio, realizando un análisis de medidas repetidas sobre el modelo seleccionado en el paso anterior. 3.3

Análisis estadístico del SF-36 como variable dependiente

La lista de publicaciones sobre estudios no experimentales de CVRS en los cuales se ha utilizado el cuestionario SF-36 como variable dependiente es muy larga. Aquí hemos revisado algunos de estos trabajos con unos objetivos similares a los

158

ESTADÍSTICA ESPAÑOLA

mencionados en la sección 3.2, resumiendo los métodos de análisis estadístico que se han utilizado en los mismos. Algunos autores realizan únicamente un análisis de la varianza simple. Por ejemplo, Wilson et al. (1999) comparan la CVRS en personas con diferentes niveles de consumo de tabaco; Laforge et al. (1999) comparan la CVRS en función del ejercicio físico realizado; Hassan et al. (1998) comparan la CVRS en pacientes con fatiga crónica y dos niveles de inmunología intracelular. Otros autores incluyen un análisis múltiple de la varianza o un análisis de la covarianza y realizan un análisis estadístico clásico. Por ejemplo, Mozes et al. (1999) analizan el SF-36 en función de los síntomas urinarios ajustando por otras variables socio-demográficas y clínicas en ancianos; Wahl et al. (1999) analizan el SF-36 en función del grado de disfunción ajustando por variables socio-demográficas y clínicas en pacientes con soriasis; Leidy et al. (1999) analizan el SF-36 en función de la frecuencia de las convulsiones, tiempo transcurrido desde la última convulsión, sexo, edad y enfermedades asociadas en pacientes con epilepsia; Lee et al. (1997) comparan la CVRS de pacientes con visión borrosa con pacientes con visión normal ajustando por variables socio-demográficas y clínicas; Mahler y Mackowiak (1995) analizan el SF-36 en función del nivel de disnea ajustando por otras variables clínicas en pacientes con EPOC; Revicki et al. (1995) comparan la CVRS en pacientes con dos niveles de infección por VIH ajustando por variables socio-demográficas y clínicas; Lyons et al. (1994) comparan la CVRS de pacientes con 11 diagnósticos comunes ajustando por edad y sexo; y Jacobson et al. (1994) comparan la CVRS en pacientes con dos niveles de diabetes ajustando por número y gravedad de las complicaciones debidas a la diabetes. Por último, hay una gran cantidad de trabajos con un diseño longitudinal, que estudian la influencia de diversos factores en la evolución de la CVRS por medio de un análisis de la varianza de medidas repetidas, como, por ejemplo, Coulehan et al. (1997) estudian el efecto del tratamiento en la evolución de la CVRS en pacientes con trastorno de depresión; Komaroff et al. (1996) comparan la evolución de la CVRS en pacientes con síndrome de fatiga crónica con otros seis diagnósticos; y Bubien et al. (1996) estudian la evolución de la CVRS en pacientes con arritmias recurrentes. Todas las técnicas estadísticas mencionadas hasta el momento son casos particulares del modelo de Regresión Lineal Múltiple (RLM), el cual asume que la distribución de la variable dependiente es normal. Algunos de los trabajos citados mencionan en sus limitaciones el hecho de que la distribución de ninguna de las áreas del SF-36 sea normal. Parte de los trabajos con un diseño longitudinal han utilizado como variable dependiente el cambio en CVRS, cuya distribución se acerca más a la normalidad exigida en las técnicas de análisis clásicas. Por ejemplo, Hemingway et al. (1997) han estudiado la evolución de la CVRS en una gran cohorte de funcionarios; Anderson et al. (1998) han estudiado la evolución de la

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

159

CVRS comparando el SF-36 y el Quality of Well Being Scale (QWB), en pacientes con enfermedades graves, SIDA y cáncer, entre otras; Ware et al. (1996b) han comparado la evolución de la CVRS en pacientes crónicos tratados en sistemas de salud privados y públicos; Tsevat et al. (1996) han comparado la evolución de la CVRS en pacientes con infección por VIH asintomáticos, sintomáticos pero sin SIDA y con SIDA; Patrick et al. (1995) han estudiado la evolución de la CVRS en pacientes con ciática y dolor lumbar; Mangione et al. (1994) han estudiado el efecto de la intervención de cataratas en la evolución de la CVRS; Quintana et al. (2003) han estudiado los factores predictivos de mejoría de la CVRS en pacientes intervenidos de colecistectomía; Padierna et al. (2002) han estudiado la evolución de la CVRS en pacientes en tratamiento por trastornos de alimentación; y Quintana et al. (2006) han estudiado también la relación entre la adecuación de la indicación de prótesis total de cadera o rodilla y la mejoría de la CVRS en pacientes con osteoartrosis. El trabajo de Cox et al. (1992) hace referencia al análisis estadístico de datos de CVRS, recomendando técnicas de análisis simples pero robustas, y asumiendo normalidad de la variable dependiente. Aunque este trabajo se concentra en el ámbito de los ensayos clínicos, este tipo de recomendación es extensible a otros contextos. Olschewski et al. (1992, p. 385), en la discusión que realizan del trabajo de Cox et al. (1992), proponen alternativas basadas en los modelos lineales generalizados. Lall et al. (2002) publican una revisión sobre el uso de modelos de regresión ordinal en el análisis de datos de CVRS. Esta alternativa exige, en muchos casos, la categorización de la puntuación de CVRS, inicialmente diseñada como continua. Más concretamente, Walters et al. (2001) han usado varios modelos de regresión ordinales y los han comparado con métodos estadísticos convencionales y también con métodos bootstrap para analizar la dimensión de rol emocional del SF-36. Este trabajo concluye que una escala debe ser tratada como continua si el número de categorías es mayor o igual que 7 y como discreta en otro caso. El uso de métodos bootstrap en el análisis del SF-36 ha sido tratado con profundidad por Walters y Campbell (2005). Desde una perspectiva clínica es importante tener mediciones estándar de las diferentes dimensiones de la CVRS, lo cual se traduce en un instrumento multidimensional de medición de la CVRS. Por tanto, es preferible utilizar una técnica de análisis estadístico común a todas las dimensiones del instrumento de CVRS seleccionado, independientemente de su distribución de probabilidad. Rose et al. (1999) han tratado los problemas estadísticos encontrados en el análisis del SF-36, entre ellos la no normalidad de las áreas de CVRS. Cheung et al. (2004) han utilizado la distribución beta para modelizar las puntuaciones de las 8 dimensiones del SF-36 divididas por 100. El objetivo de este trabajo es mostrar diferencias en la media y la varianza de las puntuaciones de CV entre varios grupos, de forma que se incluye el efecto de algunas covariables en la estimación de los parámetros de la distribución beta.

160

ESTADÍSTICA ESPAÑOLA

Más allá de los trabajos citados, no hemos encontrado en la literatura ningún trabajo cuyo objetivo se centre en la distribución de probabilidad de las puntuaciones del cuestionario de salud SF-36 o en la robustez de las técnicas utilizadas en el análisis bajo supuestos de normalidad que no se verifican. Lo que, tal y como ilustramos en la sección 4, es un tema relevante dentro del análisis de este tipo de datos.

4. EJEMPLOS Utilizaremos muestras de sujetos sanos y con diferentes patologías para ilustrar las distintas posibles hipótesis sobre la distribución empírica de las áreas de CVRS del cuestionario de salud SF-36. Se dispone de datos del SF-36, además de la edad y el sexo, de un total de 8.989 individuos. Las muestras que se presentan a continuación, en general, no provienen de estudios con un diseño aleatorio, por tanto, las conclusiones obtenidas en ningún caso son generalizables a la población general. Los diferentes sesgos derivados de un diseño no experimental, entre ellos el sesgo de información y la falta de respuesta, deben ser considerados antes de obtener conclusiones a partir de los datos que aquí se presentan. Sin embargo, el objetivo de este trabajo, en ningún caso es sacar conclusiones clínicas de los datos presentados, ni su generalización a la población general, ni a poblaciones específicas de las cuales las muestras pudieran ser representativas. Tal y como se ha planteado anteriormente, el objetivo de este trabajo al mostrar estos ejemplos es, por un lado, ilustrar que las puntuaciones del cuestionario de salud SF-36 no siguen una distribución normal y, por otro lado, destacar los posibles errores derivados de utilizar técnicas de análisis que exigen una hipótesis de normalidad en estas circunstancias.

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

161

Tabla 2 EDAD Y SEXO DE LOS GRUPOS DE SUJETOS ANALIZADOS GRUPO Población general Donantes de sangre HTA TA VIH EIIC Trasplante de hígado Colecistectomía Histerectomía PTC PTR Cáncer de pulmón

n

EDAD: MEDIA (DE)

SEXO: N(%) H

3.953

47,15 (18,97)

1.670 (42,2%)

106

35,83 (13,22)

54 (50,9%)

20

62,05 (8,54)

16 (80,0%)

2.98

23,10 (7,03)

6 (2,0%)

40

35,10 (4,52)

25 (62,5%)

165

41,53 (14,88)

93 (56,4%)

139

54,30 (13,27)

90 (64,7%)

1.123

57,75 (14,43)

310 (27,6%)

649

55,82 (13,26)

0 (0%)

1.266

67,34 (10,73)

669 (52,8%)

1.113

71,34 (7,17)

309 (27,8%)

64,45 (10,23)

112 (95,7%)

117

Se han utilizado las siguientes abreviaturas: Desviación estándar (DE), Hombre (H), Hipertensión arterial (HTA), Trastornos de Alimentación (TA), Virus de Inmunodeficiencia Humana (VIH), Enfermedad Inflamatoria Intestinal Crónica (EIIC), Prótesis Total de Cadera (PTC) y Prótesis Total de Rodilla (PTR).

La tabla 2 muestra un resumen de los grupos de sujetos con los que vamos a realizar los análisis. Los participantes se han reclutado de diversos estudios llevados a cabo en la Unidad de Investigación del hospital Galdakao perteneciente al Sistema Vasco de Salud – Osakidetza, los cuales pasamos a detallar a continuación. Los pacientes con Hipertensión Arterial (HTA) o con VIH, así como los donantes de sangre son individuos que han participado en un estudio de validación del Cuestionario de Salud SF-36 en euskera (González et al. 2005). Los pacientes con cáncer de pulmón han participado en un estudio sobre la CV de los pacientes con esta patología (Etxebarria et al. 2001). Los pacientes con Trastornos de Alimentación (TA) provienen de dos muestras independientes; aproximadamente dos tercios (197) han participado en un estudio de seguimiento de la CVRS (Padierna et al. 2002), y el resto (101) han participado en el estudio de validación del Cuestionario de Salud SF-36 en euskera anteriormente mencionado (González et al. 2005). Los pacientes intervenidos de colecistectomía, Prótesis Total de Cadera (PTC) y Prótesis Total de Rodilla (PTR) son pacientes que estaban en lista de espera para alguna de estas intervenciones quirúrgicas, reclutados para un estudio de adecuación de la intervención en cuestión, en el cual se midió también la CVRS (Quintana et al. 2005 y 2006). De la misma forma y con un objetivo similar a los anteriores se reclutaron los pacientes intervenidos de histerectomía, aunque los resultados obtenidos no han sido publicados hasta el momento. Los pacientes con Enfermedad Inflamatoria Intestinal Crónica (EIIC) fueron reclutados en un estudio de medi-

162

ESTADÍSTICA ESPAÑOLA

ción de la CV de este tipo de pacientes con distintos instrumentos de medida (datos sin publicar). Los pacientes de trasplante de hígado se reclutaron de la lista de espera de trasplante en un estudio con objetivos más amplios que incluía la medición de la CVRS (datos sin publicar). Los datos relativos a la población general se han recogido de la Encuesta de Salud realizada por el Gobierno Vasco en 1996 (Anitua y Quintana 1999). Los análisis estadísticos se han realizado con SAS System for Windows Version 8.02 (SAS Institute Inc. 1994) y las figuras se han obtenido con S-Plus 2000 (MathSoft Inc. 1999). El nivel de significación elegido para la realización de los contrastes de hipótesis es de α = 0,05. Tabla 3

CALIDAD DE VIDA DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. ÁREAS FÍSICAS DEL SF-36 (Continúa) GRUPO

FUNCIONAMIENTO FÍSICO n

ROL FÍSICO

Media

DE

Media

DE

3.953

86,66

21,50

86,43

30,92

Donantes de sangre

106

92,88

13,61

91,67

20,41

HTA

20

74,63

24,17

80,88

20,78

TA

298

85,40

19,62

57,31

40,99

VIH

40

83,01

18,99

63,96

37,00

EIIC

165

84,82

19,22

66,06

42,23

Trasplante de hígado

139

59,96

26,99

30,74

40,83

1.123

72,16

24,90

52,78

43,88

649

73,91

24,62

59,73

42,06

PTC

1.266

21,86

21,60

12,63

28,99

PTR

1.113

24,27

20,96

15,78

30,53

117

55,21

27,25

32,69

42,23

Población general

Colecistectomía Histerectomía

Cáncer de pulmón

Se han utilizado las siguientes abreviaturas: Desviación estándar (DE), Hipertensión arterial (HTA), Trastornos de Alimentación (TA), Virus de Inmunodeficiencia Humana (VIH), Enfermedad Inflamatoria Intestinal Crónica (EIIC), Prótesis Total de Cadera (PTC) y Prótesis Total de Rodilla (PTR).

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

163

Tabla 3

CALIDAD DE VIDA DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. ÁREAS FÍSICAS DEL SF-36 (Conclusión) GRUPO

DOLOR CORPORAL n

SALUD GENERAL

Media

DE

Media

DE

3.953

78,83

25,30

66,54

19,73

Donantes de sangre

106

88,08

18,16

77,20

15,99

HTA

20

79,05

17,50

64,98

14,36

TA

298

65,46

28,57

50,86

21,81

VIH

40

74,70

24,59

47,80

19,63

EIIC

165

67,50

28,39

50,20

22,72

Trasplante de hígado

139

68,18

32,00

36,58

18,85

1.123

53,58

28,83

53,73

20,48

649

65,20

27,64

61,29

20,30

PTC

1.266

31,62

26,15

58,64

20,63

PTR

1.113

36,60

27,21

57,12

20,31

117

55,82

30,94

43,28

19,59

Población general

Colecistectomía Histerectomía

Cáncer de pulmón

Se han utilizado las siguientes abreviaturas: Desviación estándar (DE), Hipertensión arterial (HTA), Trastornos de Alimentación (TA), Virus de Inmunodeficiencia Humana (VIH), Enfermedad Inflamatoria Intestinal Crónica (EIIC), Prótesis Total de Cadera (PTC) y Prótesis Total de Rodilla (PTR).

164

ESTADÍSTICA ESPAÑOLA

Tabla 4

CALIDAD DE VIDA DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. ÁREAS MENTALES DEL SF-36 GRUPO

VITALIDAD n

Población general Donantes de sangre HTA TA VIH EIIC Trasplante de hígado Colecistectomía Histerectomía PTC PTR Cáncer de pulmón

FUNCIONAMIENTO SOCIAL

Media

DE

Media

DE

3.953

64,51

19,38

89,47

19,02

106

72,31

15,07

88,21

17,06

20

72,31

15,82

77,63

20,66

298

47,38

21,70

56,65

28,42

40

61,67

20,22

72,81

21,35

165

58,55

25,70

78,56

26,51

139

49,36

28,42

61,51

33,41

1.123

50,86

24,44

73,10

26,27

649

53,20

23,65

78,27

24,04

1.266

42,69

24,18

55,21

31,83

1.113

43,44

24,08

57,83

31,05

117

47,05

24,78

68,70

31,68

GRUPO

ROL EMOCIONAL n

SALUD MENTAL

Media

DE

Media

DE

3.953

91,77

24,66

71,14

18,05

106

91,03

20,37

79,69

14,45

HTA

20

84,31

23,91

74,39

14,11

TA

298

46,58

42,16

45,87

22,71

VIH

40

60,83

43,94

62,98

19,37

EIIC

165

78,59

38,60

67,10

21,61

Población general Donantes de sangre

Trasplante de hígado Colecistectomía Histerectomía

139

74,63

40,91

67,23

20,77

1.123

70,16

41,89

61,53

22,91

649

73,71

39,78

60,52

21,42

PTC

1.266

69,53

43,44

60,11

23,80

PTR

1.113

66,89

45,04

59,88

23,83

117

66,67

42,21

60,03

24,92

Cáncer de pulmón

Se han utilizado las siguientes abreviaturas: Desviación estándar (DE), Hipertensión arterial (HTA), Trastornos de Alimentación (TA), Virus de Inmunodeficiencia Humana (VIH), Enfermedad Inflamatoria Intestinal Crónica (EIIC), Prótesis Total de Cadera (PTC) y Prótesis Total de Rodilla (PTR).

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

165

Las tablas 3 y 4 muestran la media y la desviación estándar de cada una de las 8 áreas del SF-36 en cada una de las muestras analizadas. Las figuras 1 a 8 muestran la distribución de las 8 áreas del SF-36 en cada una de las muestras analizadas, así como la curva de ajuste a una distribución normal, donde los parámetros se han estimado utilizando los valores de las tablas 3 y 4. Figura 1

FUNCIONAMIENTO FÍSICO DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIÓN OBSERVADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIÓN NORMAL

0

20

40

60

80

100

0

CVRS: Fu n cio n a mie n to Físico

P obl ac i ón no rm al (n=395 3)

0

20

40

60

80

100

20

0

20

VIH (n=40 )

0

20

40

60

40

60

80

100

0

Donantes de s angre ( n=106)

40

60

80

100

0

EIIC (n= 165)

80

Hi s te rec tom ía (n= 649)

100

0

20

40

60

20

40

60

80

100

0

Hi pertens i ó n arteri al (n= 20)

20

40

60

80

100

0

Tra s pl ante de h igado (n=1 39)

80

100

Prótes i s total de c adera (n=1 266)

0

20

40

60

80

100

Prót es is total de ro d i l l a (n=1 113)

Se han utilizado las siguientes abreviaturas: Virus de Inmunodeficiencia Humana (VIH), Enfermedad Inflamatoria Intestinal Crónica (EIIC).

20

40

60

80

1 00

Tras tor nos al i m enti c i os (n=29 8)

20

40

60

80

1 00

Col ec i s tec to m ía (n=1123 )

0

20

40

60

80

1 00

Cánc er de pul m ón (n =117)

166

ESTADÍSTICA ESPAÑOLA

Figura 2

ROL FÍSICO DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIÓN OBSERVADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIÓN NORMAL

0

20

40

60

80

100

0

20

40

60

80

100

0

20

Donantes de sangre (n=106)

40

60

80

100

0

Hipertensión arterial (n=20)

20

40

60

80

100

Trastornos alimenticios (n=298)

CVRS: Rol Físico

Población normal (n=3953)

0

20

40

60

80

100

0

20

VIH (n=40)

0

20

40

60

40

60

80

100

0

20

EIIC (n=165)

80

Histerectomía (n=649)

100

0

20

40

60

40

60

80

100

0

Trasplante de higado (n=139)

80

100

Prótesis total de cadera (n=1266)

0

20

40

60

80

100

Prótesis total de rodilla (n=1113)

Se han utilizado las siguientes abreviaturas: Virus de Inmunodeficiencia Humana (VIH), Enfermedad Inflamatoria Intestinal Crónica (EIIC).

20

40

60

80

100

Colecistectomía (n=1123)

0

20

40

60

80

100

Cáncer de pulmón (n=117)

167

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

Figura 3

DOLOR CORPORAL DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIÓN OBSERVADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIÓN NORMAL

0

20

40

60

80

100

0

20

40

60

80

100

0

Donantes de sangre (n=106)

20

40

60

80

100

0

Hipertensión arterial (n=20)

20

40

60

80

100

Trastornos alimenticios (n=298)

CVRS: Dolor Corporal

Población normal (n=3953)

0

20

40

60

80

100

0

20

VIH(n=40)

0

20

40

60

40

60

80

100

0

EIIC(n=165)

80

Histerectomía (n=649)

100

0

20

40

60

20

40

60

80

100

0

Trasplante de higado (n=139)

80

100

Prótesis total de cadera (n=1266)

0

20

40

60

80

100

Prótesis total de rodilla (n=1113)

Se han utilizado las siguientes abreviaturas: Virus de Inmunodeficiencia Humana (VIH), Enfermedad Inflamatoria Intestinal Crónica (EIIC).

20

40

60

80

100

Colecistectomía (n=1123)

0

20

40

60

80

100

Cáncer de pulmón (n=117)

168

ESTADÍSTICA ESPAÑOLA

Figura 4

SALUD GENERAL DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIÓN OBSERVADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIÓN NORMAL

0

20

40

60

80

100

0

20

40

60

80

100

0

Donantes de sangre (n=106)

20

40

60

80

100

0

Hipertensión arteri al (n=20)

20

40

60

80

100

Trastornos alimenticios (n=298)

CVRS: Salud General

Poblaci ón normal (n=3953)

0

20

40

60

80

100

0

20

VIH(n=40)

0

20

40

60

40

60

80

100

0

EIIC(n=165)

80

Histerectomía (n=649)

100

0

20

40

60

20

40

60

80

100

0

Traspl ante de higado (n=139)

80

100

Prótesis total de cadera (n=1266)

0

20

40

60

80

100

Prótesis total de rodi lla (n=1113)

Se han utilizado las siguientes abreviaturas: Virus de Inmunodeficiencia Humana (VIH), Enfermedad Inflamatoria Intestinal Crónica (EIIC).

20

40

60

80

100

Coleci stectomía (n=1123)

0

20

40

60

80

100

Cáncer de pulmón (n=117)

169

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

Figura 5

VITALIDAD DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIÓN OBSERVADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIÓN NORMAL

0

20

40

60

80

100

0

20

40

60

80

100

0

20

Donantes de sangre (n=106)

40

60

80

100

0

Hipertensi ón arterial (n=20)

20

40

60

80

100

Trastornos alimentici os (n=298)

CVRS: Vitalida d

Población normal (n=3953)

0

20

40

60

80

100

0

20

VIH (n=40)

0

20

40

60

40

60

80

100

0

EIIC(n=165)

80

Histerectomía (n=649)

100

0

20

40

60

20

40

60

80

100

0

Trasplante de higado (n=139)

80

100

Prótesis total de cadera (n=1266)

0

20

40

60

80

100

Prótesi s total de rodill a (n=1113)

Se han utilizado las siguientes abreviaturas: Virus de Inmunodeficiencia Humana (VIH), Enfermedad Inflamatoria Intestinal Crónica (EIIC).

20

40

60

80

100

Col eci stectomía (n=1123)

0

20

40

60

80

100

Cáncer de pulmón (n=117)

170

ESTADÍSTICA ESPAÑOLA

Figura 6

FUNCIONAMIENTO SOCIAL DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIÓN OBSERVADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIÓN NORMAL

0

20

40

60

80

100

0

CVRS: Funcionamiento Social

Población normal (n=3953)

0

20

40

60

80

100

20

0

20

VIH (n=40)

0

20

40

60

40

60

80

100

0

40

60

80

100

80

100

0

20

40

60

40

60

80

100

0

Hipertensión arterial (n=20)

0

EIIC (n=165)

Histerectomía (n=649)

20

Donantes de sangre (n=106)

20

40

60

80

100

0

Trasplante de higado (n=139)

80

100

Prótesis total de cadera (n=1266)

0

20

40

60

80

100

Prótesis total de rodilla (n=1113)

Se han utilizado las siguientes abreviaturas: Virus de Inmunodeficiencia Humana (VIH), Enfermedad Inflamatoria Intestinal Crónica (EIIC).

20

40

60

80

100

Trastornos alimenticios (n=298)

20

40

60

80

100

Colecistectomía (n=1123)

0

20

40

60

80

100

Cáncer de pulmón (n=117)

171

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

Figura 7

ROL EMOCIONAL DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIÓN OBSERVADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIÓN NORMAL

0

20

40

60

80

100

0

20

40

60

80

100

0

20

Donantes de sangre (n=106)

40

60

80

100

0

Hipertensi ón arterial (n=20)

20

40

60

80

100

Trastornos alimenticios (n=298)

CVRS: Rol Emocion al

Población normal (n=3953)

0

20

40

60

80

100

0

20

VIH (n=40)

0

20

40

60

40

60

80

100

0

20

EIIC(n=165)

80

Histerectomía (n=649)

100

0

20

40

60

40

60

80

100

0

Trasplante de higado (n=139)

80

100

Prótesis total de cadera (n=1266)

0

20

40

60

80

100

Prótesis total de rodilla (n=1113)

Se han utilizado las siguientes abreviaturas: Virus de Inmunodeficiencia Humana (VIH), Enfermedad Inflamatoria Intestinal Crónica (EIIC).

20

40

60

80

100

Colec istectomía (n=1123)

0

20

40

60

80

100

Cáncer de pulmón (n=117)

172

ESTADÍSTICA ESPAÑOLA

Figura 8

SALUD MENTAL DE LOS PACIENTES EN LAS MUESTRAS ANALIZADAS. LAS BARRAS VERTICALES CORRESPONDEN A LA DISTRIBUCIÓN OBSERVADA Y LA CURVA REPRESENTA EL AJUSTE A LA DISTRIBUCIÓN NORMAL

0

20

40

60

80

100

0

20

40

60

80

100

0

20

Donantes de sangre (n=106)

40

60

80

100

0

Hipertensi ón arterial (n=20)

20

40

60

80

100

Trastornos alimenticios (n=298)

CVRS: Salud Mental

Poblaci ón normal (n=3953)

0

20

40

60

80

100

0

20

VIH (n=40)

0

20

40

60

40

60

80

100

0

EIIC (n=165)

80

Histerectomía (n=649)

100

0

20

40

60

20

40

60

80

100

0

Trasplante de higado (n=139)

80

100

Prótesis total de cadera (n=1266)

0

20

40

60

80

100

Prótesi s total de rodil la (n=1113)

Se han utilizado las siguientes abreviaturas: Virus de Inmunodeficiencia Humana (VIH), Enfermedad Inflamatoria Intestinal Crónica (EIIC).

20

40

60

80

100

Col ecistectomía (n=1123)

0

20

40

60

80

100

Cáncer de pulmón (n=117)

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

173

En funcionamiento físico, vemos una distribución muy sesgada a la izquierda (población general, donantes de sangre, TA, VIH, EIIC, colecistectomía e histerectomía) o a la derecha (PTC y PTR), dependiendo de la patología, así como otros grupos con una distribución muy plana (cáncer de pulmón y trasplante de hígado). El rol físico sigue una distribución claramente discreta, con 5 categorías en la mayoría de los grupos. Además, se observa que ninguna de estas distribuciones tiene forma de campana, teniendo algunas de ellas justamente lo contrario, una forma de campana invertida. En dolor corporal, se observan todo tipo de variaciones de la distribución empírica, sesgadas a la izquierda (población general, donantes, HTA, trasplante de hígado, EIIC y VIH), sesgadas a la derecha (PTC y PTR) y distribuciones muy planas (cáncer de pulmón, colecistectomía y TA). En salud general es donde se observa una mayor proporción de muestras con distribución en forma de campana, con mayor o menor sesgo, dependiendo del impacto que la enfermedad tiene en la salud general, pero en cualquier caso, su distribución parece aceptablemente normal. La vitalidad es un área en la que se observan distribuciones aceptablemente normales, con una forma acampanada en muchos de los casos, aunque se repite el patrón observado en el dolor corporal, con algunos de los grupos con una distribución muy plana (trasplante de hígado y EIIC). El funcionamiento social muestra una distribución discreta que, tal y como se observa en la tabla 1, consta de 9 posibles valores. Esto se refleja en el hecho de que, al dividir la escala de 0 a 100 en 10 intervalos, ningún individuo de los 8989 que forman la muestra total toma valores en el intervalo (50, 60). Al igual que lo que hemos mencionado para el dolor corporal y la vitalidad, algunos grupos, como TA, PTC y PTR, muestran una distribución muy plana. El rol emocional sigue un patrón similar al del rol físico, una distribución discreta con 4 categorías en la mayoría de los grupos y ninguno de ellos tiene forma acampanada. La salud mental muestra distribuciones aceptablemente normales, con una forma acampanada en muchos de los casos, aunque con colas mucho más pesadas de lo que se espera en una distribución normal. El contraste de bondad de ajuste a la distribución normal de KolmogorovSmirnov (corrección de Lilliefors para el caso concreto de normalidad), rechaza la normalidad en todas las áreas y en todas las muestras analizadas al nivel de significación establecido de α = 0,05, excepto en el área de funcionamiento físico (para la muestra de HTA), en el área de salud general (para las muestras de HTA, VIH y trasplante de hígado) y en el área de vitalidad (para las muestras de VIH y cáncer de pulmón). El problema reside, por una parte, en el sesgo. Así, se observan distribuciones muy sesgadas a la izquierda en general en todas las áreas, para la muestra de

174

ESTADÍSTICA ESPAÑOLA

población general o la muestra de donantes de sangre (individuos sanos); lo mismo ocurre en áreas como el funcionamiento físico en las muestras de TA, VIH o EIIC (pacientes jóvenes). Por otro lado, las mismas áreas muestran distribuciones muy sesgadas a la derecha en individuos en lista de espera para PTC o PTR (pacientes mayores). Esto muestra el poder de discriminación que tiene el instrumento en diferentes diagnósticos. Otro de los problemas que se observa es que muchas de las áreas muestran distribuciones muy planas en algunos, e incluso muchos de los grupos, como el dolor corporal y la vitalidad. Además se observa un problema de continuidad de la escala en las áreas de rol físico, rol emocional y funcionamiento social. En las dos primeras la escala es claramente discreta, mientras que en la tercera hay intervalos de la escala que no se cubren en ningún caso. Por último, muchas de las escalas muestran un efecto techo y/o suelo, esto quiere decir que un porcentaje muy alto de los individuos se sitúa en los valores más altos o más bajos de la escala, respectivamente. Así, la distribución de las áreas rol físico y rol emocional muestra, en ocasiones, un efecto techo, en otras ocasiones, un efecto suelo, y, en algunas otras ocasiones, ambas, ofreciendo una forma de campana invertida. Siguiendo el criterio de Walters et al. (2000) citado en la sección 3.3, una escala debe ser tratada como continua si el número de categorías es mayor o igual que 7 y como discreta en otro caso. Se utiliza el criterio en el análisis de muestras concretas de pacientes en los que se ha medido la CVRS con el SF-36 y otras variables susceptibles de influir en la CVRS. Vamos a mostrar casos continuos y discretos de CVRS, y se van a analizar con técnicas de análisis distintas, adecuadas a cada situación. Los resultados obtenidos se utilizan para ilustrar las diferentes alternativas de análisis de datos del SF-36 y su interpretación, con las limitaciones mencionadas previamente, en el ámbito clínico. El dolor y la limitación física son parámetros muy importantes a tener en cuenta en pacientes con osteoartrosis de cadera y/o rodilla, debido al impacto que ambas tienen en la CVRS de estos pacientes (Quintana et al. 2006). Las áreas de dolor corporal y funcionamiento físico del SF-36 miden el impacto que el dolor y la limitación física tienen en la CVRS. Como podemos observar en la tabla 1, estas áreas tienen 11 y 21 niveles, respectivamente, por tanto ambas se analizan como variables continuas. Así, se ha utilizado el modelo de regresión lineal múltiple para estudiar la influencia de variables sociodemográficas en el dolor corporal y el funcionamiento físico de pacientes con osteoartrosis en lista de espera para ser intervenidos de PTC en alguno de los hospitales de la Comunidad Autónoma Vasca. Para este análisis se han utilizado los pacientes de la muestra que aquí se presenta, para los cuales se disponía de las siguientes variables: fecha de nacimiento, sexo, fecha de indicación de la intervención, fecha de la intervención, nivel de estudios, situación laboral, estado civil y situación de convivencia familiar. Estas son las variables destacadas por los expertos en el área como factores susceptibles

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

175

de influir en la CVRS de los pacientes con osteoartrosis que van a ser intervenidos de PTC. Tras un análisis descriptivo y univariante exhaustivo de los datos recogidos, se han recodificado algunas de las variables originales hasta obtener las versiones de las covariables que finalmente se consideran en el análisis. La edad se ha calculado a partir de la fecha de nacimiento y se ha considerado como variable continua, medida en años y el tiempo de permanencia en lista de espera se ha obtenido de la diferencia entre la fecha de indicación de la intervención y la fecha de la intervención. El nivel de estudios se ha agrupado en: ninguno, primarios, y secundarios o más. La situación laboral se ha categorizado como laboralmente activo o inactivo, incluyendo este último grupo a las amas de casa. El estado civil y la situación de convivencia familiar se han unido para crear una nueva variable categorizada en tres niveles de la siguiente manera: casado o vive en pareja; soltero, separado o viudo pero que vive acompañado o en residencia; y soltero, separado o viudo que vive solo. Las variables nominales han sido introducidas en el modelo mediante variables indicador. Sólamente se dispone de datos sociodemográficos completos de 784 de los 1.266 individuos que componen la muestra inicial. El método de estimación utilizado para el modelo de regresión lineal planteado ha sido el de máxima verosimilitud, basado en la hipótesis de distribución normal. Sin embargo, y teniendo en cuenta que ninguna de estas dos áreas del SF-36 se ajusta a una distribución normal, se ha utilizado también el método bootstrap (Efron y Tibshirani 1993 y Davison y Hinkley 1997), método de distribución libre, donde esta hipótesis no es necesaria en la estimación de los coeficientes del modelo. Basándonos en las hipótesis que disponemos, el método de estimación correcto sería el bootstrap. El objetivo de utilizar ambos métodos es comprobar la influencia del incumplimiento de la hipótesis de normalidad en los resultados obtenidos y, consecuentemente, la robustez del método de estimación máximo verosímil bajo el supuesto erróneo de normalidad. Además, tal y como puede observarse en las figuras 1 y 3, ambas áreas se diferencian en la magnitud del sesgo, el área de dolor corporal, aún no siendo simétrica, tiene un sesgo moderado (coeficiente de asimetría de 0,8757), mientras que el área de funcionamiento físico tiene un sesgo más pronunciado (coeficiente de asimetría de 1,4582). La tabla 5 resume los resultados obtenidos para estas dos áreas del SF-36.

176

ESTADÍSTICA ESPAÑOLA

Tabla 5 ESTIMACIONES DE LOS COEFICIENTES Y SUS INTERVALOS DE CONFIANZA AL 95% PARA UN MODELO DE REGRESIÓN LINEAL MÚLTIPLE OBTENIDOS MEDIANTE MÁXIMA VEROSIMILITUD Y BOOTSTRAP PARA LAS DIMENSIONES DE FUNCIONAMIENTO FÍSICO Y DOLOR CORPORAL DEL SF-36 EN UNA MUESTRA DE 784 PACIENTES CON DIAGNÓSTICO DE OSTEOARTROSIS EN LISTA DE ESPERA PARA INTERVENCIÓN DE PRÓTESIS TOTAL DE CADERA (Continúa)

VARIABLES INDEPENDIENTES

MÁXIMA VEROSIMILITUD Coeficiente

IC 95%

Funcionamiento físico: Intercepto

34,063

(20,196, 47,929)

Edad (años)

−0,143

(−0,339, 0,052)

0,009

(−0,006, 0,024)

−5,929

(−9,177, −2,681)

– Ninguno

−6,631

(−12,176, −1,087)

– Primarios

−6,084

(−10,663, −1,505)

5,863

(−1,221, 12,946)

−1,867

(−7,052, 3,317)

0,016

(−5,825, 5,857)

23,770

(6,849, 40,691)

Edad (años)

0,326

(0,088, 0,565)

Tiempo de espera (días)

0,003

(−0,015, 0,022)

−7,134

(−11,097, −3,172)

– Ninguno

−9,924

(−16,665, −3,183)

– Primarios

−5,605

(−11,168, −0,041)

Trabajador inactivo

−1,817

(−10,470, 6,835)

– Casado

−5,242

(−11,522, 1,039)

– Soltero/vive acompañado

−3,607

(−10, 581, 3,583)

Tiempo de espera (días) Mujer Estudios:

Trabajador inactivo Situación familiar: – Casado – Soltero/vive acompañado

Dolor Corporal Intercepto

Mujer Estudios:

Situación familiar:

Se ha utilizado la abreviatura de IC: Intervalo de Confianza

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

177

Tabla 5 ESTIMACIONES DE LOS COEFICIENTES Y SUS INTERVALOS DE CONFIANZA AL 95% PARA UN MODELO DE REGRESIÓN LINEAL MÚLTIPLE OBTENIDOS MEDIANTE MÁXIMA VEROSIMILITUD Y BOOTSTRAP PARA LAS DIMENSIONES DE FUNCIONAMIENTO FÍSICO Y DOLOR CORPORAL DEL SF-36 EN UNA MUESTRA DE 784 PACIENTES CON DIAGNÓSTICO DE OSTEOARTROSIS EN LISTA DE ESPERA PARA INTERVENCIÓN DE PRÓTESIS TOTAL DE CADERA (Conclusión)

VARIABLES INDEPENDIENTES

BOOTSTRAP Coeficiente

IC 95%

Funcionamiento físico: Intercepto

34,025

(21,579, 49,067)

Edad (años)

−0,146

(−0,387, 0,034)

0,010

(−0,004, 0,025)

−5,839

(−9,048, −2,844)

– Ninguno

−6,632

(−13,069, −1,158)

– Primarios

−6,037

(−11,581, −1,650)

5,839

(0,231, 12,016)

−1,807

(−7,354, 2,431)

0,074

(−5,658, 5,647)

23,326

(7,362, 42,377)

Edad (años)

0,330

(0,094, 0,558)

Tiempo de espera (días)

0,004

(−0,014, 0,027)

−7,077

(−10,973, −3,575)

– Ninguno

−9,900

(−17,480, −3,238)

– Primarios

−5,610

(−12,122, −0,439)

Trabajador inactivo

−1,910

(−10,480, 5,640)

– Casado

−5,016

(−11,068, 0,537)

– Soltero/vive acompañado

−3,385

(−11,212, 3,352)

Tiempo de espera (días) Mujer Estudios:

Trabajador inactivo Situación familiar: – Casado – Soltero/vive acompañado

Dolor Corporal Intercepto

Mujer Estudios:

Situación familiar:

Se ha utilizado la abreviatura de IC: Intervalo de Confianza

178

ESTADÍSTICA ESPAÑOLA

En el caso del dolor corporal, ambos métodos muestran resultados similares, reflejando la robustez del modelo de regresión lineal múltiple para el área de dolor corporal del SF-36. Las variables que resultan tener una influencia significativa en el dolor corporal son la edad, el sexo y el nivel de estudios de los individuos. La escala de dolor corporal del SF-36 se interpreta de forma inversa, es decir, que a mayor puntuación, mejor CV en lo que respecta a dolor, es decir, menor dolor. De esta forma, a mayor edad se espera que el nivel de dolor sea menor, por cada 10 años de incremento de la edad se espera que la CV en lo que respecta al dolor mejore en 3,3 puntos (en una escala de 0 a 100) con un intervalo de confianza del 95% de 0,9 a 5,6, ajustando por sexo y nivel de estudios. Las mujeres tienen una CV 7 puntos inferior a la de los hombres de su misma edad y nivel de estudios en lo que respecta al dolor. Los individuos sin estudios o con sólo estudios primarios tienen una CV 9,9 ó 5,6 puntos inferior a la de los individuos con estudios secundarios de su misma edad y sexo, respectivamente, en lo que respecta al dolor. En el caso del funcionamiento físico, hay diferencias considerables en los resultados obtenidos entre ambos métodos. En la tabla 5 se puede observar que la variable situación laboral no resulta significativa para el método de estimación de máxima verosimilitud, mientras que sí lo es para el bootstrap. Esto se debe al hecho mencionado anteriormente, de que la variable funcionamiento físico tiene un sesgo importante en pacientes que van a ser intervenidos de PTC. Tal y como se ha mencionado anteriormente, consideramos válidos los resultados obtenidos mediante bootstrap, por tanto, estos son los resultados que se van a interpretar. Las variables que resultan tener una influencia significativa en el funcionamiento físico son el sexo, el nivel de estudios y la situación laboral de los individuos. Las mujeres tienen un funcionamiento físico 5,8 puntos inferior a la de los hombres de su mismo nivel de estudios y situación laboral, en una escala de 0 a 100 y con un intervalo de confianza del 95% de 2,8 a 9,0. Los individuos sin estudios o con sólo estudios primarios tienen un funcionamiento físico aproximadamente 6 puntos inferior a los individuos con estudios secundarios de su mismo sexo y situación laboral. Los individuos que trabajan de forma activa tienen un funcionamiento físico 5,8 puntos inferior a los individuos laboralmente inactivos de su mismo sexo y nivel de estudios. En las dos dimensiones analizadas, debemos hacer notar que las variables situación laboral y edad están relacionadas entre sí. Aunque la significación de la interacción ha sido rechazada en todos los modelos mencionados, no se descarta la existencia de colinealidad entre ambas, lo cual debiera ser tenido en cuenta a la hora de sacar conclusiones clínicas de estos resultados. Sin embargo, nuestro objetivo no se centra en las conclusiones clínicas, sino en la correcta elección de la técnica de análisis. Como hemos visto antes, el uso de modelos de regresión lineal múltiple permite medir la influencia de determinadas características en la CVRS esperada en un

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

179

individuo. De esta forma podemos comparar, como en los ejemplos anteriores, la diferencia de puntos esperada en la CVRS entre hombres y mujeres, y entre individuos con diferente nivel de estudios o situación laboral. Una alternativa de análisis a la RLM para escalas ordinales es el modelo de odds proporcionales, donde el logit de la probabilidad acumulada se representa como una función lineal de las covariables. En este modelo se asume que Y es una variable dependiente discreta ordinal con k, k > 2, categorías ordenadas de forma natural. Sean y1, y2,..., yn los valores observados en una muestra aleatoria simple de tamaño n de la variable Y. Definimos las probabilidades acumuladas como

θji = p1i + ..... + pji = P (Yi ≤ j)

j = 1,2,....,k

El objetivo es encontrar un modelo para describir θji en función de una matriz de datos correspondiente a p variables explicativas, X. La hipótesis principal del modelo de odds proporcionales es que la influencia de las variables explicativas es independiente del punto de corte de la probabilidad acumulada. El modelo general viene dado por la expresión: logit(θji) = β0j + β1xi1 + β2xi2 + …+ βpxip = β0j + Xβ y j = 1, 2, …, k −1,

i = 1,

2, …., n,

donde los vectores de parámetros son: β = (β1, β2, ..., βp)T, que mide la influencia de las covariables en la probabilidad acumulada, común para las (k – 1) ecuaciones; y el vector de los (k – 1) términos independientes, β0 = (β01, β02, ..., β0,k-1)T, específicos para cada una de las (k – 1) ecuaciones. La dimensión rol físico del SF-36 se trata como una escala ordinal de 5 valores, i. e. de 0 a 4. Se ha utilizado el modelo de odds proporcionales para estudiar la influencia de variables sociodemográficas y clínicas en el rol físico de pacientes con TA. Para este análisis se han utilizado los pacientes con TA de la muestra anteriormente mencionada, para los cuales se dispone de las siguientes variables: edad, sexo, tiempo de evolución de la enfermedad, índice de masa corporal, diagnós-ti-co, gravedad, nivel de ansiedad y depresión. Estas son las variables destacadas por los expertos en el área como potenciales factores predictivos de la CVRS en pacientes con TA (Padierna et al. 2000). Las variables seleccionadas como predictores significativos del rol físico en pacientes con TA en el modelo de odds proporcionales y la submuestra de 186 individuos en los que se tiene información sobre todas las variables son: tiempo de evolución de la enfermedad, gravedad y nivel de depresión. Las hipótesis de odds proporcionales no se rechazan, al nivel

180

ESTADÍSTICA ESPAÑOLA

de significación establecido, ni en general (p = 0,12), ni para ninguna de las 3 covariables en particular (p = 0,68, p = 0,18 y p = 0,41, respectivamente). La tabla 6 resume los resultados obtenidos en este análisis.

Tabla 6

ESTIMACIONES DE LOS COEFICIENTES, DESVIACIONES ESTÁNDAR Y NIVEL DE SIGNIFICACIÓN DEL MODELO DE ODDS PROPORCIONALES SELECCIONADO PARA LA DIMENSIÓN DE ROL FÍSICO DEL SF-36 EN UNA MUESTRA DE 186 PACIENTES CON TRASTORNOS DE ALIMENTACIÓN ESTIMACIÓN

DESVIACIÓN ESTÁNDAR

Intercepto 4

1,5474

0,3543

< 0,0001

Intercepto 3

2,2843

0,3765

< 0,0001

Intercepto 2

2,7966

0,3930

< 0,0001

COVARIABLE

Intercepto 1 Depresión Gravedad: Moderada Grave Tiempo de evolución

p-VALOR

3,5147

0,4175

< 0,0001

−1,5381

0,3475

< 0,0001

−1,8039

0,4131

< 0,0001

−2,0093

0,4051

< 0,0001

−0,0613

0,0222

0,0057

La interpretación del coeficiente de la variable depresión en este modelo ( βˆ = −1,5381, por tanto una tasa de odds estimada de e-1,5381 = 0,215, con un intervalo de confianza del 95% de 0,109 a 0,424), es que un paciente con depresión reduce a una cuarta parte la probabilidad de mejorar en un punto su rol físico con respecto a otro sin depresión (en una escala de 0 a 4), en igualdad de condiciones de gravedad y tiempo de evolución de la enfermedad, siendo esta reducción estadísticamente significativa. Igualmente, los coeficientes de la variable gravedad en este modelo ( βˆ MOD = −1,8039 y βˆ GRAV = −2,0093, por tanto una tasa de odds estimada de e-1,8039 = 0,165, con un intervalo de confianza del 95% de 0,073 a 0,370 para pacientes con gravedad moderada versus pacientes leves y e-2,0093 = 0,134, con un intervalo de confianza del 95% de 0,061 a 0,297 para pacientes graves versus pacientes leves), indican que un paciente con una gravedad moderada reduce a una sexta parte y un paciente grave a una séptima parte la probabilidad de mejorar en un punto su rol físico con respecto a un paciente leve (en una escala de 0 a 4), en igualdad de condiciones de depresión y tiempo de evolución de la enfermedad, siendo esta reducción estadísticamente significativa en ambos casos. Por último, en el caso del tiempo de evolución de la enfermedad, βˆ = −0,0613, correspondiente a una tasa de odds estimada de e-0,0613 = 0,941, con un intervalo de confianza del

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

181

95% de 0,900 a 0,982, indica que cada año de más con la enfermedad reduce de 1 a 0,94 la probabilidad de mejorar en un punto su rol físico (en una escala de 0 a 4), en igualdad de condiciones de gravedad y depresión, siendo esta reducción estadísticamente significativa. El uso de métodos ordinales como el modelo de odds proporcionales permite obtener resultados sobre la influencia de determinadas características en la CVRS, y medir esta influencia por medio de la tasa de odds, que como estimador del riesgo relativo es un parámetro con muy buena aceptación en el ámbito clínico.

CONCLUSIONES Los métodos de análisis clásicos basados en la distribución normal, como la regresión lineal múltiple, son bastante robustos. Sin embargo, un incumplimiento de la normalidad tan claro y sistemático en casi todas las áreas del SF-36, puede hacer que los resultados obtenidos de un análisis a otro varíen de forma sustancial, afectando esto de forma significativa a las conclusiones clínicas derivadas del análisis de datos. Por este motivo, se sugiere suma cautela en la utilización de la regresión lineal múltiple y otras técnicas basadas en la distribución normal en el análisis de datos de CVRS recogidos mediante el cuestionario SF-36. Este trabajo pone de manifiesto la importancia de comprobar las hipótesis de las técnicas de análisis estadístico utilizadas en el análisis de datos de CVRS, más concretamente en el análisis de datos procedentes del cuestionario de salud SF-36. En caso de incumplimiento de alguna de las hipótesis es necesario comprobar la robustez de los métodos utilizados. El método seleccionado para el análisis de los datos tiene una importancia clara en la interpretación de los resultados obtenidos y, por tanto, en las conclusiones obtenidas en los mismos. Es decir, mientras que los modelos de regresión lineal múltiple, que utilizan una variable dependiente continua, ofrecen resultados en términos de diferencia esperada en la CV medida en una escala continua (habitualmente de 0 a 100) entre determinados grupos de individuos; los modelos de regresión ordinal, que utilizan una variable dependiente ordinal ofrecen resultados en términos de tasa de odds o incremento/reducción de la probabilidad de tener mejor o peor CVRS para determinados grupos de individuos con respecto de otros. Diferentes técnicas de análisis nos llevan a obtener diferentes resultados y conclusiones. Por tanto, el método de análisis a utilizar debe ser seleccionado basándonos, entre otras cosas, en los objetivos planteados y el tipo de conclusiones que se desean obtener.

182

ESTADÍSTICA ESPAÑOLA

Por último, en muchos casos se desea realizar un estudio sobre los factores de influencia en la CVRS, considerando todas las dimensiones del cuestionario SF-36, de forma independiente. En este caso, es preferible utilizar la misma técnica de análisis para todas las dimensiones, puesto que de esta forma se podrán comparar los resultados obtenidos en las 8 dimensiones conjuntamente. Resulta difícil cumplir este cometido basándonos en las recomendaciones de Walters et al. (2001), puesto que los niveles de las dimensiones del SF-36 varían de 4 a 26 (ver tabla 1). Por un lado, se recomienda especial cautela al utilizar técnicas de variables continuas para el análisis de dimensiones con 4 ó 5 modalidades (como el rol emocional y el rol físico), comprobando, en la medida de nuestro alcance, la robustez de las técnicas utilizadas. Por otro lado, el utilizar alternativamente técnicas de variables ordinales exige una categorización de la dimensión, con los problemas que esto conlleva de pérdida de información y criterios subjetivos de puntos de corte. Además, las hipótesis de las técnicas de modelos ordinales también deben ser comprobadas previamente. Por ejemplo, en el modelo de odds proporcionales utilizado en uno de los ejemplos que se muestra en este trabajo, la hipótesis principal es que la influencia de las variables explicativas sea independiente del punto de corte de la probabilidad acumulada. En muchas ocasiones esta hipótesis no se verifica para alguna de las covariables de interés que se desea incluir en el modelo. Por tanto, se debería pensar en otras alternativas como un modelo de odds parcialmente proporcionales. Nosotros proponemos una alternativa de análisis de las áreas del SF-36 basada en la distribución beta-binomial. En una publicación reciente (Arostegui et al. 2007) se muestra la adaptación de los datos del SF-36 a la distribución beta-binomial, con el cumplimiento de las hipótesis necesarias para la aplicación del método de regresión beta-binomial, y los resultados obtenidos mediante la regresión beta-binomial son muy similares a los obtenidos mediante la regresión lineal múltiple en aquellas áreas del SF-36 aceptablemente continuas y con un sesgo moderado, y similares a los obtenidos mediante el modelo de odds proporcionales o parcialmente proporcionales en las áreas ordinales del SF-36, con la ventaja añadida de que todas las áreas se analizan con la misma técnica. Además, el método de regresión betabinomial permite obtener resultados en términos de la tasa de odds, que como hemos indicado anteriormente, es un parámetro con muy buena aceptación en el ámbito clínico. Finalmente, los autores debemos mencionar que el objetivo de este trabajo, en ningún caso es sacar conclusiones clínicas de los datos aquí presentados, ni su generalización a la población general, ni a poblaciones específicas de las cuales las muestras pudieran ser representativas; dado que, tal y como hemos indicado anteriormente, esta labor es propia de los especialistas clínicos respectivos. Si se han interpretado resultados concretos, ha sido con el objeto de mostrar al lector poco familiarizado con este tipo de análisis de datos, las diferentes formas de

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

183

obtener conclusiones de diversas técnicas de análisis de datos en el ámbito de la epidemiología clínica.

REFERENCIAS AARONSON, N.K. (1989). «Quality of life assessments in clinical trials: Methodological issues». Controlled Clinical Trials 10 (Suppl.), 195S-208S. AARONSON, N.K., ACQUADRO, C., ALONSO, J., APOLONE, G., BUCQUET, D., BULLINGER, M., BUNGAY, K., FUKUHARA, S., GANDEK, B., KELLER, S., RAZAVI, R., SANSONFISHER, M., SULLIVAN, S., WOOD-DAUPHINEE, S., WAGNER, A. Y WARE, J.E. (1992). «International quality of life assessment (IQOLA) project». Quality of Life Research 1(5), 349-351. ALONSO, J., PRIETO, L. Y ANTÓ, J.M. (1995). «La versión española del SF-36 Health Survey (Cuestionario de Salud SF-36): Un instrumento para la medida de los resultados clínicos». Medicina Clínica 104(20), 771-776. ANDERSON, J.P., KAPLAN, R.M., COONS, S.J. Y SCHNEIDERMAN, L.J. (1998). «Comparison of the Quality of Well Being Scale and the SF-36 results among two samples of ill adults: AIDS and other illnesses». Journal of Clinical Epidemiology 51(9), 755-762. ANITUA, C. Y QUINTANA, J.M. (1999). «Valores poblacionales del índice de salud SF36 en el País Vasco: Importancia y aplicación en la práctica clínica». Osasunkaria 17, 10-17. APOLONE, G., CIFANI, S., LIBERATI, M.C. Y MOSCÓN, P. (1997). «Questionario sullo stato di salute SF-36. Traduzione e validazione della versione italiana: Risultati del progetto IQOLA». Metodologia e Didattica Clinica 5, 86-94. AROSTEGUI, I., NÚÑEZ-ANTÓN, V. Y QUINTANA, J.M. (2007). «Analysis of the Short Form – 36 (SF-36): The beta-binomial distribution approach». Statistics in Medicine 26(6) 1318-1342. BADÍA, X., SALAMERO, M. Y ALONSO, J. (1999). «La Medida de la Salud.» Guía de Escalas de Medición en Español (2ª edición). Edimac: Barcelona. BEATON, D.E., BOMBARDIER, C., KATZ, J.N. Y WRIGHT, J.G. (2001). «A taxonomy for responsiveness». Journal of Clinical Epidemiology 54(12), 1204-1217. BOWLING, A. (1991). «Measuring Health: A Review of Quality of Life Measurements Scales». Open University Press: Philadelphia.

184

ESTADÍSTICA ESPAÑOLA

BRAZIER, J.E., HARPER, R., JONES, N.M.B., O´CATHAIN, A., THOMAS, K.J., USHERWOOD, T. Y WESTLAKE, L. (1992). «Validating the SF-36 Health Survey questionnaire: New outcome measure for primary care». British Medical Journal 305(6846), 160-164. BUBIEN, R.S., KNOTTS-DOLSON, S.M., PLUMB, V.J. Y KAY, G.N. (1996). «Effect of radiofrequency catheter ablation on health-related quality of life and activities of daily living in patients with recurrent arrhythmias». Circulation 94(7), 1585-1591. BULLINGER, M. (1995). «German translation and psychometric testing of the SF-36 Health Survey: Preliminary results from the IQOLA project, international quality of life assessment». Social Science and Medicine 41(10), 1359-1366. CAMPBELL, D. Y FISKE, D. (1959). «Convergent and discriminant validation by the multitrait-multimethod matrix». Psychological Bulletin 56(2), 81-105. CHEUNG, Y. -B., THUMBOO, J., MACHIN, D., FENG, P.-H., BOEY, M.L., THIO, S.T. Y FONG, K.-Y. (2004). «Modelling variability of quality of life scores: A study of questionnaire version and bilingualism». Quality of Life Research 13(5), 897-906. CLANCY, C.M. Y EISENBERG, J.M. (1998). «Outcomes research: Measuring the end results of health care» Science 282(5387), 245-246. COULEHAN, J.L., SCHULBERG, H.C., BLOCK, M.R., MADONIA, M.J. Y RODRIGUEZ, E. (1997). «Treating depressed primary care patients improves their physical, mental and social functioning». Archives of Internal Medicine 157(10), 11131120. COX, D.R., FITZPATRICK, R., FLETCHER, A.E., GORE, S.M., SPIEGELHALTER, D.J. Y JONES, D.R. (1992). «Quality-of-life assessment: Can we make it simple?». Journal of the Royal Statistical Society: Series A 155(3), 353-393 (with discussion). CRONBACH, L.J. (1951). «Coefficient alpha and the internal structure of tests». Psychometrika 16(2), 297-334. DAVISON, A.C. Y HINKLEY, D.V. (1997). «Bootstrap Methods and Their Applications». Cambridge University Press: Cambridge. DAWSON, J., FITZPATRICK, R., CARR, A. Y MURRAY, D. (1996). «Questionnaire on the perceptions of patients about total hip replacement» The Journal of Bone and Joint Surgery. British volume 78(2), 185-190. DE VET, H.C., BOUTER, L.M., BEZEMER, P.D. Y BEURSKENS, A.J. (2001). «Reproducibility and responsiveness of evaluative outcome measures». International Journal of Technology Assessment in Health Care 17(4), 479-487.

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

185

DONOVAN, K., SANSON-FISHER, R.W. Y REDMAN, S. (1989). «Measuring quality of life in cancer patients». Journal of Clinical Oncology 7(7), 959-968. EFRON, B. Y TIBSHIRANI, R.J. (1993). «An Introduction to the Bootstrap». Chapman & Hall: New York. ETXEBARRIA, Y., PÉREZ-IZQUIERDO, J., BADIOLA, C., QUINTANA, J.M., PADIERNA, A., AROSTEGUI, I. Y CAPELASTEGUI, A. (2001). «Evaluación de la calidad de vida en pacientes con cáncer de pulmón». Gaceta Sanitaria 15 (1), 25-31. FAIRCLOUGH, D. (2002). «Design and Analysis of Quality of Life Studies in Clinical Trials». Chapman and Hall: London. FAYERS, P.M. Y HAND, D.J. (1997). «Factor analysis, causal indicators, and quality of life». Quality of Life Research 6(2), 139-150. FAYERS, P.M. Y MACHIN, D. (2000). «Quality of Life. Assessment, Analysis and Interpretation» Wiley: London. FAYERS, P.M., GROENVOLD, M., HAND, D.J. Y BJORDAL, K. (1998). «Clinical impact versus factor analysis for quality of life questionnaire construction». Journal of Clinical Epidemiology 651(3), 285-286. FERRER, M., ALONSO, J., MORERA, J., MARRADES, R.M., KHALAF, A., AGUAR, M.C., PLAZA, V., PRIETO, L. Y ANTÓ, J.M. (1997). «Chronic obstructive pulmonary disease stage and health-related quality of life. The quality of life of chronic obstructive pulmonary disease study group». Annals of Internal Medicine 127(12), 1072-1079. GANDEK, B. Y WARE, J.E. (1998). «Methods for validating and norming translations of health status questionnaires: The IQOLA project approach». Journal of Clinical Epidemiology 51(11), 953-959. GARRATT, A.M., SCHMIDT, L., MACKINTOSH, A. Y FITZPATRICK, R. (2002). «Quality of life measurement: Bibliographic study of patient assessed health outcome measures» British Medical Journal 324(7351), 1417-1421. GOLDSMITH, S.B. (1972). «The status of health status indicators» Health Services Reports 87(3), 212-220. GOLDSMITH, S.B. (1973). «A reevaluation of health status indicator». Health Services Reports 88(10), 937-941. GONZÁLEZ, N., QUINTANA, J.M., AROSTEGUI, I., PADIERNA, A., MARTÍNEZ E., CRESPO, I. Y VESGA, M.A. (2005). «Translation and psychometric testing of the Basque version of the SF-36 health survey». Quality of Life Research 14(2), 549-554.

186

ESTADÍSTICA ESPAÑOLA

GUYATT, G.H., WALTER, S.D. Y NORMAN, G.R. (1987). «Measuring change over time: Assessing the usefulness of evaluative instruments». Journal of Chronic Diseases 40(2), 171-178. GUYATT, G.H., FEENY, D.H. Y PATRICK, D.L. (1993). «Measuring health-related quality of life». Annals of Internal Medicine 118(8), 622-629. HARPER, R., BRAZIER, J.E., WATERHOUSE, J.C., WALTERS, S.J., JONES, N.M.B. Y HOWARD, P. (1997). «Comparison of outcome measures for patients with Chronic Obstructive Pulmonary Disease (COPD) in an outpatient setting». Thorax 52(10), 879-887. HASSAN, I.S., BANNISTER, B.A., AKBAR, A., WEIR, W. Y BOFILL, M. (1998). «A study of the immunology of the chronic fatigue syndrome: Correlation of immunologic parameters to health dysfunction». Clinical Immunology and Immunopathology 87(1), 60-67. HAYS, R.D., ANDERSON, R. Y REVICKI, D. (1993). «Psychometric considerations in evaluating health-related quality of life measures». Quality of Life Research 2(6), 441-449. HEMINGWAY, H., STAFFORD, M., STANSFELD, S., SHIPLEY, M. Y MARMOT, M. (1997). «Is the SF-36 a valid measure of change in population health? Results from the Whitehall II study». British Medical Journal 315(7118), 1273-1279. JACOBSON, A.M., DE GROOT, M. Y SAMSON, J.A. (1994). «The evaluation of two measures of quality of life in patients with type I and type II diabetes». Diabetes Care 17(4), 267-274. JUNIPER, E.F., GUYATT, G.H., STREINER, D.L. Y KING, D.R. (1997). «Clinical impact versus factor analysis for quality of life questionnaire construction». Journal of Clinical Epidemiology 50(3), 233-238. KARNOFSKY, D.A. Y BURCHERNAL, J.H. (1949). «The clinical evaluation of chemotherapeutic agents in cancer». En: Evaluation of Chemotherapeutic Agents (C.M. McLeod ed.). Columbia University Press: New York, 191-205. KATZ, S. Y AKPOM, C.A. (1976). «A measure of primary sociobiological functions». International Journal of Health Services 6(3), 493-507. KOMAROFF, A.L., FAGIOLI, L.R., DOOLITTLE, T.H., GANDEK, B., GLEIT, M.A., GUERREIRO, R.T., KORNISH, J., WARE, N.C., WARE, J.E. Y BATES, D.W. (1996). «Health status in patients with chronic fatigue syndrome and in general population and disease comparison groups». American Journal of Medicine 101(3), 281-290.

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

187

LAFORGE, R.G., ROSSI, J.S., PROCHASKA, J.O., VELICER, W.F., LEVESQUE, D.A. Y MCHORNEY, C.A. (1999). «Stage of regular exercise and health-related qualityof-life». Preventive Medicine 28(4), 349-360. LALL, R., CAMPBELL, M.J., WALTERS, S.J., MORGAN, K. Y MRC CFAS (2002). «A review of ordinal regression models applied on health-related quality of life assessments» Statistical Methods in Medical Research 11(1), 49-67. LEE, P.P., SPRITZER, K. Y HAYS, R.D. (1997). «The impact of blurred vision on functioning and well-being» Ophthalmology 104(3), 390-396. LEIDY, N.K., ELIXHAUSER, A., VICKREY, B., MEANS, E. Y WILLIAN, M.K. (1999). «Seizure frequency and the health-related quality of life of adults with epilepsy». Neurology 53(1), 162-166. LOHR, K.N. (2002). «Assessing health status and quality-of-life instruments: Attributes and review criteria». Quality of Life Research 11(3), 193-205. LYONS, R.A., LO, S.V. Y LITTLEPAGE, B.N.C. (1994). «Comparative health status of patients with 11 common illnesses in Wales». Journal of Epidemiology and Community Health 48(4), 388-390. MAHLER, D.A. Y MACKOWIAK, J.I. (1995). «Evaluation of the Short-Form 36-item questionnaire to measure health-related quality of life in patients with COPD» Chest 107(6), 1585-1589. MANGIONE, C.M., PHILLIPS, R.S., LAWRENCE, M.G., SEDDON, J.M., ORAV, E.J. Y GOLDMAN, L. (1994). «Improved visual function and attenuation of declines in healthrelated quality of life cataract extraction». Archives of Ophthalmology 112(11), 1419-1425. MATHSOFT INC. (1999). «S-PLUS 2000 User´s Guide». MathSoft, Data Analysis Products Division: Seattle, WA. MCCALLUM, J. (1995). «The SF-36 in an Australian sample: Validating a new generic health status measure». Australian Journal of Public Health 19(2), 160-166. MCDOWELL, I. Y NEWELL, C. (1996). «Measuring Health: A Guide to Rating Scales and Questionnaires» (2nd edition). Oxford University Press: New York. MCHORNEY, C.A. (1999). «Health status assessment methods for adults: Past accomplishments and future challenges». Annual Review of Public Health 20, 309-335. MESBAH, M.F., COLE, B. Y TING LEE, M. (2002). «Statistical Methods for Quality of Life Studies. Design, Measurements and Analysis». Kluwer Academic Publishers: Boston, MA.

188

ESTADÍSTICA ESPAÑOLA

MOZES, B., MAOR, Y SHMUELI, A. (1999). «The competing effects of disease states on quality of life of the elderly: The case of urinary symptoms in men». Quality of Life Research 8(1-2), 93-99. MURAWSKI, M.M. Y MIEDERHOFF, P.A. (1998). «On the generalizibility of statistical expressions of the health related quality of life instrument responsiveness: A data synthesis». Quality of Life Research 7(1), 11-22. O´BRIEN, P.C. (1984). «Procedures for comparing samples with multiple endpoints». Biometrics 40(4), 1079-1087. OLSCHEWSKI, M. Y SCHUMACHER, M. (1990). «Statistical analysis of quality of life data in cancer clinical trials». Statistics in Medicine 9(7), 749-763. PADIERNA, A., QUINTANA, J.M., AROSTEGUI, I., GONZÁLEZ, N. Y HORCAJO, M.J. (2000). «The health-related quality of life in eating disorders». Quality of Life Research 9(6), 667-674 PADIERNA, A., QUINTANA, J.M., AROSTEGUI, I., GONZÁLEZ, N. Y HORCAJO, M.J. (2002). «Changes in health related quality of life among patients treated for eating disorders». Quality of Life Research 11(6), 545-552. PATRICK, D.L. Y DEYO, R.A. (1989). «Generic and disease-specific measures in assessing health status and quality of life». Medical Care 27(3 Suppl.), S217S232. PATRICK, D.L., DEYO, R.A., ATLAS, S.J., SINGER, D.E., CHAPIN, A. Y KELLER, R.B. (1995). «Assessing health-related quality of life in patients with sciatica». Spine 20(17), 1899-1909. PERNEGER, T.V., LEPLEGE, A., ETTER, J.F. Y ROUGEMONT, A. (1995). «Validation of a French language version of the MOS 36 item short form health survey (SF-36) in young healthy adults» Journal of Clinical Epidemiology 48(8), 1051-1060. POCOCK, S.J., GELLER, N.L. Y TSIATIS, A. (1987). «The analysis of multiple endpoints in clinical trials». Biometrics 43(3), 487-498. QUINTANA, J.M., AROSTEGUI, I., CABRIADA, J., LÓPEZ DE TEJADA, I. Y PÉRDIGO, L. (2003). «Predictors of health-related quality of life improvement among patients undergoing cholecystectomy». British Journal of Surgery 90(12), 1549-1555. QUINTANA, J.M., AROSTEGUI, I., ORIBE, V., LÓPEZ DE TEJADA, I., BARRIOS, B. Y GARAI, I. (2005). «Influence of age and gender on quality of life outcomes after cholecystectomy». Quality of Life Research 14(3), 815-825.

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

189

QUINTANA, J.M., ESCOBAR, A., AROSTEGUI, I., BILBAO, A., AZKARATE, J., GOENAGA, J.I. Y ARENAZA, J.C. (2006). «Health-related quality of life and appropriateness of knee or hip joint replacement». Archives of Internal Medicine 166(2), 220-226. REVICKI, D.A., WU, A.W. Y MURRIA, M.I. (1995). «Change in clinical status, health status, and health utility outcomes in HIV-infected patients». Medical Care 33(4), 173-182. ROSE, M.S., KOSHMAN, M.L., SPRENG, S. Y SHELDOM, R. (1999). «Statistical issues encountered in the comparison of health-related quality of life in disease patients to published general population norms: Problems and solutions». Journal of Clinical Epidemiology 52(5), 405-412. SANZ, J. (1991). «Valor y cuantificación de la calidad de vida en medicina». Medicina Clínica 96, 66-69. SAS INSTITUTE INC. (1994). «SAS Procedures Guide, Version 6». SAS Institute: Cary, NC. STANSFELD, S.A., ROBERTS, R. Y FOOT, S.P. (1997). «Assessing the validity of the SF-36 general Health Survey». Quality of Life Research 6(3), 217-224. STREINER, D.L. Y NORMAN, G.R. (1992). «Health Measurement Scales». Oxford University Press: New York. SULLIVAN, M., KARLSSON. J. Y WARE, J.E. (1995). «The Swedish SF-36 Health Survey. I. Evaluation of data quality, scaling assumptions, reliability and construct validity across general population in Sweden». Social Science and Medicine 41(10), 1349-1358. TESTA, M.A. Y NACKLEY, J.F. (1994). «Methods for quality of life studies». Annual Review of Public Health 15, 535-559. TESTA, M.A. Y SIMONSON, D.C. (1996). «Assessment of quality of life outcomes». New England Journal of Medicine 334(13), 835-840. TORRANCE, G.W. (1987). «Utility approach to measuring health-related quality-oflife». Journal of Chronic Diseases 40(6), 593-600. TORRES, X., ARROYO, S., ARAYA, S. Y DE PABLO, J. (1999). «The Spanish version of the Quality of Life in Epilepsy Inventory (QOLIE-31): Translation, validity and reliability». Epilepsia 40(9), 1299-1304. TSEVAT, J., SOLZAN, J.G., KUNTZ, K.M., RAGLAND, J., CURRIER, J.S., SELL, R.L. Y WEINSTEIN, M.C. (1996). «Health values of patients infected with human immunodeficiency virus. Relationship to mental health and physical functioning». Medical Care 34(1), 44-57.

190

ESTADÍSTICA ESPAÑOLA

VAN KNIPPENBERG, F.C. Y DE HAES, J.C. (1988). «Measuring quality of life of cancer patients: Psychometric properties of instruments». Journal of Clinical Epidemiology 41(11), 1043-1055. VILAGUT, G., FERRER, M., RAJMIL, L., REBOLLO, P., PERMANYER-MIRALDA, G., QUINTANA, J.M., SANTED, R., VALDERAS, J.M., RIBERA, A., DOMINGO-SALVANY, A. Y ALONSO, J. (2005). «El cuestionario de salud SF-36 español: Una década de experiencia y nuevos desarrollos». Gaceta Sanitaria 19(2), 135:150. WACHTEL, T., PIETTE, J., MOR, V., STEIN, M., FLEISHMAN, J. Y CARPENTER, C. (1992). «Quality of life in persons with human immunodeficiency virus infection: Measurement by the Medical Outcomes Study instrument». Annals of Internal Medicine 116(2), 129-137. WAHL, A., MOUM, T., HANESTAD, B.R. Y WIKLUND, I. (1999). «The relationship between demographic and clinical variables, and quality of life aspects in patients with psoriasis». Quality of Life Research 8(4), 319-326. WALTERS, S.J. Y CAMPBELL, M.J. (2005). «The use of bootstrap methods for estimating sample sizes and analyzing health related quality of life outcomes». Statistics in Medicine 24(7), 1075-1102. WALTERS, S.J., CAMPBELL, M.J., Y LALL, R. (2001). «Design and analysis of trials with quality of life as an outcome: A practical guide». Journal of Biopharmaceutical Statistics 11(3), 155-176. WARE, J.E. (2000). «SF-36 Health Survey update». Spine 25(24), 3130-3139. WARE, J.E. Y SHERBOURNE, C.D. (1992). «The MOS 36-item Short Form Health Survey (SF-36): I. Conceptual framework and item selection». Medical Care 30(6), 473-483. WARE, J.E., KOSINSKI, M.A. Y KELLER, S.K. (1994). «Physical and Mental Health» Summary Scales: A User´s Manual. The Health Institute, New England Medical Center: Boston, MA. WARE, J.E., KOSINSKI, M.A. Y DEWEY, J.E. (2000). «How to score version 2 of the SF36 Health Survey» Quality Metric Incorporated: Lincoln, RI. WARE, J.E., SNOW, K.K., KOSINSKI, M.A. Y GANDEK, B. (1993). «SF-36 Health Survey, Manual and Interpretation Guides». The Health Institute, New England Medical Center: Boston, MA.

ASPECTOS ESTADÍSTICOS DEL CUESTIONARIO DE CALIDAD DE VIDA RELACIONADA CON SALUD …

191

WARE, J.E., GANDEK, B., KELLER, S.D. Y THE IQOLA Project Group. (1996a). «Evaluating instruments used cross-nationally: Methods from the IQOLA» project. En: «Quality of Life and Pharmacoeconomics in Clinical Trials» (2nd edition) (B. Spilker ed.). Raven Press: New York, 681-692. WARE, J.E., BAYLISS, M.S., ROGERS, W.H., KOSINSKI, M. Y TARLOV, A.R. (1996b). «Differences in 4-year health outcomes for elderly and poor, chronically ill patients treated in HMO and fee-for-service systems. Results from the MOS» Journal of the American Medical Association 276(13), 1039-1047. WARE, J.E., KELLER, S.D., GANDEK, B., BRAZIER, J.E., SULLIVAN, M. Y THE IQOLA Project Group (1995). «Evaluating translations of health status questionnaires: Methods from the IQOLA project». International Journal of Technology Assessment in Health Care 11(3), 525-551. WILSON, I.B. Y KAPLAN, S. (1995). «Clinical practice and patients´ health status: How are the two related?». Medical Care 33 (4 Suppl.), AS209-AS214. WILSON, D., PARSONS, J. Y WAKEFIELD, M. (1999). «The health-related quality-of-life of never smokers, ex-smokers and light, moderate and heavy smokers». Preventive Medicine 29(3), 139-144. WORLD HEALTH ORGANIZATION (1952). En: «World Health Organization». Handbook of Basic Documents. (5th edition). Palais des Nations: Ginebra, 3-20.

192

ESTADÍSTICA ESPAÑOLA

STATISTICAL ASPECTS OF THE HEALTH RELATED QUALITY OF LIFE QUESTIONNAIRE SHORT FORM- 36 ( SF-36) ABSTRACT Health Related Quality of Life (HRQoL) is an important parameter to measure health outcomes. It is a difficult concept to measure and questionnaires are used to measured it. The psychometric properties of a questionnaire, its cultural adaptation, the design of the study and the analysis of the results are relevant statistical issues that must be treated with caution. The Health Survey SF-36 is one of the most widely used, validated and translated instrument in the field of HRQoL measurements. This work intends to highlight the importance of testing the hypothesis of a model before choosing and evaluating a given statistical analysis in those studies where the SF-36 has been used. Examples of application of the SF-36 are provided, as well as more specific analysis to show that, depending on the statistical analysis used, results can be different and, in addition, they can also have different clinical relevance in the context of the application. Key words: quality of life, SF-36, statistical analysis, goodness of fit. AMS Classification: 62J05, 62J12, 62P10.