VARIACIONES REGIONALES EN LA MORTALIDAD POR CÁNCER DE MAMA EN LA PROVINCIA DE SANTA FE. GEO-REFERENCIAMIENTO EN BASE A MODELOS ESTADÍSTICOS

Leticia Hachuel*

Gabriela Boggio*

Nora Arnesi*

Facultad de Ciencias Económicas y Estadística

Universidad Nacional de Rosario.

Resumen. Los mapas para mostrar la distribución geográfica de ocurrencia de enfermedades tales como el cáncer en una región o país particular generalmente utilizan las denominadas Razones de Mortalidad Estandarizadas (RME). Las RME se construyen comparando el número observado de casos en la población bajo estudio con su valor esperado y se expresan en porcentaje. En este trabajo el valor esperado se calcula mediante el ajuste de un modelo de regresión marginal Poisson que considera efectos de los diferentes grupos de edad en cada región. Las RME por edad así obtenidas para cada área posteriormente se fortalecen mediante el ajuste de un modelo mixto de manera de obtener estimaciones más estables. Este procedimiento se utiliza para el estudio de la mortalidad por cáncer de mama en la provincia de Santa Fe para el período 2000-2008. La metodología estadística propuesta permite la estimación de este indicador de mortalidad a nivel departamental, controlando no sólo el impacto que pueden producir las diferencias en las estructuras por edad de las poblaciones de cada departamento sino también haciendo uso de la información conjunta de todos ellos.

Palabras clave: Razones de mortalidad estandarizadas; Modelo Poisson; Modelo mixto

Abstract.The maps showing the geographical distribution of occurrence of diseases, such as cancer, in a region or a particular country do generally make use of the standardized mortality ratio (SMR). The SMR are obtained comparing the observed number of cases in the studied population to its expected value and are expressed as a percentage. In this work the expected value of cases for a particular disease is calculated by adjusting a marginal Poisson regression model that takes into account the effects of the different age groups in each region. The resultant SMR for each area is later strengthened through the setting of a mixed model in order to obtain more stable estimates. We employ this procedure to study the mortality caused by breast cancer in the province of Santa Fe, Argentina, between 2000 and 2008. The proposed statistical methodology allows to estimate the SMR at the departmental level, controlling not only the impact that can arise from the differences in the structures by age in the population of each Department but also making a global use of the information emerging from all of them.

Key words: Standardized mortality ratio; Poisson model; Mixed model



Original recibido el 28-05-2012

Aceptado para su publicación el 27-09-2012



1.Introducción

El estudio de la mortalidad por causa revela el perfil de salud y la gama de problemas que debe afrontar una población. También permite orientar acciones preventivas para evitar la enfermedad y/o muerte por determinadas causas en los diferentes grupos etarios (Elizaga, 1979). En Argentina, de acuerdo a la Liga Argentina de Lucha contra el Cáncer (LALCEC, 2009), el cáncer de mama ocupa el primer lugar entre los tumores malignos que afectan a las mujeres. Si bien la presencia de esta patología ha ido aumentando a lo largo de los años, es importante destacar que como consecuencia de su detección temprana la mortalidad ha ido descendiendo.

A pesar de que las tasas crudas de mortalidad constituyen una medida resumen de la experiencia de cada población no resultan apropiadas cuando se las utiliza con fines comparativos. En particular esto sucede cuando las poblaciones difieren en factores tales como edad y sexo. Una alternativa es el cálculo de tasas específicas por grupos aunque ellas resultan imprecisas cuando están referidas a subpoblaciones muy pequeñas y no proporcionan una única medida resumen.

La estandarización de tasas es un método epidemiológico clásico que remueve el efecto confusor de variables que se suponen difieren en las poblaciones a comparar y proporciona un único valor que resume la experiencia de la población.

En los estudios comparativos de mortalidad el factor por el cual se ajusta frecuentemente es edad ya que la estructura etaria tiene un impacto importante en el riesgo de muerte. Un tipo de estandarización consiste en utilizar las tasas específicas correspondientes a una población estándar o de referencia y aplicarlas a las poblaciones que se quieren comparar estratificadas por la variable a controlar. De esta manera se obtiene el número de casos esperados, que relacionado con el número de casos realmente observado, da lugar a las denominadas Razones de Mortalidad Estandarizadas (RME) (Szklo y Nieto, 2000; Preston et al., 2003).

Las RME se usan frecuentemente en epidemiología para comparaciones entre diferentes áreas o regiones y en los últimos años se han utilizado para mostrar la distribución geográfica de la mortalidad debida a enfermedades tales como el cáncer.

En este trabajo se aborda el estudio de la mortalidad por cáncer de mama en la provincia de Santa Fe en el período 2000 – 2008. Para ello se utiliza un modelo de regresión marginal Poisson con efectos de los diferentes grupos de edad a fin de obtener una primera estimación de las RME sin necesidad de recurrir a una población externa. Luego, con el objeto de tener en cuenta la heterogeneidad del tamaño poblacional de las diferentes áreas, se reestiman las RME a partir del ajuste de modelos Poisson mixtos. Por último, se logra una mejor visualización de las variaciones departamentales en la mortalidad por cáncer de mama en la provincia mediante el geo-referenciamiento respectivo.1

En las secciones siguientes se presenta la información disponible, se describen los procedimientos de estimación de las RME y finalmente se presentan los resultados alcanzados.

2. Los Datos

A partir de la información que contienen los Registros de Estadísticas Vitales, organizada y publicada por el Ministerio de Salud de la Nación sobre la mortalidad en Argentina según causas de muerte (Codificación Diagnóstica Internacional CIE10), se obtiene para cada grupo de edad quinquenal el número de muertes por tumor maligno de mama en la mujer en la provincia de Santa Fe desagregado a nivel departamental para los trienios 2000-2002, 2003-2005 y 2006-2008. El grupo en estudio se limita a las mujeres de 25 años y más dado que la mortalidad por tumor maligno de mama para las más jóvenes es poco frecuente. De esta forma se dispone de una base que contiene la información correspondiente a los 19 departamentos de la provincia para 11 grupos etarios, los primeros 10 quinquenales y el último reúne los casos acontecidos en las mujeres de 75 años y más.

Las correspondientes personas-año asociadas a cada departamento y grupo etario, así como también la información adicional relativa a la provincia de Santa Fe, se obtienen de las publicaciones del Instituto Nacional de Estadísticas y Censos (INDEC) y del Instituto Provincial de Estadística y Censos (IPEC).

3. Estimación de las razones de mortalidad estandarizadas

Las RME se definen como el cociente entre el número de muertes observadas y el número de muertes esperadas en cada área en estudio, en este caso los departamentos de la provincia de Santa Fe.

La obtención de los valores esperados se realiza mediante el ajuste de un modelo Poisson marginal que permite controlar no sólo la estructura de edad de los diferentes departamentos sino también la posibilidad de respuestas semejantes dentro de cada uno de ellos. El mismo se formaliza:





donde µij representa el valor esperado del número de muertes, Yij, en el i-ésimo departamento para el j-ésimo grupo de edad; Pij es el número de personas-año en el i-ésimo departamento para el j-ésimo grupo de edad y {βj} son los parámetros asociados a los diferentes grupos de edad. Para tener en cuenta la posible asociación intra-departamento en relación al número de muertes se considera:



El enfoque de estimación usual para estos modelos marginales es el de Ecuaciones de Estimación Generalizadas (GEE), que fue propuesto por Liang y Zeger (1986). Una descripción de esta metodología se puede encontrar en Song (2007), Fitzmaurice et al (2004) y Agresti (2002).

Una vez ajustado el modelo, el número esperado de muertes en el i-ésimo departamento y j-ésimo grupo de edad se calcula resolviendo



Finalmente, la suma de estas estimaciones a través de los 11 grupos de edad en cada departamento proporciona el denominador de las RME, es decir el número de muertes esperado para cada uno de ellos,





El cociente entre el número de muertes observadas y las esperadas de acuerdo al procedimiento recién descripto produce una primera estimación de las RME por departamento.

Con el objeto de controlar también la heterogeneidad del tamaño poblacional de los departamentos se obtiene una segunda estimación suavizada de las mismas a través del ajuste de modelos Poisson mixtos apropiados.

El modelo más simple para tal fin se formaliza:





el cual especifica interceptos aleatorios {bi} asociados a cada departamento y un intercepto fijo común β0. Este modelo produce un reacomodamiento de cada estimación de las RME haciendo uso de la información de todos los departamentos en forma conjunta. Si se dispone, además, de información acerca de variables que puedan ayudar a explicar diferencias entre los departamentos, se podrían incluir en la parte fija del modelo (Fitzmaurice et al., 2004).Esta metodología de dos etapas se implementa utilizando los procedimientos GENMOD y GLIMMIX de SAS. El posterior mapeo de las estimaciones obtenidas se realiza utilizando el programa GeoDA, desarrollado en la Universidad de Illinois, Urbana-Champaign bajo la dirección de Luc Anselin.

4. Resultados

A partir de la cantidad de muertes por cáncer en cada trienio y la estimación de la población en riesgo correspondiente se construyen las RME para los diferentes departamentos de la provincia de Santa Fe mediante el ajuste del modelo Poisson marginal (1). Los resultados se muestran en la Tabla 1.

Tabla 1. Razones de Mortalidad Estandarizadas para los trienios 2000-2002; 2003-2005 y 2006-2008

Departamento

Trienio

2000-2002

Trienio

2003-2005

Trienio

2006-2008

Belgrano

121,79

95,65

53.17

Caseros

97,13

91,87

83.63

Castellanos

75,36

83,25

107.93

Constitución

90,56

107,89

129.30

Garay

42,86

115,97

28.74

Gral. López

90,14

113,06

78.34

Gral. Obligado

56,16

100,90

63 16

Iriondo

81,42

110,76

112.98

La Capital

111,80

109.16

116.35

Las Colonias

85,78

70,18

84.53

9 de Julio

69,59

49,21

63.29

Rosario

110,95

107,05

106.71

San Cristóbal

77,03

66,85

96.32

San Javier

68,58

70,04

90.63

San Jerónimo

110,60

77,76

105.70

San Justo

105,62

78,46

58.45

San Lorenzo

87,63

75,78

79.94

San Martin

107,01

101,76

83.57

Vera

67,81

47,38

78.50

Fuente: Elaboración Propia

En la Figura 1 se presenta un diagrama de caja comparativo entre las RME observadas en los tres trienios, como así también una tabla con las respectivas medidas resumen (Tabla 2).

En el diagrama de caja (Figura 1) se puede observar una mayor dispersión en las RME correspondientes al trienio 2006-2008. Los dos primeros trienios muestran aspectos semejantes, esto es: los valores de las RME están más concentrados en el 25% de las RME más elevadas que en el 25% de los valores más pequeños, los cuales se encuentran más dispersos. El tercer trienio responde al mismo patrón pero con características más extremas: valor mediano más bajo (83.63 versus 87.63 y 91.87), mínimo mucho menor (28.74 versus 42.86 y 47.38) y máximo un tanto mayor (129.20 versus 121.79 y 115.97).

Tabla 2. Medidas resumen de RME para los trienios 2000-2002; 2003-2005 y 2006-2008.

Departamento

Trienio

2000-2002

Trienio

2003-2005

Trienio

2006-2008

Mínimo

42.86

47. 38

28.74

Primer cuartil

72.47

72.98

70.81

Mediana

87.63

91.87

83.63

Tercer cuartil

106.31

107.47

106.20

Máximo

121.79

115.97

129.20

Fuente: Elaboración Propia

La definición de las RME como el cociente, expresado en porcentaje, entre el número de muertes observadas en cada departamento y el número de muertes esperadas conduce a que un valor igual a 100% corresponde a una situación en la cual las muertes observadas y esperadas coinciden, destacado en el diagrama por una línea horizontal.

Figura 1. Razones de Mortalidad Estandariza-das para los trienios 2000-2002, 2003-2005 y 2006-2008

RME


Se puede apreciar en la Figura 1 que el porcentaje de RME que superan el 100% es bastante menor que el de las inferiores al 100%; concretamente los porcentajes de RME que superan el 100% son 32% para el primer y tercer trienio y 42% para el segundo.

A pesar de las similitudes observadas en las RME para los tres trienios, el análisis particularizado en cada departamento muestra variaciones tanto en magnitud como en sentido entre los tres períodos y se necesita evidentemente tener en cuenta aspectos como el tamaño poblacional y otro tipo de información adicional para su explicación.

A tal fin, la estrategia de análisis seguida incluyó el ajuste de diferentes modelos que incluían efectos fijos asociados a los trienios y su interacción con departamento. Dada la falta de significación estadística de todos ellos se decidió recalcular las RME considerando el total de muertes y la población en riesgo para todo el período completo 2000-2008.

Se ajustaron a las RME así calculadas diferentes modelos mixtos; el más simple con sólo interceptos aleatorios y otros cuatro que incorporan además información complementaria proveniente de registros oficiales. Ella se refiere a la densidad poblacional de los departamentos (DENS), al porcentaje de consultas médicas en establecimientos oficiales (CONS), de hogares con necesidades básicas insatisfechas (NBI) y de hogares con todos los integrantes sin cobertura médica (COB). También se ajustó el modelo con sólo efectos fijos para el porcentaje de mujeres analfabetas o con primaria incompleta (INS) ya que en el modelo mixto la variancia de los interceptos aleatorios resultó no significativa.

En términos del valor del Criterio de Información de Akaike (AIC), resulta evidente que la incorporación de algún tipo de información adicional mejora el ajuste de las RME (Tabla 3).

Tabla 3. Medidas de AIC para diferentes modelos.

Modelo

AIC

Interceptos aleatorios

166.21

Interceptos aleatorios + efecto fijo DENS

163.68

Interceptos aleatorios + efecto fijo CONS

168.14

Interceptos aleatorios + efecto fijo NBI

159.44

Interceptos aleatorios + efecto fijo COB

159.15

Efecto fijo INS

146.64

Fuente: Elaboración Propia



Sin embargo, conviene señalar que la información adicional proviene fundamentalmente de datos censales por lo que, a la fecha y para el período considerado, se refieren al censo de población del año 2001. La imposibilidad de contar con valores actualizados de los índices censales y la dificultad de obtener la información desagregada a nivel departamental, conduce a la elección del modelo más simple con sólo interceptos aleatorios. Este modelo, que no incorpora información adicional y que en función de la bondad de su ajuste no es el mejor candidato, aún así proporciona versiones suavizadas de las RME ya que hace uso de la información conjunta de todos los departamentos de la provincia. La estimación de los efectos aleatorios asociados a cada departamento como así también la estimación de las RME correspondientes se presenta en la Tabla 4.

Los valores de los coeficientes aleatorios permiten determinar diferentes grados de vulnerabilidad en los departamentos. Así por ejemplo, puede identificarse a los departamentos de Rosario y Capital con coeficientes positivos y significativos, lo que los identifica como las áreas de mayor vulnerabilidad. Por el contrario, el coeficiente negativo que resulta significativo es el correspondiente al departamento Gral. Obligado, siendo entonces el área estimada con menor riesgo.

A fin de visualizar la distribución geográfica de las RME de cáncer de mama en la provincia de Santa Fe se realiza el mapeo de las estimaciones halladas. Se forman 7 niveles de agrupamiento en función de los cuantiles de las RME. El último nivel reúne las estimaciones de RME mayores que 100% con el color más intenso en la Figura 2 disminuyendo la intensidad del color en la medida que disminuye el nivel de riesgo de mortalidad medido por las RME.

Figura 2 : Distribución departamental de las RME en la provincia de Santa Fe













A simple vista se aprecia una subdivisión en dos sectores: el norte con RME más bajas y el sur donde se presentan los valores más altos de riesgo de morir por cáncer. Una descripción de las principales características regionales de la provincia muestra que el área norte tiene en general menor densidad poblacional, está dedicada fundamentalmente a la actividad agrícola ganadera y en ella se puede presumir menor contaminación ambiental. Se destacan en esta área los dos departamentos con menor RME de toda la provincia, Gral. Obligado y Vera, los cuales tienen a su vez baja densidad poblacional (15.23 y 2.43 hab/km2 respectivamente). Por otro lado, en la zona sur, se presentan las RME más altas y están en correspondencia con los departamentos más densamente poblados. En particular, sobre el margen derecho, se destacan el departamento Rosario (593.42 hab/km2) al sur, y más arriba, el departamento La Capital (160.23 hab/km2). Lindero a Rosario hacia el sur, el departamento Constitución, cuya actividad industrial presupone una considerable contaminación ambiental aunque su densidad poblacional es moderada (25.63 hab/km2), presenta también alta RME.

Tabla 4: Razones de Mortalidad Estandarizadas estimadas y coeficientes aleatorios estimados para los departamentos de la provincia de Santa Fe en el período 2000-2008

Departamento

RME

Coef. Efecto

Aleatorio

Belgrano

91.03

0.0039

Caseros

91.07

0.0042

Castellanos

89 40

-0.0143

Constitución

102.59

0.1234

Garay

85.26

-0.0617

Gral. López

93.64

-0.0321

Gral. Obligado

79.97

-0.1257

Iriondo

97.51

0.0726

La Capital

110.30

0.1959

Las Colonias

84.25

-0.0736

9 de Julio

84.25

-0.0736

Rosario

106.73

0.1638

San Cristóbal

85.37

-0.0603

San Javier

87.06

-0.0480

San Jerónimo

95.70

0.0539

San Justo

87.20

-0.0392

San Lorenzo

84.36

-0.0722

San Martin

95.02

0.0467

Vera

81.35

-0.1086



5. Discusión

El estudio de las variaciones regionales de la mortalidad de una enfermedad, tal como el cáncer de mama en la provincia de Santa Fe, se abordó a través del uso de diferentes modelos estadísticos de manera de tener en cuenta dos factores de reconocida importancia: la diferencia de estructura por edad de las poblaciones de cada área y la heterogeneidad del tamaño poblacional de dichas áreas (Breslow y Clayton, 1993; Clayton y Kaldor, 1987).

Específicamente, los modelos marginales bajo el enfoque de las Ecuaciones de Estimación Generalizadas se utilizaron para obtener una primera estimación de las RME en las que estuviera controlado el impacto que pueden producir las diferencias en la estructura de edad de los distintos departamentos de la provincia (Liang y Zeger, 1986). Este enfoque permite obtener tasas de referencia específicas por edad a partir de los propios datos empleados en la investigación sin necesidad de recurrir a datos externos o población tipo. En una segunda etapa, la consideración de un modelo con efectos aleatorios asociados a cada departamento reconoce la heterogeneidad no observada que estaría representando a factores omitidos o desconocidos (Molenberghs y Verbeke, 2005; Song, 2007). Cabe mencionar que la Organización Panamericana de la Salud en el Atlas de Mortalidad de Argentina, Trienios 1990-1992/1999-2001 (2004) utiliza para el cálculo de las RME suavizadas un método alternativo denominado “empírico bayesiano no paramétrico” con resultados semejantes en cuanto a la mejora de las RME tradicionales.

Dada la característica multicausal del cáncer de mama y en la búsqueda de posibles factores socioeconómicos y culturales que la condicionen, se encontró que tanto la densidad poblacional como el porcentaje de hogares con necesidades básicas insatisfechas y el porcentaje de mujeres con baja instrucción explican en mayor o menor grado la variabilidad de las RME. Si bien esta posibilidad de incorporar información complementaria es un aspecto beneficioso de la metodología propuesta, es sabido que las conclusiones que deriven del uso de información agregada debe tomarse con extrema cautela (Skrondal, Rabe-Hesketh, 2004). Estas consideraciones, sumadas a la falta de información adicional periódica actualizada, orientó a la elección de las RME suavizadas a partir del modelo mixto que no incorpora covariables, logrando una descripción espacial satisfactoria para la identificación de áreas con diferentes niveles de vulnerabilidad. El uso de este modelo permitió obtener RME fortalecidas en las áreas pequeñas con la información conjunta de todos los departamentos. Sin embargo queda pendiente la consideración en el modelo de la posible semejanza de las RME entre departamentos vecinos. A tal fin, Skrondal y Rabe-Hesketh (2004) utilizan modelos espaciales donde los efectos aleatorios puedan estar correlacionados para los departamentos cercanos.

El mapeo de las RME permitió una rápida visualización de las variaciones regionales y la posibilidad de asociarlas con características geográficas de las mismas. Así se puede destacar que las áreas identificadas como de mayor riesgo (RME mayor que 100%), Rosario y Santa Fe, se caracterizan por tener mayor densidad poblacional y actividad económica e industrial más intensa.

En síntesis, el uso de modelos lineales generalizados marginales y mixtos logran explicar el patrón espacial de la mortalidad por cáncer de mama en la provincia de Santa Fe que conjuntamente con el posterior mapeo de las estimaciones de las RME constituyen una estrategia metodológica satisfactoria para proporcionar herramientas que puedan facilitar el diseño de políticas de salud pública.

Referencias bibliográficas

Organización Panamericana de la Salud, Atlas de Mortalidad de Argentina. Trienios 1990-1992/1999-2001.(2004) CD-Rom Buenos Aires: Autor.

Agresti, A. (2002). Categorical data analysis, 2nd ed. Hoboken N.J. (USA): John Wiley & Sons.

Breslow, N; Clayton, D.(1993). Approximate inference in generalized linear mixed models.Journal of the American Statistical Association, 88(421), 9-25.

Clayton, D.; Kaldor, J. (1987). Empirical Bayes estimates of age-standardized relative risks for use in disease mapping. Biometrics, 43, 671-681.

Elizaga, J. (1979). Dinámica y Economía de la Población. CELADE. Serie E N° 27. Santiago de Chile: Naciones Unidas.

Fitzmaurice, G.; Laird, N.; Ware, J. (2004). Applied longitudinal analysis. Hoboken. N.J. (USA): John Wiley & Sons.

INDEC. Censo Nacional de Población, Hogares y Viviendas del año 2001. Recuperado de: www.indec.mecon.gov.ar.

INDEC. Estimaciones y proyecciones de población total del país. 1950-2015. Serie Análisis Demográfico, 30. Recuperado de: www.indec.mecon .gov.ar.

Liang,K. Y.; Zeger, S. L. (1986). Longitudinal data analysis using generalized linear models. Biometrika 73: 13-22.

LALCEC. Información sobre el cáncer de mama.. Recuperado de www.lalcec. org.ar

Ministerio de Salud. Presidencia de la Nación. Dirección de Estadísticas e Información en Salud. Recuperado de www.msal.gov.ar

Molenberghs, G.; Verbeke, G. (2005). Models for discrete longitudinal data. Series in Statistics. New York: Springer

Preston, S; Heuveline, P; Guillot, M. (2003). Demography. Measuring and modeling population processes. Malden. Mass (USA): Blackwell Publishers.

Skrondal, A.; Rabe-hesketh, S. (2004).Generalized latent variable modeling: multilevel, longitudinal and structural equation models. Boca Raton (USA): Chapman & Hall/CRC.

Szklo, M.; Nieto, J. (2000).Epidemiology beyond the basics. Geithersbug (MD) (USA): Aspen Publishers.

Song, P. X. K. (2007). Correlated data analysis: modeling, analytics and applications. New York: Springer.

1 Se agradece al Director del Instituto Provincial de Estadística y Censos (IPEC) de la Provincia de Santa Fe, Lic. Jorge Moore, el aporte de cartografía e información provincial utilizada en este trabajo.