SciELO - Scientific Electronic Library Online

 
vol.30 issue2Evaluation of the effectiveness of arterial hypertension control in a primary health unitThe importance of the pediatrician in oral health care promotion author indexsubject indexarticles search
Home Page  

Revista de Saúde Pública

Print version ISSN 0034-8910

Rev. Saúde Pública vol.30 n.2 São Paulo Apr. 1996

http://dx.doi.org/10.1590/S0034-89101996000200009 

Modelo hierarquizado: uma proposta de modelagem aplicada à investigação de fatores de risco para diarréia grave*
Hierarchical model: a proposal for model to be applied in the investigation of risk factors for dehydrating diarrhea

Sandra C Fuchs, Cesar G. Victora e Jandyra Fachel

Departamento de Medicina Social da Faculdade de Medicina, Universidade Federal do Rio Grande do Sul. Porto Alegre, RS - Brasil (S.C.F.); Departamento de Medicina Social da Faculdade de Medicina da Universidade Federal de Pelotas. Pelotas, RS - Brasil (C.G.V.); Departamento de Estatística do Instituto de Matemática da Universidade Federal do Rio Grande do Sul. Porto Alegre, RS - Brasil (J.F.)

 

 

RESUMO

Os estudos epidemiológicos de doenças que acometem as crianças geralmente envolvem grande número de variáveis. As associações entre potenciais fatores de risco e doença freqüentemente são avaliadas através de modelagem estatística sem descrição das estratégias empregadas. No estudo realizado apresenta-se uma abordagem hierarquizada aplicada à avaliação de fatores de risco para diarréia grave. As variáveis foram hierarquicamente agrupadas em características socioeconômicas, ambientais, reprodutivas maternas, nutricionais e demográficas. Na análise univariada todas as variáveis associaram-se com diarréia grave. Em cada bloco selecionaram-se fatores de confusão através de um algoritmo, utilizando-se o processo retrógado de seleção, através do módulo em passos, segundo um p=0,10. Os fatores de risco foram avaliados através de regressão logística após o ajuste para fatores de confusão de cada conjunto e para aqueles hierarquicamente superiores. As variáveis incluídas no modelo permitiram identificar corretamente uma proporção elevada de casos (gamma=0,74) e todos os blocos contribuíram significativamente para a modelagem.

Diarréia infantil, epidemiologia. Fatores de risco. Modelos estatísticos.

ABSTRACT

In epidemiological investigations of infant diseases, data are usually collected on a large set of variables. The associations between presumptive risk factors and the outcome is commonly evaluated through statistical modeling, but the model-building strategies are seldom described. In the project, data collected in a case-control study of risk factors for dehydrating diarrhea in infants have been used to present a hierarchized approach to the assessment of risk factors. The variables were grouped into a hierarchy of categories, ranging from distal determinants to proximate ones. These categories included, in this order, socioeconomic, environmental, reproductive maternal, nutritional and demographic sets. According to the univariate analyses all variables were associated with the outcome. As the purpose was to identify a parsimonious model to explain the data, in each set the confounders were selected through backward elimination, according to an alpha level of 0.10. The risk factors were evaluated through logistic regression after adjustment for confounders in the same set or in hierarchically superior sets. This approach allows researchers to quantify the contribution of each level of adjustment, to understand the model-building strategy as well as interpret the independent associations. The goodness-of-fit assessed at each set showed significant improvements in the model. The gamma coefficient of association was employed to quantify the proportion of cases and controls correctly identified by comparing the observed value with that predicted by the variables in the model. The final model resulted in a gamma of 0.74. The children's ages did not improve the prediction of cases and controls, but they have been kept in the model as they affect some exposures such as breastfeeding.

Infantile diarrhea, epidemiology. Risc factors. Statiscal models.

 

 

INTRODUÇÃO

A saúde infantil, particularmente nos países em desenvolvimento, é determinada por grande número de características relacionadas a condições socioeconômicas, ambientais, nutricionais, de cuidados com a saúde, entre outras3,11. As doenças infecciosas, por exemplo, têm se associado com menor nível social e econômico, freqüentemente aferido através de renda, escolaridade, tipo de habitação, disponibilidade de água encanada e de esgoto cloacal. Essas condições não são responsáveis diretas pela ocorrência de doença, contudo, favorecem a proximidade de alguns determinantes3, 11. Assim, por exemplo, uma mãe pobre e com baixa escolaridade iniciará sua vida reprodutiva mais precocemente e estará menos apta a se beneficiar da estrutura assistencial durante a gestação. O estado nutricional materno prévio, acentuado pelo ganho reduzido de peso durante a gestação, propicia um ambiente intra-uterino desfavorável ao crescimento fetal. O baixo peso de nascimento resultante é um fator de risco para a morbimortalidade durante toda a infância. A mãe, com ingesta alimentar inadequada e sem suporte familiar, tem menor chance de iniciar e manter o aleitamento. Número excessivo de pessoas em um domicílio insalubre, com água e esgoto inadequados, favorece maior contaminação do ambiente onde vive a criança. A presença de fatores biológicos e ambientais, intensificados pela ausência do efeito protetor do leite materno, determinam maior freqüência e gravidade da doença diarréica que impedem a recuperação nutricional posterior.

A investigação de fatores de risco para uma doença infecciosa envolve a coleta de número considerável de variáveis. Considerando-se a possibilidade de que uma ou mais variáveis de confusão possam explicar parcial ou totalmente o efeito detectado, torna-se indispensável o emprego de análise multivariada na identificação de fatores de risco independentes. Os critérios mais freqüentemente empregados para incluir variáveis na modelagem são: a) ajustar-se para todas as variáveis coletadas; b) ajustar-se para aquelas cujo contole represente uma diferença importante na medida de efeito; c) controlar-se para as variáveis que se associarem significativamente com o desfecho; d) selecionar-se para o modelo apenas a variável cuja medida de efeito ajustada for estatisticamente significativa; e) controlar-se para as variáveis a menos que a mudança na estimativa de exposição-efeito, produzida pelo controle da variável, seja equivalente a zero9.

Algumas críticas a esses processos de modelagem incluem a ineficiência de modelo ajustado para variáveis que não são fatores de confusão, a não consideração da variabilidade estatística ou a aplicação de um teste estatístico como medida do grau de confusão presente em uma associação. Uma vez que os investigadores freqüentemente não possuem conhecimento prévio sobre os fatores de confusão, aplicam algum tipo de estratégia aos dados coletados para decidir quais as variáveis que devem entrar na modelagem9.

A modelagem hierarquizada, aqui proposta, é uma alternativa aplicável a estudos epidemiológicos com um grande número de covariadas5, 12. A escolha de critérios para a seleção de variáveis de confusão ultrapassa o aspecto puramente estatístico, criticado em alguns processos anteriormente citados2, 4, 14. A hierarquização das variáveis independentes é estabelecida no marco conceitual e mantida durante a análise dos dados permitindo a seleção daquelas mais fortemente associadas com o desfecho de interesse. Assim, gera-se um modelo com um número de termos necessários para testarem-se as associações, mas não saturado pelo excesso de variáveis.

Além da seleção de variáveis de confusão, outra questão refere-se à verificação dos pressupostos do modelo. Uma vez que a validade das inferências depende de quão bem o modelo descreve os dados observados, torna-se necessário saber se a modelagem contém as variáveis que deveria conter e se estas entraram em sua forma correta7. Portanto, realizada a análise multivariada, deveria avaliar-se o ajuste da modelagem.

No presente estudo utilizou-se a modelagem hierarquizada para se analisar os fatores de risco para diarréia grave (cujos detalhes estão descritos na tese de Fuchs5), discriminou-se a contribuição dos blocos de variáveis para o ajuste do modelo, e avaliaram-se os aspectos estatísticos que poderiam influenciar a modelagem.

 

MATERIAL E MÉTODO

Um estudo de casos e controles foi delineado para investigar os fatores de risco para diarréia complicada por desidratação moderada a grave (diarréia grave). Os casos constituíram-se de crianças, com idade entre 3 dias e 23 meses, com diarréia de duração inferior a oito dias, hospitalizadas com desidratação moderada a grave em dois hospitais pediátricos de Porto Alegre, entre dezembro de 1987 e março de 1988. Recrutou-se uma amostra consecutiva de todas as crianças com diarréia grave, internadas em um dos hospitais. No segundo hospital, recrutou-se uma amostra consecutiva de pacientes hospitalizados em três dias da semana, aleatoriamente determinados. Definiu-se diarréia pela presença de mais de três evacuações com consistência líquida ou semilíquida durante um período de 24 h, em crianças com três meses ou mais17. Para as crianças menores de três meses aceitou-se a definição da mãe sobre diarréia, ou seja, número aumentado de evacuações, com consistência reduzida, que deixava a mãe preocupada15, 17. A presença ao exame físico de prega cutânea persistente, associada a pelo menos um outro sinal (fontanela deprimida, língua seca ou com umidade diminuída, olhos encovados, volume urinário reduzido ou nulo, pulso radial fraco ou ausente, psiquismo deprimido ou comatoso), caracterizou a desidratação como moderada a grave. Estabeleceu-se o grau de desidratação através de exame físico padronizado realizado por pediatra treinado.

Selecionaram-se como controles crianças residentes na mesma vizinhança e emparelhadas individualmente pelo grupo etário do caso, 0 a 11 meses ou 12 a 23 meses, sem diarréia nos últimos sete dias. Excluíram-se casos e controles com doenças como pneumonia, doença infecto-contagiosa, irmãos e crianças institucionalizadas.

Estruturou-se um marco teórico com as variáveis associadas com a mortalidade e a incidência de diarréia, discriminando-as em blocos hierarquizados (Fig.), uma vez que inexistiam dados relativos à diarréia grave. O marco teórico priorizou o determinismo econômico sobre as características sociais e a cronologia de suas relações na hierarquização dos blocos16. O padrão social e econômico estabelece as condições de habitação e do ambiente onde nasce e cresce a criança. O ambiente, permeando a aproximação entre os agentes causais e a criança, possibilita a instalação de um quadro de diarréia. A gravidade da diarréia é facilitada por características maternas e da criança, como por exemplo, mãe adolescente, baixo peso de nascimento, ausência de aleitamento materno e desnutrição.

 

 

Investigou-se a associação entre diarréia grave e os seguintes fatores de risco:

* demográficos: sexo e idade (0-1, 2-3, 4-5, 6-8, 9-11, 12-17 e 18-23 meses),

* socioeconômicos: renda familiar (< 3,6 e ³3,6 salários-mínimos), presença e escolaridade do pai (0 ou ausente e 1 ano), escolaridade da mãe (< 8 e 8 anos), cor da mãe biológica e trabalho materno (não trabalha ou licença, ocasional, diário parcial e turno integral),

* ambientais: número de pessoas na casa (2-3, 4-5, ³ 6), número de crianças menores de 5 anos (1-2, 3-6), aglomeração- número de pessoas por peça- (£ 2, > 2), tipo de construção (tijolo ou madeira, maloca), geladeira em casa, vaso sanitário com descarga, água disponível (dentro de casa, pátio da casa, fora do terreno, poço ou rio) e ambiente doméstico limpo (índice composto pela observação dos seguintes itens: limpeza da casa, disponibilidade de sabão para lavar as mãos e toalha para secar, presença de panelas com comida a vista, panelas destampadas, moscas na cozinha, lixo a vista, presença de animais, fezes e água empoçada no pátio),

* reprodutivos maternos: idade materna (< 20 e ³ 20 anos), consulta no pré-natal, ordem de nascimento (1o-2o, 3o e ³ 4o), intervalo de nascimento (não tem irmão, ³ 48, 47-30, 29-18 e < 18 meses) e gemelaridade,

* nutricionais antropométricos: peso de nascimento (³ 3.000, 2.999-2.500 e < 2.500 gramas), déficit altura-idade, déficit peso-idade e déficit peso-altura (> -1, -1 a -1,9 e £ -2) foram estudados em relação ao número de desvios-padrão de mediana, comparativamente ao padrão do índice de referência do "National Center for Health Statistics" (NCHS).

* nutricionais dietéticos: tipo de leite (leite materno, leite materno+leite de vaca reconstituído, leite materno+leite de vaca em pó, leite de vaca reconstituído, leite de vaca em pó), história de amamentação (continua, parou e nunca mamou) e dieta prévia (leite materno/leite materno+água, leite materno+leite artificial, leite materno+sólidos, leite materno+ leite artificial+sólidos, leite artificial, leite artificial+sólidos/sólidos).

As variáveis foram obtidas através de entrevista, utilizando-se um questionário padronizado e pré-codificado, previamente testado e as variáveis ambientais foram coletadas através de observação. A confiabilidade das informações foi avaliada através de nova visita domiciliar (10%), de segundo contato no hospital (20%) e supervisão de 15% das entrevistas. O peso foi aferido com a criança desnuda, deitada (para menores de 6 meses) ou sentada, em balança Salter com aproximação para 100 gramas. Os casos foram pesados na admissão e após a reidratação, quando não havia sinais de desidratação, enquanto que os controles foram pesados no domicílio. O comprimento foi aferido com a criança deitada, em infantômetro similar ao modelo desenvolvido pelo AHRTAG ("Appropriate Health Resources and Technologies Action Group Ltda., London").

Consideraram-se como fatores de risco independentes aqueles cuja razão de produtos cruzados diferiu de um, sendo estatisticamente significativa (p < 0,05, bicaudal), no limiar da significância (0,05 < p < 0,10, bicaudal) ou não significativa (p > 0,10). Empregou-se a expressão risco ou proteção provável para as associações que alcançaram significância limítrofe. A amostra conferiu um poder de 80% para detectar-se uma razão de produtos cruzados de 1,5 como estatisticamente significativa a nível de 5% (bicaudal), para prevalência de exposição aos fatores de risco para os controles variando entre 20% e 65% .

Análise dos Dados

Investigou-se a associação de cada uma das variáveis com diarréia grave, através da razão de produtos cruzados empregando-se método que estima a razão de máxima verossimilhança condicional, do módulo PECAN do programa EGRET. As variáveis categóricas e discretas foram mantidas como tal, utilizando-se os pontos de corte adotados na literatura. Utilizou-se o marco teórico hierarquizado como o referencial para a construção de um modelo que permitisse o ajuste para fatores de confusão12. O modelo proposto discriminou os fatores de risco hierarquicamente superiores como exercendo sua ação através daqueles situados inferiormente. Por exemplo, se o efeito de baixo nível socioeconômico se expressa através de moradia em condições insalubres e da ocorrência de desnutrição, estas características não devem ser consideradas fatores de confusão, mas fatores intermediários. Assim, as características ambientais e desnutrição não deveriam entrar no modelo.

A seguir, identificou-se a melhor escala para a inclusão de cada variável no ajuste de fatores de confusão. Empregou-se a razão de máxima verossimilhança, medindo-se a diferença entre a função desvio ("deviance") do modelo vazio e aquela incluindo a variável. Considerou-se como mais adequada a escala que com menor número de graus de liberdade manteve a significância estatística, sem desviar-se da linearidade. Ao estudarem-se múltiplas exposições, o modelo hierarquizado indica a ordem em que devem entrar as variáveis. Assim, identifica-se que o risco de desenvolver diarréia grave associado à desnutrição deve ser quantificado após o ajuste para nível socioeconômico, condições ambientais, características maternas, idade da criança e peso de nascimento. Uma vez que muitos fatores em estudo poderiam estar confundindo as associações, utilizou-se a hierarquização das variáveis em blocos para selecionarem-se as variáveis de confusão mais fortemente associadas com diarréia grave. Empregou-se um algoritmo e utilizou-se regressão logística condicional, com o processo retrógado ("backward") de seleção, através do módulo em passos ("stepwise"), do programa . Consideraram-se como potenciais fatores de confusão as variáveis selecionadas segundo um p alfa de 0,10 dentro de cada bloco. Para as análises subseqüentes, mantiveram-se aquelas variáveis que permaneceram associadas com diarréia grave após o ajuste para as variáveis de confusão do mesmo bloco e para daquelas hierarquicamente superiores.

Testou-se o ajuste da modelagem através dos componentes sistemático e de erro. A construção do modelo se concentra no componente sistemático que é função matemática das variáveis independentes que caracterizam o "valor médio" de Y. Na verdade, para o modelo logístico não se trata de média e sim da transformação logística de y para um dado vetor x. Analisou-se o componente sistemático através da medida ordinal de associação gama entre os valores observados para a variável dependente e aqueles preditos pelo modelo1. Calculou-se o gama através da diferença entre as probabilidades de concordância e discordância, variando de -1 a +1. O componente de erro é avaliado através do exame individual das observações, cujo valor individual se afasta da "média", podendo ser problemático sob o modelo atual, e pela medida coletiva do erro. O componente de erro foi mensurado coletivamente pelo teste de ajustamento ("goodness of fit"), analisando-se a função desvio para o acréscimo de cada bloco (apenas com as variáveis selecionadas). Calculou-se a diferença da função desvio entre os dois modelos, testando-se a significância pela distribuição do qui-quadrado de Pearson, com o número de graus de liberdade calculados pela diferença entre o número de parâmetro nos dois modelos10.

 

RESULTADOS

No período estudado incluíram-se 200 casos. Entre estes, perdeu-se 4% (8 casos) devido a não localização do endereço e a recusas. Assim, estudaram-se 192 casos e 192 controles, sendo que 85% eram menores de um ano e aproximadamente 50% do sexo masculino. No grupo menor de um ano (Tabela 1), identificaram-se riscos de maior magnitude para as crianças entre dois e cinco meses, e para aquelas no segundo ano de vida detectou-se maior risco para as menores de dezoito meses.

 

 

Fatores de Risco Socioeconômicos

Na Tabela 2 exemplificam-se com as variáveis socioeconômicas as diferentes escalas das variáveis que poderiam entrar no ajuste para fatores de confusão. Escolaridade dos pais e renda, coletadas como variáveis contínuas, poderiam ser mantidas como tal ou categorizadas, diferentemente de trabalho materno e cor da pele. Renda familiar, presença e escolaridade do pai e escolaridade da mãe foram examinadas como potenciais fatores de confusão dicotomizadas. A escolaridade do pai categorizadas em cinco níveis, desviou-se significativamente da linearidade.

 

 

No bloco de características socioeconômicas, selecionaram-se renda familiar, presença e escolaridade do pai e cor da pele da mãe como fatores de confusão. As variáveis selecionadas mantiveram-se associadas com diarréia grave, mesmo após o ajuste para os demais fatores de confusão dentro do bloco, permanecendo, portanto, para a análise dos blocos seguintes.

As características socioeconômicas de famílias com renda inferior a 3,6 salários-mínimos, pai ausente ou analfabeto e mãe com cor da pele diferente da branca foram identificadas como fatores de risco para diarréia grave (Tabela 3). O ajuste para os fatores de confusão reduziu substancialmente o risco representado pela pouca escolaridade materna. O trabalho materno manteve-se não associado ao risco de desenvolver diarréia grave, mesmo controlando-se para os fatores de confusão.

 

 

Fatores de Risco Ambientais

Entre as variáveis ambientais: número total de pessoas que residem na casa, número de crianças menores de cinco anos, aglomeração e índice de limpeza do ambiente, todas foram incluídas no modelo sob a forma contínua, exceto o índice de limpeza do ambiente doméstico que foi dicotomizado.

A modelagem dos fatores de confusão ambientais identificou o índice de limpeza do ambiente doméstico, o número de menores de cinco anos residindo na casa, a disponibilidade de água e o tipo de construção como as variáveis mais fortemente associadas com diarréia grave. Calculadas as razões de produtos cruzados ajustadas para estas variáveis e para as socioeconômicas, todos os fatores de confusão permaneceram no modelo. Embora tenha se reduzido a magnitude da associação para a disponibilidade de água, houve tendência à significância preenchendo o critério para manter-se na modelagem.

Observa-se, na Tabela 4, através das razões de produtos cruzados emparelhadas e não ajustadas (primeira coluna) que a grande maioria das variáveis ambientais associaram-se significativamente com diarréia grave. Ao acrescentar-se o ajuste para os fatores de confusão ambientais (segunda coluna), a aglomeração, a disponibilidade de geladeira e de vaso sanitário com descarga tornaram-se estatisticamente não significantivas. O acréscimo das variáveis socioeconômicas (terceira coluna) no modelo não modificou marcadamente as associações.

 

 

A coabitação de mais do que duas crianças menores de cinco anos, a moradia em maloca e a sujeira do ambiente doméstico associaram-se com maior risco de desenvolver diarréia grave. A ausência de água encanada dentro de casa, por outro lado, mostrou apenas tendência a maior risco.

Fatores de Risco Reprodutivos Maternos

As características reprodutivas maternas, Tabela 5, associaram-se com diarréia grave e foram selecionadas como potenciais fatores de confusão. Idade materna foi testada como variável contínua, com duas e quatro categorias, sendo selecionada a dicotômica para a modelagem. As demais variáveis maternas foram mantidas com a escala apresentada na Tabela 5. O ajuste para as variáveis de confusão do mesmo bloco (segunda coluna) modificou a magnitude de algumas associações. Contudo, ao acrescentar-se o ajuste para os fatores de confusão ambientais e socioeconômicos (terceira coluna), houve alteração substancial, sendo que consulta no período pré-natal, ordem e intervalo de nascimento tornaram-se estatisticamente não significativos. Mãe adolescente e gemelaridade caracterizaram riscos independentes, respectivamente, 3,8 e 11,6 vezes maior da criança desidratar.

 

 

Fatores de Risco Nutricionais

As características nutricionais identificadas como fatores de confusão incluíram o peso de nascimento, o déficit peso-idade e a dieta prévia. As características antropométricas entraram no ajuste de fatores de confusão como variáveis contínuas (tendência); o tipo de leite consumido e as outras características dietéticas entraram como variáveis categóricas.

O peso de nascimento foi analisado (Tabela 6) ajustando-se apenas para a idade materna (primeira coluna) e para os demais fatores de confusão (terceira coluna). O controle para variáveis de confusão não modificou substancialmente o risco representado pelo peso inferior a 2.500 gramas.

 

 

As demais variáveis antropométricas ajustadas para idade da criança (primeira coluna) associaram-se marcadamente com diarréia grave, modificando-se a magnitude das associações ao adicionar-se o controle para os fatores de confusão nutricionais (segunda coluna). A inclusão das variáveis de confusão maternas, ambientais e socioeconômicas reduziu a maior parte das razões de produtos cruzados. Portanto, as características antropométricas, associadas com o desenvolvimento de diarréia grave, foram o peso de nascimento, os déficits altura-idade e peso-idade.

Na Tabela 7, identificam-se com maior risco de apresentar diarréia grave o consumo de outro leite que não o materno, a história de ter parado a amamentação e a dieta prévia à doença. As associações não se alteraram substancialmente após a adição dos fatores de confusão no modelo. A dieta prévia ao episódio caracterizou-se como apresentando risco quando composta por leite artificial ou sólidos. O pequeno número absoluto de crianças desnutridas recebendo leite artificial gerou instabilidade no modelo e intervalos de confiança amplos.

 

 

Avaliação do Ajuste da Modelagem

Teoricamente, o modelo se estrutura nas relações entre a variável dependente (Y) e o conjunto de variáveis independentes (X), analisadas estatisticamente pelo modelo de regressão logística. As características socioeconômicas, exclusivamente, permitiriam identificar 29% dos casos, elevando-se para 49% ao incluírem-se as ambientais, mantendo-se em 49% ao adicionar-se a idade, e elevando-se para 74% com a inclusão das variáveis nutricionais. Quando todas as variáveis significativas foram incluídas na modelagem, uma proporção maior de casos foi identificada (74%). A Tabela 8 apresenta o teste de ajustamento para cada bloco de características estudadas. A inclusão dos blocos de variáveis socioeconômicas, ambientais, reprodutivas maternas e nutricionais contribuiu significativamente para a modelagem. A inclusão da variável idade da criança alcançou significância limítrofe, contudo este ajuste torna-se necessário visto que as exposições diferem segundo a idade.

 

 

DISCUSSÃO

A análise hierarquizada permitiu identificar as características que elevam o risco da criança desidratar e cujo efeito é independente de idade, nível socioeconômico, condições ambientais, história reprodutiva materna e fatores nutricionais. As condições ambientais exercem efeito além daquele propiciado pelo padrão socioeconômico. A história reprodutiva materna afeta o risco de desenvolver diarréia grave, além do efeito representado pelo nível socioeconômico e pelas condições ambientais. Os fatores de risco nutricionais atuam independentemente da idade da criança e das características maternas, ambientais e socioeconômicas sobre a ocorrência de diarréia grave.

A caracterização de fatores de risco independentes baseou-se na identificação e ajuste para fatores de confusão, através da modelagem. O objetivo desta é identificar um modelo que com um número suficiente de variáveis permita a interpretação adequada dos dados7. A seleção de variáveis de confusão mantém-se como um processo quase subjetivo que consiste, parcialmente, em incluir variáveis pertinentes adequadamente medidas4.

O modelo hierarquizado, aplicado à investigação de fatores de risco para diarréia grave parece sobrepujar esses problemas. Em primeiro lugar, determinaram-se as variáveis de interesse a partir do conhecimento vigente sobre diarréia. A seguir, estruturou-se um modelo hierarquizado para discriminar as relações entre as variáveis e destas com diarréia grave. Assim, sabe-se que baixa renda familiar não é causa direta de doença mas, através da moradia em condições insalubres, pode determinar que maior carga de bactérias enteropatogênicas elevem a freqüência de episódios de diarréia, que, por sua vez, piorem o estado nutricional. Portanto, ao investigar-se o efeito deletério do ambiente sobre a ocorrência de diarréia grave, deveriam ser levados em conta fatores de confusão, como nível socioeconômico.

Em estudos como este, que se propõe a avaliar uma série de fatores de risco e trabalha com um grande número de covariáveis, torna-se difícil determinar quantos e quais são os termos necessários para uma descrição adequada dos dados7, 10. A inclusão de todo o conjunto de variáveis explanatórias, como propõe Rothman13, poderia significar uma regressão com aproximadamente 30 termos. Além de haver algum grau de colinearidade entre algumas variáveis, o excesso de termos para uma amostra limitada geraria instabilidade do modelo. Assim, em cada bloco determinaram-se as covariáveis mais fortemente associadas com diarréia grave usando-se um nível de significância flexível (p < 0,10). Alguns autores preconizam um nível de significância ainda mais flexível (p < 0,20)7. Este, se empregado, levaria a inclusão de mais uma variável (déficit de peso-altura).

Os métodos empregados na criação de modelos são sujeitos a erros e não há um método único para identificar-se o melhor modelo6. A significância estatística na análise univariada, que freqüentemente rege a identificação dos fatores de confusão, decorre tanto do tamanho da amostra em estudo quanto da magnitude da associação, enquanto que a presença de confusão depende apenas da magnitude da associação entre fator de confusão, fator em estudo e desfecho clínico6. Uma das vantagens da análise hierarquizada é que os critérios de seleção são previamente estabelecidos e visualiza-se o desenvolvimento do processo. Assegurou-se a adequação das variáveis modeladas através de sua avaliação em escala linear, dicotômica ou com maior número de categorias8. A seleção dos fatores de confusão socioeconômicos exemplifica como foi identificada a melhor escala para cada variável entrar na modelagem.

A avaliação do ajustamento da modelagem, através do componente sistemático (associação gama) mostra que uma proporção elevada de casos e controles seriam corretamente identificados através dos fatores de risco investigados. Contudo, mesmo a idade estando significativamente associada com diarréia grave, não seria capaz de melhorar a predição do desfecho clínico. Ao avaliar-se o componente de erro poderiam ser analisadas as observações individuais que se afastam da "média"7. Optou-se, contudo pela verificação da contribuição de cada bloco uma vez que a análise hierarquizada centra-se na medida de efeito a partir da inclusão de blocos. Uma vez que idade foi incluída no modelo e não representou um ganho substancial para o ajuste, deveria ser removida da modelagem caso o critério fosse puramente estatístico4. O exemplo a seguir torna evidente a importância biológica desta variável na modelagem15. Crianças menores têm maior chance de serem amamentadas, mas quando sob aleitamento artificial têm maior risco de desidratar.

Concluindo, a modelagem hierarquizada representa uma alternativa aos métodos tradicionais de análise. Contempla os aspectos "biológicos" e estatísticos, permitindo estruturar a investigação dos fatores de risco e facilitar a interpretação dos resultados. A verificação do ajuste da modelagem mostrou o ganho representado pela inclusão de cada bloco.

 

AGRADECIMENTOS

Ao Dr. José Martinez, coordenador do Programa de Controle da Doença Diarréica da Organização Mundial de Saúde, por seus comentários críticos na estruturação do projeto.

 

REFERÊNCIAS BIBLIOGRÁFICAS

1. Agresti, A. Categorical data analysis. New York, Wiley-Interscience Publication, 1989.         [ Links ]

2. Day, N.E.; Byar, D.P.; Green, S.B. Overadjustment in case-control studies. Am. J. Epidemiol., 112:696-706, 1980.         [ Links ]

3. Egbuonu, L. & Starfield, B. Child health and social status. Pediatrics, 69:550-7, 1982.         [ Links ]

4. Evans, S.J. Uses and abuses of multivariate methods in epidemiology. J. Epidemiol. Community Health, 42:311-5, 1988.         [ Links ]

5. Fuchs, S.C. Fatores de risco para diarréia complicada por desidratação moderada a grave: um estudo de casos e controles. Porto Alegre, 1993 [Tese de Doutorado - Faculdade de Medicina da UFGRS].         [ Links ]

6. Greeland, S. Modeling and variable selection in epidemiologic analysis. Am. J. Public Health, 79:340-9, 1989.         [ Links ]

7. Lemeshow, S. & Hosmer, D.W. Applied logistic regression. New York, Wiley-Interscience Publication, 1989.         [ Links ]

8. Lew, R.A.; Day, C.L.; Harrist, T.J.; Wood, W.C.; Mihm Jr., M.C. Multivariate analysis. JAMA, 249:641-3, 1983.         [ Links ]

9. Maldonado, G. & Greenland, S. Simulation study of confounder-selection strategies. Am. J. Epidemiol., 138:923-36, 1993.         [ Links ]

10. Mickey, R.M. & Greenland, S. The impact of confounder selection criteria on effect estimation. Am. J. Epidemiol., 129:125-37, 1989.         [ Links ]

11. Mosley, W.h. & Chen, L.C. An analytical framework for the study of child survival in developing countries. Popul. Develop. Rev., 10 (Supl):25-48, 1984.         [ Links ]

12. Olinto, M.T. Epidemiologia da desnutrição infantil em Pelotas. Pelotas, 1993. [Dissertação de Mestrado - Faculdade de Medicina da UFPel].         [ Links ]

13. Rothmann, K.J. Modern epidemiology. Boston, Little Brown, 1986.         [ Links ]

14. Vandenbroucke, J.P. Should we abandon statistical modeling altogether? Am. J. Epidemiol., 126:10-3, 1987.         [ Links ]

15. Victora, C.G.; Smith, P.G.; Vaughan, J.P.; Nobre, L.C.; Lombardi, C.; Teixeira, A.M.B.; Fuchs, S.C.; Moreira, L.B.; Gigante, L.P.; Barros, F.C. Evidence for protection by breast-feeding against infant deaths from infectious diseases in Brazil. Lancet, 2:319-21, 1987.         [ Links ]

16. Victora, C.G.; Facchini, L.A.; Barros, F.C.; Lombardi, C. Pobreza e saúde: como medir nível socioeconômico em estudos epidemiológicos de saúde infantil? In: Congresso Brasileiro de Epidemiologia, 1o. Campinas, 1990. Anais, Campinas, 1990.p.302-15.         [ Links ]

17. WORLD HEALTH ORGANIZATION. The treatment and prevention of acute diarrhoea: practical guidelines. Geneva, World Health Organization, 1989.         [ Links ]

 

* Apresentado como Tese de Doutorado intitulada: "Fatores de risco para diarréia complicada por desidratação moderada a grave: um estudo de casos e controle" em 1993, junto ao Curso de Pós-Graduação em Medicina Clínica Médica da Universidade Federal do Rio Grande do Sul. Financiado pela Organização Mundial da Saúde, Projeto n C6/181/304 (WHO registry file number) e 91023 EDP (project ID number).

Correspondência para / Correspondence to:
Sandra Costa Fuchs
Departamento de Medicina Social da Faculdade de Medicina da Universidade Federal do Rio Grande do Sul.
Rua Ramiro Barcelos, 2600, 4 andar, sala 415 - 90035-003 Porto Alegre, RS - Brasil.
Fax (55 051 330).1380

Recebido em 4.5.1995. Aprovado em 11.11.1995.