SciELO - Scientific Electronic Library Online

 
vol.40 issue5Creativity in proposing a sampling plan author indexsubject indexarticles search
Home Page  

Revista de Saúde Pública

Print version ISSN 0034-8910

Rev. Saúde Pública vol.40 n.5 São Paulo Oct. 2006

http://dx.doi.org/10.1590/S0034-89102006000600001 

CLÁSSICOS DOS PRIMEIROS DEZ ANOS LANDMARKS FROM THE FIRST TEN YEARS

 

Plano de amostragem utilizado no estudo de reprodução humana no distrito de São Paulo

 

 

Eunice Pinho de Castro Silva

 

 


RESUMO

Apresentação do processo de amostragem empregado para a seleção da amostra na qual se baseou o estudo da «Reprodução humana no Distrito de São Paulo», realizado pelo Departamento de Estatística Aplicada da Faculdade de Higiene e Saúde Pública da USP. O processo procurou resolver a situação criada com as limitações de verba, de tempo e carência de um sistema de referência que permitisse, no prazo estipulado e com a verba disponível, a seleção de uma amostra seguindo os procedimentos usuais de amostragem probabilística. Consistiu em aplicar amostragem em duas etapas, na qual a unidade primária foi domicílio e a unidade secundária foi mulher. Na primeira etapa empregou-se amostragem estratificada em que os estratos eram subdistritos. Para a seleção de unidades primárias sortearam-se pontos («pontos de partida») nos mapas dos subdistritos por um processo que se assemelha àquele chamado «grade quadrada», mas que difere deste quanto a vários aspectos. A cada «ponto de partida» selecionado corresponderam, por regras prefixadas, três domicílios com pelo menos uma mulher da população em estado residindo em cada um deles. Na segunda etapa, nos domicílios onde residia mais de uma mulher da população em estudo, procedeu-se a uma subamostragem na qual cada uma delas teve igual probabilidade de seleção. São também apresentados diferentes casos de ausência de resposta e as respectivas instruções às entrevistadoras.


SUMMARY

This work presents the sampling procedure used to select the sample got for a "Human Reproduction Study in the District of São Paulo" (Brazil), done by the Department of Applied Statistics of "Faculdade de Higiene e Saúde Pública da Universidade de São Paulo". The procedure tried to solve the situation which resulted from the limitation in cost, time and lack of a frame that could be used in order to get a probability sample in the fixed term of time and with the fixed cost. It consisted in a two stage sampling with dwelling-units as primary units and women as secondary units. At the first stage, it was used stratified sampling in which sub-districts were taken as strata. In order to select primary units, there was a selection of points ("starting points") on the maps of subdistricts by a procedure that was similar to that one called "square grid" but differed from this in several aspects. There were fixed rules to establish a correspondence between each selected "starting point" and a set of three dwelling units where at least one woman of the target population lived. In the selected dwelling units where more than one woman of target population lived, there was a sub-sampling in order to select one of them. In this selection each woman living in the dwelling unit had equal probability of selection. Several "no-answer" cases and correspondent instructions to be followed by the interviewers are presented too.


 

 

1. INTRODUÇÃO

O Departamento de Estatística Aplicada da Faculdade de Higiene e Saúde Pública, realizou um estudo sôbre a reprodução humana no Distrito de São Paulo (BERQUÓ et alii, 1967) que teve por objetivo investigar várias características da fertilidade nessa área, estudando-a sob aspectos biológicos, demográficos, sociais e econômicos.

Tendo sido essa pesquisa realizada através de um levantamento por amostragem, é intuito deste trabalho apresentar o plano de amostragem nela utilizado. Face às dificuldades encontradas com a ausência de sistemas de referência que permitissem, no prazo de tempo e com a verba fixados, a seleção de uma amostra segundo os processos usuais de amostragem probabilística, pareceu-nos que a apresentação do procedimento então seguido, com o qual procurou-se superar tais dificuldades, seria de utilidade no sentido de colaborar com todos aqueles que, trabalhando em Saúde Pública, têm freqüentemente de enfrentar problemas análogos.

 

2. POPULAÇÃO EM ESTUDO E SISTEMA DE REFERÊNCIA

De acôrdo com os objetivos do levantamento, a população em estudo consistia na totalidade das mulheres que em 1965 eram não solteiras, pertencentes ao grupo etário 15 |— 50 anos e residentes no Distrito de São Paulo. Tendo em consideração os objetivos da pesquisa, seria de se desejar que essa população pudesse ser estratificada de acôrdo com critérios baseados em fatores que seriam relevantes quanto à sua influência na fertilidade, tais como cor, nível sócio-econômico, grau de escolaridade, tipo de união e outros. Não foi, entretanto, viável tal estratificação precedendo à tomada da amostra, uma vez que o sistema de referência de que dispunha era constituído por 47 mapas 1, cada qual correspondendo a um sub distrito do Distrito de São Paulo e esse sistema de referência não era passível de estratificação de acôrdo com tais critérios. Pela impossibilidade da feitura de um cadastro que constituisse melhor sistema de referência que aquele disponível, tomaram-se tais mapas com fundamento de pesquisa.

Os processos de amostragem probabilística que seriam indicados para esse tipo de sistema de referência, seriam aqueles em que numa primeira etapa proceder-se-ia a uma amostragem de área e numa segunda ou numa terceira, selecionariam-se domicílios após o que seriam selecionadas mulheres da população em estudo. A aplicação de tais processos, entretanto, requereria as seguintes fases:

a) a formação de unidades primárias (áreas) que seriam grupos de quarteirões ou simplesmente quarteirões;

b) a enumeração dessas unidades primárias e se possível também estimação do tamanho (número de domicílios) para cada unidade primária;

c) a seleção de unidades primárias, dando a cada uma delas igual probabilidade ou então probabilidade proporcional ao tamanho estimado;

d) a feitura de listas dos domicílios pertencentes às unidades primárias e selecionadas;

e) a seleção de domicílios dentre aqueles pertencentes às unidades primárias selecionadas.

O tempo e verba de que dispunhamos para a seleção da amostra, entretanto, não nos permitia realizar nem mesmo as quatro primeiras fases.

Em vista dessas dificuldades adotou-se um processo de amostragem cujos principais aspectos passaremos a descrever:

 

3. AMOSTRAGEM

3.1. A amostra:

O tamanho de 3.000 mulheres para a amostra (2,6‰ de população de mulheres não solteiras do Distrito de São Paulo, estimada para 1965), foi estabelecido de acordo com as limitações econômicas e de tempo existentes.

3.2. Método de seleção:

O processo de amostragem utilizado foi o de amostragem estratificada com etapa dupla, na qual a unidade primária foi domicílio, onde residia uma ou mais mulheres da população em estudo e a unidade secundária foi mulher da população em estudo.

A segunda etapa na amostragem tornou-se necessária, pois que nos domicílios onde residiam duas ou mais mulheres da população estudada, todas consideradas "donas de casa", apenas uma delas deveria ser entrevistada, fato esse que associou a cada domicílio sorteado na primeira etapa, apenas uma mulher da amostra. Conseqüentemente, a amostra da população de domicílios onde residisse pelo menos uma mulher da população em estudo, deveria ter também tamanho 3.000.

3.3. Estratificação:

O distrito de São Paulo, foi dividido no atual qüinqüênio (1964/1968) em 48 subdistritos. Considerou-se, entretanto, o distrito dividido em 47 subdistritos, pois que o de Vila Nova Cachoeirinha, criado no atual qüinqüênio e proveniente dos de Santana, Nossa Senhora do Ó e de Casa Verde, não possuia ainda um mapa correspondente, estando ainda incluído nos mapas dos subdistritos dos quais proveio. Cada um dêsses 47 subdistritos constituiu um estrato.

3.4. Primeira etapa:

Chamando de tamanho do distrito (subdistrito) o número de unidades domiciliárias (onde residia pelo menos uma mulher da população em estudo), existentes no distrito (subdistrito) no período do levantamento, esses tamanhos foram estimados pelo número de unidades domiciliárias registradas para cada subdistrito, pelo Censo Escolar realizado em 1964. Na Tabela 1, é dada a relação dos 47 subdistritos com as estimativas dos respectivos tamanhos.

Foi planejada uma amostra estratificada de 3.000 domicílios na qual cada um dos 47 subdistritos constituiu um estrato. A partilha foi proporcional aos tamanhos estimados dos subdistritos, isto é, indicando por:

N' : tamanho estimado do distrito;

N'h : tamanho estimado do subdistrito h;

nh : o número de domicílios a serem selecionados do subdistrito; tivemos a relação:

Sendo esperado que cada entrevistadora realizasse três entrevistas por dia, desde que os domicílios fôssem próximos, a seleção de 3.000 domicílios processou-se selecionando-se no conjunto de mapas, 1.000 pontos, chamados "pontos de partida". A cada um desses pontos corresponderiam três domicílios cuja tomada seguiu regras prefixadas que citaremos adiante.

Dado que no subdistrito h seriam selecionados nh domicílios, no mapa correspondente deveriam ser selecionados "pontos de partida", sendo o inteiro mais próximo de . Na Tabela 1 são dadas as estimativas dos tamanhos dos estratos (subdistritos) e o número de "pontos de partida" que foram selecionados em cada um dos mapas correspondentes.

3.4.1. Regra para a seleção dos "pontos de partida" no mapa:

Traça-se uma reta que corte a planta, como a reta t na Figura 1. Considera-se nessa reta o segmento de reta, o qual chamamos eixo, cujos extremos são pontos da linha limítrofe da planta, que na Figura 1 seria o segmento AD. Traçando-se retas perpendiculares a esse eixo, divide-se a superfície do mapa em áreas parciais, as quais constituirão estratos do mapa, de tal forma, que sendo a a área do menor estrato, a área do estrato i será aproximadamente (kia) onde ki é um número natural. Assim, no mapa da Figura 1, traçar-se-iam as perpendiculares r e s, ao eixo t, pois que dessa forma a superfície do mapa ficaria dividida em 3 estratos: estrato I, estrato II e estrato III, de tal forma que sendo a a área do estrato III, o estrato I teria área aproximadamente 3a e o estrato II aproximadamente 8a.

"Eixo parcial i" é a parte do eixo que pertence ao estrato de superfície i. Os segmentos AB, BC e CD são, na Figura 1, respectivamente: eixo parcial 1, eixo parcial 2 e eixo parcial 3.

Considera-se o mapa como tendo sido milimetrado, de modo que o eixo do mapa pertença a uma das retas dêsse quadriculado 2. Aplicando-se um dêsses quadriculados ao mapa da Figura 1, êste ficaria como consta na Figura 2.

Sendo:

total de pontos a serem selecionados nesse mapa

: total de pontos a serem selenados do estrato i

os números são determinados de modo a se ter a proporção:

ou seja, o n.° de pontos a ser selecionado de cada estrato do mapa é aproximadamente proporcional à área dêsse estrato.

A seleção de pontos no estrato i no mapa é feita aplicando-se um processo que se assemelha ao processo de amostragem sistemática bidimensional denominado "grade quadrada", mas que não se identifica a este por características que passaremos a apresentar.

Aos pontos de eixo parcial i, que são pontos de intersecções com as retas de um quadriculado, aplica-se amostragem sistemática unidimensional e, selecionam-se pontos. Pelos pontos selecionados, traçam-se segmentos perpendiculares ao eixo. Assim, no caso do mapa da Figura 1, se tivéssemos:

deveríamos tomar:

e como

e

teríamos:

Aplicando amostragem sistemática unidimensional a cada um dos eixos AB, BC e CD, a fim de sortear respectivamente 6, 12 e 2 pontos e traçando-se pelos pontos sorteados, segmentos perpendiculares aos eixos, teríamos o mapa da Figura 3.

Em cada um dos segmentos perpendiculares do estrato i, é considerado um conjunto discreto de pontos equidistantes e a esse conjunto, aplica-se amostragem casual simples, a fim de sortear um ponto do mesmo.

Dessa forma no estrato i de superfície, desse mapa, ficam selecionados pontos.

Aplicando-se sorteio dêsse tipo aos conjuntos de pontos de cada um dos 24 segmentos traçados no mapa da Figura 3, este mapa ficaria como consta na Figura 4.

Quando o ponto sorteado pertence ao contôrno de algum quarteirão, então, esse ponto já é um "ponto de partida". Se, porém, o ponto sorteado não cair no contôrno de nenhum quarteirão, toma-se como "ponto de partida" o ponto mais próximo desse sorteado e que pertencendo à mesma perpendicular, esteja num contôrno de quarteirão. Havendo mais um ponto, com as características deste último, faz-se um sorteio, a fim de selecionar um deles e nesse sorteio, cada um desses dois pontos deve ter igual probabilidade de vir a ser sorteado.

Para cada "ponto de partida" foram feitos dois desenhos do tipo que consta na Figura 5, mostrando o contôrno do quarteirão que o continha, com os nomes das vias públicas que o limitavam. Um dos desenhos era entregue à entrevistadora, juntamente com o grupo de três questionários e o outro ficava arquivado.

O ponto de tangência do pequeno círculo tangente ao contôrno do quarteirão mostrava a localização do "ponto de partida" nesse quarteirão com relação a determinada esquina, chamada "esquina de referência". A determinação dessa esquina era feita pela flexa que une o círculo ao contôrno do quarteirão. O "ponto de partida" era a construção que a partir dessa esquina, estava em lugar, onde r é o ordinal que acompanha, no desenho, o círculo indicador do "ponto de partida". Esse número r era determinado medindo-se no mapa, em milímetros 3, a distância do "ponto de partida" àquela esquina. Assim, se aquela distância fosse 7 mm, a construção seria a 7.ª a partir da esquina de referência. Quando essa distância era nula, isto é, quando o "ponto de partida" ficava no vértice de um ângulo do contôrno, escrevia-se no desenho do quarteirão, no lugar de um ordinal, a palavra " esquina" e o ponto de partida seria a construção da esquina.

Para cada quarteirão contendo "ponto de partida" a entrevistadora recebia um desenho do tipo indicado na Figura 5 e indo ao local do quarteirão, localizava, seguindo as indicações contidas no desenho, a construção que era o "ponto de partida" desse quarteirão. A partir dessa construção, percorria o quarteirão, no sentido assinalado pela flexa fora do contôrno (sentido horário) 4 e tomava os três primeiros domicílios que encontrava, satisfazendo a condição de em cada um deles residir pelo menos uma mulher da população em estudo. 5 Êsses três pertenciam então à amostra de domicílios. Um conjunto de três domicílios tomado nessas condições foi chamado "segmento".

Na tomada do "ponto de partida" houve observações e instruções especiais que passaremos a enunciar.

3.4.2. Instruções para a determinação da construção a ser considerada como "ponto de partida"

a) Cada construção de esquina é considerada pertencendo à quadra que no sentido horário segue-se a essa esquina.

b) Se o número de ordem que no desenho acompanha o círculo representativo do "ponto de partida" for maior que o número de construções que estão na mesma quadra 6 em que está o ponto de partida, faz-se uma contagem circular, isto é, a partir da esquina da referência, contam-se as construções que estão naquela quadra. Após contada a última construção da quadra, continua-se a contagem com a primeira da quadra, novamente e assim prosseguindo até que se alcance o ordinal fixado. A última construção que foi assim contada, será o "ponto de partida" do segmento nesse quarteirão.

c) Se na quadra onde está o círculo vermelho (círculo que tangencia o contorno), não houver construção alguma, percorre-se o quarteirão no sentido indicado por uma flexa que iria da esquina de referência ao círculo vermelho; vão se contando as construções que nesse sentido vão sendo encontradas; a construção correspondente ao número de ordem do "ponto de partida" será o "ponto de partida" do segmento desse quarteirão.

3.4.3. Instruções para a tomada do "segmento" uma vez localizado seu "ponto de partida".

A partir da construção que é o "ponto de partida" tomam-se os três primeiros domicílios 7 que forem encontrados ao se percorrer o quarteirão no sentido estabelecido. Nessa tomada de domicílios, a construção que é o "ponto de partida" poderá ou não ser o primeiro dos domicílios a formar o segmento.

 

OBSERVAÇÕES:

I) Ao percorrer um quarteirão, sendo encontrada alguma entrada para alguma vila, esta deverá ser percorrida em continuação e se depois de percorrida, não estiver ainda completo o segmento, prossegue-se pelo quarteirão, naquele mesmo sentido estabelecido, tal como é indicado na Figura 6.

II — Se no lugar de vila for alguma favela, procede-se da mesma forma que no caso da vila.

III — No caso de internatos, verificar se há residência ou residências de professores ou outros funcionários, residindo em casas separadas; em caso afirmativo proceder como no caso da vila.

IV — Também no caso de construções em cujo quintal haja outras construções (uma casa na frente do terreno e outra ou outras casas no fundo) proceder como no caso das vilas. Desta forma, quando a entrevistadora deparar com um caso em que há possibilidade de haver além da casa da frente, outras casas no fundo do quintal, deverá constatar a veracidade desse fato.

V — Prédios de apartamentos: Se na obtenção do segmento, alguma das construções que tiver que ser visitada for algum prédio de apartamento, dever-se-á:

a) consultar a "fôlha de sorteio do andar inicial" (Tabela 2);

 

 

b) depois de consultado qual o andar sorteado como inicial, começar as entrevistas a serem tomadas nesse andar do prédio, pelo lado esquerdo de quem sobe (ou entra), qualquer que tenha sido o processo de acesso a êsse andar;

c) se, com os apartamentos desse andar, não completar o segmento, continuar:

— tomando os apartamentos do andar imediatamente abaixo desse inicial (começando pelo apartamento à esquerda de quem desce) ;

— tomando domicílios nas construções que, no sentido de percurso do quarteirão, seguem ao citado prédio de apartamentos, isso caso o andar inicial tenha sido o andar térreo;

d) enquanto o segmento não estiver completo, prosseguir percorrendo o prédio do andar sorteado como inicial para baixo, sempre começando em cada andar, pelo apartamento à esquerda de quem desce.

Se, alcançando o andar térreo, ainda não estiver completo o segmento, prosseguir pelas construções que, no sentido de percurso do quarteirão, seguem ao prédio.

VI — No caso de pensões, proceder como no caso de prédios de apartamentos.

VII — No caso de casas onde há sublocação, proceder como se fosse um único domicílio.

VIII — Uma vez identificada qual a construção que será ponto de partida do segmento, percorrer o quarteirão no sentido horário até completar o segmento de 3 domicílios, não importando que para isso seja preciso dar a volta completa no quarteirão.

IX — Se, mesmo percorrendo todo o quarteirão, o segmento não ficar completo, proceda da seguinte forma:

a) no quarteirão em frente ao ponto de partida do segmento selecionado, isto é, no lado da rua oposto àquêle em que está o ponto de partida, tomar a continuação do segmento. Para isso, tomar como ponto de partida neste quarteirão de frente, a construção que, com relação a esquina em frente à esquina de referência, tem o mesmo número de ordem que o do ponto de partida neste quarteirão do segmento selecionado. Tomando este novo ponto de partida neste quarteirão, percorrê-lo no sentido horário até complemtar o segmento. Escrever na capa do questionário correspondente: "continuação de segmento no quarteirão em frente";

b) Se não se conseguir completar o segmento desta forma ou porque não há quarteirão em frente ao "ponto de partida" do segmento, ou porque apesar de haver construções, não houve domicílios em número suficiente para completar o segmento, fazer no desenho que acompanha o questionário, um esbôço dos contôrnos dos quarteirões que circundam e que estão mais próximos daquele sorteado. No caso de alguns desses quarteirões serem vazios de habitações, fazer constar isto no desenho. Deixar o segmento incompleto e mediante a apresentação daquele desenho ao encarregado da amostragem, perguntar onde continuar a tomada de domicílios para completar o segmento. Nos questionários correspondentes a esses domicílios tomados para completar o segmento, escrever na capa: "acréscimo no esbôço".

X — Em tôdas as construções encontradas nos quarteirões sorteados a partir do "ponto de partida", no sentido horário, deve ser pesquisada a presença de algum domicílio. Assim, nas casas comerciais, nas fábricas, nos hospitais, deve ser perguntado se há pessoas que ali residem e em caso afirmativo, verificar se algumas delas pertencem à população em estudo.

Note-se que em igrejas protestantes ou ortodoxas e sinagogas, desde que sejam encontradas ao se percorrer o quarteirão sorteado, deve ser averiguado se aí reside pessoa da população em estudo, enquanto que em igrejas católicas, conventos, não haverá entrevistas. Também não haverá entrevistas em hotéis, Casa da Mãe Solteira, presídios de mulheres e casas de prostituição.

Ao adotarmos na primeira etapa:

a) o processo de amostragem estratificada com partilha proporcional ao número estimado de domicílios em cada subdistrito;

b) o processo de sorteio dos pontos nos mapas de modo que para cada mapa tentou-se dar a cada ponto do quadriculado, igual probabilidade de ser ponto sorteado nesse mapa;

c) as regras para tomada dos "pontos de partida";

d) as regras contidas nas instruções para tomada dos três domicílios de um segmento;

procurou-se eliminar tôda possibilidade da escolha de domicílio por parte das entrevistadoras e dar a cada domicílio da população de domicílios do distrito de São Paulo, igual probabilidade de vir a pertencer à amostra.

3.5. Segunda etapa:

Uma vez selecionado um domicílio na primeira etapa, havendo apenas uma mulher da população em estudo residindo no domicílio e considerada "dona da casa", então nesse caso, esta pertenceria à amostra. Se porém, no domicílio sorteada residisse mais de uma mulher da população em estudo, todas consideradas "donas da casa", então neste caso, tornava-se necessário o sorteio de uma delas, dando a cada uma, igual probabilidade de vir a pertencer à amostra.

Sendo nij o número de mulheres pertencentes à população em estudo, residentes no domicílio j do subdistrito i, consideradas "dona de casa", selecionava-se uma delas, procedendo da seguinte forma:

a) a entrevistadora escrevia na capa do questionário correspondente àquêle domicílio com caneta esferográfica, as idades das mulheres desse domicílio, enumerando essas idades de modo a que nessa numeração as idades ficassem em ordem crescente;

b) usando a Tabela 3 constatava qual era a mulher sorteada das nij mulheres 8.

 

 

A Tabela 3 foi elaborada de forma que se num domicílio houvesse nij mulheres, cada uma delas teria probabilidade: a ser a mulher sorteada.

Dos domicílios da amostra, a porcentagem daqueles em que residia mais de uma mulher da população em estudo, todas consideradas "donas de casa" e para as quais houve sorteio, foi de 1,5%, ou seja, em 98,5% das unidades primárias selecionadas, não foi necessária a sub-amostragem.

Com as instruções dadas às entrevistadoras para os diferentes casos de ausência de resposta 9, não ficaram representadas na amostra:

a) mulheres que no período do levantamento estavam de viagem com duração de mais de um dia;

b) mulheres cujos domicílios, no período do levantamento, foram encontrados fechados e em relação às quais foi possível obter informações de vizinhas;

c) mulheres que se recusaram a responder ao questionário.

 

REFERÊNCIA BIBLIOGRÁFICA

BERQUÓ, E. et alii — Levels and variations in fertility revealed by a recent study in São Paulo [São Paulo, F.H.S.P.] 1967. (mimeografado.        [ Links ]

 

 

Recebido para publicação em 20-2-1968

 

 

Da Cadeira de Estatística Aplicada à Saúde Pública da Faculdade de Higiene e Saúde Pública da USP
1 Mapas que consistiam em plantas da cidade, porém não se tratavam de plantas aerofotogramétricas.
2 Efetivamente esses quadriculados não são traçados nos mapas, mas apenas imaginados.
3 A escala dos mapas utilizados era de 1:10.000.
4 O sentido horário foi o sentido de percurso de quarteirão, adotado para todos os quarteirões selecionados.
5 Por dificuldades inerentes ao trabalho de campo, a alguns pontos de partida corresponderam mais de 3 domicílios, resultando daí uma amostra final de 3.009 domicílios.
6 Note-se que ao contarmos o número de construções de uma quadra, deve-se excluir a última da quadra, quando esta for de esquina (última, no sentido horário).
7 Aqui e nos parágrafos que se seguem, sempre que empregarmos "domicílio", significará domicílio onde reside uma ou mais mulheres da população em estudo.
8 Note-se que em casas onde havia sublocação, dado que tenha sido estabelecido que seria considerada como sendo um só domicílio, se houvesse mais de uma mulher da população em estudo, era necessário aplicar-se o sorteio a essas mulheres.
9 Ver ANEXO.

 

 

ANEXO

 

Anexo - clique aqui pra ampliar