Tamanho amostral em pesquisa quantitativa, cálculo formal, pragmatismo, precisão e validade

Aldemar Araujo Castro
Criação: 09/04/2026
Atualização: 09/04/2026
Palavras: 3990
Tempo de leitura: 20 minutos

Resumo

Este texto discute o tamanho da amostra em pesquisas quantitativas como decisão central para a qualidade metodológica do estudo. Apresenta dois grandes modelos de definição amostral, o formal e o pragmático. No modelo formal, o cálculo varia conforme o objetivo principal da pesquisa, podendo ser orientado para estimativa, comparação entre grupos, correlação ou regressão. No modelo pragmático, a amostra pode ser definida por viabilidade, disponibilidade de casos, bancos de dados existentes ou referência em estudos anteriores. O texto também aborda fatores que modificam o tamanho da amostra, erros frequentes e formas adequadas de justificar essa decisão no método.

1. Introdução

O tamanho da amostra é uma das decisões mais importantes no planejamento de uma pesquisa quantitativa. Embora, à primeira vista, possa parecer apenas uma escolha numérica, na verdade ele interfere diretamente na força metodológica, na credibilidade dos resultados e na capacidade do estudo de responder à pergunta de pesquisa. Uma amostra mal dimensionada pode comprometer todo o trabalho, mesmo quando a pergunta científica é relevante, a coleta de dados é cuidadosa e a análise estatística é sofisticada.

Em pesquisas quantitativas, a lógica central é produzir resultados que permitam estimar parâmetros, comparar grupos, identificar associações ou construir modelos explicativos com base em dados observáveis. Para que isso ocorra de forma confiável, é necessário que o número de participantes, registros, exames ou unidades analisadas seja compatível com o objetivo do estudo. Quando a amostra é pequena demais, o estudo pode não conseguir detectar diferenças reais, produzindo resultados estatisticamente não significativos mesmo quando existe um efeito verdadeiro. Quando a amostra é excessivamente grande, pode haver desperdício de tempo, dinheiro e esforço, além do risco de identificar diferenças estatisticamente significativas, mas clinicamente irrelevantes.

Essa discussão é especialmente importante porque muitos estudantes e pesquisadores iniciantes ainda tratam o tamanho da amostra de modo simplificado. Às vezes, escolhem um número por tradição da área, por facilidade operacional ou por semelhança com estudos anteriores, sem avaliar se esse número realmente atende à finalidade do trabalho. Em outras situações, utilizam programas de cálculo amostral sem compreender os parâmetros inseridos, o que gera uma aparência de rigor estatístico, mas não necessariamente uma justificativa metodológica sólida.

Por isso, discutir o tamanho da amostra não significa apenas apresentar fórmulas. Significa compreender a relação entre a pergunta de pesquisa, o desfecho principal, o tipo de análise estatística e a quantidade de dados necessária para produzir uma resposta cientificamente defensável. O cálculo amostral, quando possível e adequadamente realizado, representa a forma mais robusta de fundamentar essa decisão. Entretanto, a prática científica também convive com situações em que a definição amostral depende de critérios mais pragmáticos, como disponibilidade de casos, bancos de dados existentes, viabilidade operacional ou estudos prévios semelhantes.

Dessa forma, o estudo do tamanho da amostra exige uma visão equilibrada. De um lado, é preciso reconhecer que o modelo formal, baseado em cálculo estatístico, constitui a estratégia metodologicamente preferencial. De outro, é necessário admitir que muitos estudos reais operam com limitações práticas e utilizam critérios pragmáticos, os quais devem ser explicitados com honestidade e avaliados criticamente. O erro não está apenas em usar uma estratégia pragmática, mas em apresentá,la como se tivesse o mesmo grau de robustez de um cálculo formal bem fundamentado.

Neste capítulo, o objetivo é explicar de forma didática como o tamanho da amostra pode ser definido em pesquisas quantitativas, destacando dois grandes modelos, o modelo formal, baseado em cálculo estatístico, e o modelo pragmático, baseado em viabilidade e referências empíricas. No interior do modelo formal, será enfatizado que o cálculo varia conforme o objetivo principal do estudo, podendo ser voltado para estimativa, diferença entre grupos, correlação ou regressão. A partir dessa organização, o leitor poderá compreender não apenas como se escolhe um número, mas por que esse número precisa estar alinhado à lógica científica da investigação.

Em pesquisas quantitativas, o tamanho da amostra pode ser definido por métodos formais ou por critérios pragmáticos, mas o cálculo estatístico permanece como a estratégia metodologicamente mais robusta sempre que houver dados suficientes para realizá-lo.

2. O que é tamanho da amostra e por que ele importa

Em sentido simples, o tamanho da amostra corresponde ao número de unidades observacionais incluídas na pesquisa. Essas unidades podem ser pessoas, pacientes, prontuários, exames laboratoriais, escolas, municípios, domicílios, artigos científicos ou qualquer outro elemento que componha o conjunto analisado. Em termos práticos, trata,se do n do estudo.

Apesar dessa definição aparentemente simples, o tamanho da amostra tem implicações metodológicas profundas. Ele influencia, ao mesmo tempo, a precisão das estimativas, o poder estatístico, a largura dos intervalos de confiança, a capacidade de detectar diferenças reais e a estabilidade de modelos analíticos mais complexos. Em outras palavras, o tamanho da amostra afeta não apenas a quantidade de dados disponível, mas a própria qualidade inferencial do estudo.

Uma das funções mais importantes da amostra é permitir que o pesquisador faça inferências sobre uma população de interesse. Como, na maioria das vezes, não é viável examinar todos os indivíduos de uma população, seleciona,se uma parte dela para análise. O problema é que essa parte precisa ser suficientemente informativa. Se a amostra for muito pequena, a estimativa obtida poderá oscilar bastante e não representar adequadamente o parâmetro populacional. Se for adequadamente dimensionada, a estimativa tende a ser mais estável e confiável.

Essa ideia fica mais clara quando se pensa em precisão. Suponha um estudo transversal cujo objetivo seja estimar a prevalência de hipertensão em determinada comunidade. Se a amostra for pequena, o intervalo de confiança ao redor da prevalência observada tenderá a ser mais largo, indicando maior incerteza. Se a amostra for maior, esse intervalo tende a se estreitar, tornando a estimativa mais precisa. Portanto, em estudos de estimativa, o tamanho da amostra está diretamente relacionado à margem de erro aceitável.

Além da precisão, o tamanho da amostra interfere no chamado poder estatístico. O poder representa a probabilidade de o estudo detectar um efeito verdadeiro quando ele realmente existe. Em estudos comparativos, por exemplo, uma amostra muito pequena pode levar a um resultado não significativo simplesmente porque faltou sensibilidade estatística para identificar a diferença. Nesse caso, o problema não está necessariamente na inexistência do efeito, mas na insuficiência do estudo para revelá,lo. Por isso, amostras subdimensionadas aumentam o risco de erro do tipo II, isto é, de concluir que não há diferença quando, na realidade, ela existe.

Outro ponto importante é que o tamanho da amostra se relaciona com a magnitude do efeito que se deseja detectar. Efeitos muito pequenos costumam exigir amostras maiores. Efeitos grandes podem ser detectados com amostras menores. Isso mostra que não existe tamanho de amostra “bom” ou “ruim” em abstrato. Um número pode ser suficiente para um objetivo e insuficiente para outro. O que define a adequação da amostra não é o valor isolado do n, mas sua relação com a pergunta de pesquisa e com a análise planejada.

Também é importante destacar que amostras muito grandes não são automaticamente melhores. Esse é um erro comum. Em um primeiro olhar, pode parecer que quanto mais participantes houver, melhor será o estudo. Mas isso não é sempre verdadeiro. Uma amostra excessivamente grande pode elevar custos, aumentar o tempo de coleta, dificultar a logística e, em certas situações, produzir significância estatística para diferenças tão pequenas que não tenham relevância prática, clínica ou científica. Em outras palavras, uma amostra superdimensionada pode tornar o estudo ineficiente e até distorcer a interpretação da importância dos achados.

O tamanho da amostra ainda influencia a robustez de análises multivariadas, como regressões e modelos preditivos. Nesses casos, não basta pensar apenas no número total de participantes. É preciso considerar também o número de variáveis incluídas no modelo, a frequência do desfecho e a estabilidade das estimativas produzidas. Modelos muito complexos aplicados a amostras pequenas tendem a gerar resultados instáveis, com maior risco de sobreajuste e menor capacidade de generalização.

Na prática, definir o tamanho da amostra é, portanto, uma decisão que envolve equilíbrio. O pesquisador precisa buscar um número que seja suficiente para produzir respostas confiáveis, mas sem desperdício desnecessário de recursos. Essa decisão não deve ser tomada por intuição, hábito ou imitação acrítica de estudos anteriores. Ela deve ser justificada de acordo com a finalidade principal da pesquisa.

É justamente por isso que a metodologia quantitativa distingue diferentes formas de fundamentar o tamanho da amostra. A mais robusta é o modelo formal, em que o número é calculado com base em parâmetros estatísticos e no objetivo analítico principal do estudo. Mas há também o modelo pragmático, em que o tamanho da amostra é definido por viabilidade, disponibilidade de dados ou referência em estudos semelhantes. Entender essa distinção é essencial para que o pesquisador saiba não apenas quantos participantes incluir, mas também como justificar essa escolha com clareza e rigor.

Fechamento de transição

Se o tamanho da amostra é uma decisão tão central, surge a seguinte pergunta: como ele pode ser definido na prática? A resposta passa pela compreensão de dois grandes modelos, o formal e o pragmático. O próximo tópico tratará exatamente dessa divisão, mostrando a lógica geral de cada modelo e a hierarquia metodológica entre eles.

3. Dois grandes modelos de definição do tamanho da amostra

Depois de compreender o que é o tamanho da amostra e por que ele interfere tanto na qualidade da pesquisa quantitativa, o passo seguinte é entender como esse tamanho pode ser definido. Do ponto de vista didático, essa definição pode ser organizada em dois grandes modelos, o modelo formal e o modelo pragmático.

Essa divisão é útil porque permite ao pesquisador distinguir situações em que o tamanho da amostra decorre de um cálculo estatístico fundamentado daquelas em que ele é estabelecido por critérios operacionais, contextuais ou comparativos. Os dois modelos existem na prática científica, mas não têm o mesmo peso metodológico. O modelo formal é, em regra, a estratégia preferencial. O modelo pragmático é uma alternativa real, frequente e por vezes inevitável, mas deve ser reconhecido como tal.

3.1 Modelo formal

O modelo formal é aquele em que o tamanho da amostra é definido por meio de um cálculo estatístico, orientado pelo objetivo principal do estudo. Aqui, o pesquisador não escolhe o número de participantes com base em hábito, conveniência ou simples aproximação. Ele utiliza parâmetros quantitativos que traduzem a pergunta de pesquisa em uma exigência numérica.

Esse cálculo não é único. Ao contrário, ele muda conforme a finalidade analítica do estudo. Em algumas pesquisas, o objetivo central é estimar um parâmetro, como uma prevalência ou uma média. Em outras, o interesse é comparar grupos, avaliar uma correlação ou construir um modelo de regressão. Em cada uma dessas situações, o cálculo amostral assume estrutura própria, porque a exigência estatística é diferente.

Em síntese, o modelo formal parte da seguinte lógica: para responder adequadamente a uma pergunta quantitativa, é necessário determinar quantas observações são necessárias para produzir uma resposta confiável, precisa e estatisticamente consistente.

3.2 Modelo pragmático

O modelo pragmático é aquele em que o tamanho da amostra não resulta prioritariamente de cálculo estatístico, mas de condições práticas da pesquisa. Isso pode ocorrer quando o pesquisador trabalha com todos os casos disponíveis em determinado período, utiliza um banco de dados já existente, realiza um estudo piloto, depende de uma população rara ou adota como referência estudos anteriores semelhantes.

Esse modelo é muito comum na prática, especialmente em pesquisas com limitações de tempo, recursos, acesso a participantes ou disponibilidade de registros. Também aparece em estudos exploratórios, investigações iniciais e análises retrospectivas de bases secundárias.

Contudo, é importante fazer uma distinção conceitual importante. O fato de o modelo pragmático ser comum não significa que ele tenha a mesma robustez do cálculo formal. Seu valor metodológico depende da clareza com que é apresentado e da coerência entre a justificativa usada e o objetivo do estudo. O problema não está em utilizá,lo, mas em ocultar sua natureza ou apresentá,lo como se fosse equivalente a um cálculo estatístico plenamente fundamentado.

3.3 Hierarquia metodológica entre os dois modelos

Do ponto de vista científico, o modelo formal ocupa posição hierarquicamente superior, porque oferece justificativa mais objetiva, transparente e reproduzível para a definição do tamanho da amostra. Sempre que houver condições para realizar um cálculo estatístico adequado, essa deve ser a via preferencial.

O modelo pragmático, por sua vez, deve ser entendido como uma solução contextual. Ele pode ser aceitável, e até a única alternativa possível em certas circunstâncias, mas exige maior cautela interpretativa. Em alguns casos, seus limites podem reduzir a precisão das estimativas, enfraquecer a capacidade comparativa do estudo ou restringir a generalização dos resultados.

Essa hierarquia é importante porque ajuda a evitar um erro frequente na redação científica. Muitos estudos utilizam amostras definidas pragmaticamente, mas apresentam a justificativa de modo genérico, dando a impressão de que houve um cálculo formal quando isso não ocorreu. Em termos metodológicos, isso empobrece o estudo. É preferível declarar com clareza que a amostra foi definida por disponibilidade de casos, por banco de dados existente ou por características de um estudo piloto, do que utilizar linguagem imprecisa para simular um rigor inexistente.

3.4 A utilidade dessa divisão para o pesquisador

A distinção entre modelo formal e modelo pragmático tem grande utilidade pedagógica e prática. Ela permite que o pesquisador:

identifique a estratégia mais adequada ao seu desenho de estudo,
compreenda o grau de robustez da justificativa amostral que está utilizando,
reconheça as limitações do próprio método,
redija de forma honesta e precisa a seção metodológica.

Essa organização também ajuda o leitor crítico a interpretar melhor um artigo, uma dissertação ou uma tese. Ao examinar a justificativa da amostra, ele pode avaliar se o estudo realmente utilizou um cálculo estatístico compatível com seu objetivo ou se trabalhou com uma definição pragmática que deve ser lida com maior cautela.

Em resumo, os dois grandes modelos de definição do tamanho da amostra não são apenas duas formas de escolher um número. Eles representam duas lógicas distintas de fundamentação metodológica. Conhecer essa diferença é essencial para que o pesquisador tome decisões mais sólidas e para que o leitor interprete os resultados com maior rigor.

4. Modelo formal de definição do tamanho da amostra

O modelo formal é o eixo central da definição amostral em pesquisas quantitativas. Nele, o tamanho da amostra é estabelecido por meio de cálculo estatístico, construído a partir da pergunta principal do estudo e dos parâmetros necessários para responder a essa pergunta de forma confiável. Não se trata, portanto, de escolher um número arbitrário, mas de traduzir a lógica da investigação em exigência matemática.

Esse ponto merece destaque porque muitos pesquisadores associam o cálculo amostral apenas a um procedimento técnico executado em software ou em calculadoras online. Na realidade, o cálculo é a expressão numérica de decisões metodológicas anteriores. Antes de calcular o tamanho da amostra, o pesquisador precisa saber com clareza o que deseja demonstrar, estimar ou testar. Sem essa definição, o cálculo pode até ser executado, mas será conceitualmente vazio.

4.1 Lógica geral do modelo formal

A lógica do modelo formal pode ser resumida da seguinte maneira: o pesquisador define o objetivo analítico principal do estudo e, com base nele, estabelece qual quantidade de observações é necessária para atingir um grau adequado de precisão ou de capacidade de detecção estatística.

Em termos práticos, isso significa que o cálculo depende do tipo de pergunta formulada. Se o estudo quer estimar uma prevalência, a amostra será determinada com foco na precisão da estimativa. Se quer comparar dois grupos, o cálculo será orientado pela diferença que se deseja detectar. Se quer avaliar correlação, a amostra dependerá da força de associação esperada. Se quer construir modelo de regressão, entram em cena a complexidade do modelo, o número de variáveis e a frequência do desfecho.

Portanto, o modelo formal não é um cálculo único aplicado indistintamente a qualquer pesquisa. Ele é um conjunto de estratégias de cálculo, todas pertencentes à mesma lógica estatística, mas adaptadas à finalidade analítica dominante.

4.2 Elementos gerais que participam do cálculo formal

Embora cada tipo de cálculo tenha particularidades, alguns elementos aparecem com frequência na maior parte dos modelos formais.

a) Objetivo principal do estudo

O primeiro elemento é o objetivo principal. Ele define a natureza do cálculo. Um estudo de estimativa exige um raciocínio diferente de um estudo comparativo. Um estudo correlacional exige outra lógica, e um estudo com regressão demanda outra ainda. Quando o objetivo principal não está claro, todo o cálculo amostral tende a ficar comprometido.

b) Nível de significância

Outro elemento importante é o nível de significância, geralmente representado por alfa. Esse parâmetro expressa a tolerância do pesquisador ao erro do tipo I, isto é, à probabilidade de considerar que existe um efeito quando ele não existe. Em muitas pesquisas biomédicas e em grande parte das ciências da saúde, adota,se com frequência o valor de 5%, mas esse número não deve ser tratado como ritual automático. Ele precisa fazer sentido dentro da estratégia analítica do estudo.

c) Poder estatístico

O poder estatístico representa a capacidade do estudo de detectar um efeito verdadeiro. Em termos simples, é a chance de o estudo encontrar uma diferença, associação ou efeito se esse fenômeno realmente existir. Estudos com baixo poder podem falhar em identificar efeitos reais, produzindo resultados falsamente negativos. Por isso, o poder costuma ser elemento central nos cálculos voltados à comparação entre grupos, correlação e alguns modelos de regressão.

d) Tamanho do efeito esperado

O tamanho do efeito corresponde à magnitude mínima de diferença, associação ou relação que o pesquisador considera relevante detectar. Esse é um dos componentes mais decisivos do cálculo formal. Efeitos pequenos exigem amostras maiores. Efeitos grandes podem ser detectados com menos observações. A dificuldade prática está em estimar, de modo plausível, qual efeito esperar. Para isso, frequentemente se utilizam estudos prévios, conhecimento clínico, resultados piloto ou julgamento de relevância científica.

e) Variabilidade da medida

Nos estudos que trabalham com variáveis contínuas, a variabilidade, frequentemente expressa pelo desvio padrão, tem grande influência sobre a amostra. Quanto maior a dispersão dos dados, maior tende a ser o número necessário de observações para estimar ou comparar com precisão. Em outras palavras, dados mais heterogêneos exigem maior esforço amostral.

f) Frequência esperada do desfecho

Em estudos com desfechos binários ou categóricos, a frequência esperada do evento também influencia o cálculo. Eventos raros costumam exigir amostras maiores, especialmente quando o objetivo é comparar grupos ou ajustar modelos multivariados. Essa é uma razão pela qual pesquisas sobre desfechos incomuns frequentemente demandam longos períodos de inclusão ou múltiplos centros de coleta.

g) Precisão desejada

Nos cálculos orientados para estimativa, a precisão é elemento central. O pesquisador precisa definir qual margem de erro considera aceitável e qual nível de confiança pretende obter ao redor da estimativa. Quanto maior a precisão desejada, maior tende a ser a amostra necessária.

h) Perdas e recusas previstas

Nenhum planejamento amostral realista pode ignorar a possibilidade de perdas, recusas, exclusões ou dados incompletos. Por isso, mesmo após o cálculo do n mínimo necessário, costuma,se acrescentar uma margem de segurança. Esse ajuste é essencial para evitar que o estudo termine com número efetivo de observações inferior ao necessário.

4.3 O modelo formal como expressão de coerência metodológica

Uma das maiores virtudes do modelo formal é que ele obriga o pesquisador a alinhar quatro elementos centrais do estudo:

a pergunta de pesquisa,
o desfecho principal,
a análise estatística,
a justificativa do tamanho da amostra.

Quando esse alinhamento existe, a metodologia ganha coerência interna. O número de participantes deixa de ser um detalhe periférico e passa a ser entendido como parte estrutural do desenho do estudo. Isso fortalece a credibilidade da investigação e melhora a qualidade do relato científico.

Além disso, o modelo formal facilita a avaliação crítica por parte de leitores, revisores e bancas examinadoras. Ao apresentar os parâmetros do cálculo, o pesquisador permite que outros compreendam a lógica utilizada e avaliem sua adequação. Essa transparência é um componente importante do rigor científico.

4.4 O modelo formal não elimina a necessidade de julgamento

Apesar de sua robustez, o modelo formal não transforma a definição amostral em procedimento puramente mecânico. O cálculo depende de escolhas que exigem julgamento metodológico. É preciso decidir qual desfecho principal será priorizado, qual efeito é realmente relevante, qual variabilidade é plausível, qual margem de erro é aceitável e qual taxa de perdas deve ser considerada.

Portanto, o cálculo formal não substitui o raciocínio científico. Ele o organiza. Um cálculo estatístico bem executado, mas baseado em premissas inadequadas, pode gerar um tamanho de amostra aparentemente preciso, mas metodologicamente frágil. Por isso, a qualidade do modelo formal depende tanto da matemática quanto da consistência conceitual que a antecede.

4.5 Transição para os tipos de cálculo dentro do modelo formal

Uma vez compreendida a lógica geral do modelo formal, torna,se possível detalhar seus principais subtipos. Como já visto, o cálculo estatístico da amostra varia conforme o objetivo dominante da pesquisa. Didaticamente, quatro grandes categorias merecem destaque:

cálculo para estimativa,
cálculo para diferença entre grupos,
cálculo para correlação,
cálculo para regressão ou modelagem.

Cada uma dessas modalidades apresenta uma lógica intrínseca e particular. Tendo isso em vista, a próxima seção deste documento será dedicada à análise detalhada de cada uma dessas abordagens.

5. Principais tipos de cálculo dentro do modelo formal

Como visto na seção anterior, o modelo formal de definição do tamanho da amostra não é homogêneo. Ele abriga diferentes modalidades de cálculo, determinadas pelo objetivo analítico principal da pesquisa. Essa distinção é fundamental, porque um estudo voltado para estimar uma prevalência não exige a mesma lógica de um ensaio clínico comparativo, nem de uma investigação correlacional ou de um estudo com regressão.

Do ponto de vista didático, quatro grupos principais merecem destaque:

cálculo para estimativa,
cálculo para diferença entre grupos,
cálculo para correlação,
cálculo para regressão ou modelagem.

5.1 Cálculo para estimativa

O cálculo para estimativa é utilizado quando o objetivo principal do estudo não é comparar grupos nem testar a superioridade de uma intervenção, mas estimar um parâmetro populacional com determinado grau de precisão. Aqui, o foco central está na qualidade da estimativa produzida.

Esse tipo de cálculo é muito comum em estudos transversais e em investigações descritivas. O pesquisador quer saber, por exemplo, qual é a prevalência de hipertensão em uma comunidade, qual é a média de glicemia em determinada população, qual é a sensibilidade de um teste diagnóstico ou qual proporção de indivíduos apresenta determinada característica clínica.

Nessas situações, a pergunta principal não é “há diferença entre A e B?”, mas sim “qual é o valor esperado desse parâmetro na população e com que precisão consigo estimá-lo?”. Por isso, a lógica estatística muda. O centro do raciocínio passa a ser a margem de erro aceitável e a largura do intervalo de confiança ao redor da estimativa.

5.1.1 Elementos centrais do cálculo para estimativa

Em linhas gerais, o cálculo para estimativa costuma depender dos seguintes elementos:

parâmetro a ser estimado, como média, proporção, prevalência ou incidência,
nível de confiança desejado,
margem de erro considerada aceitável,
variabilidade esperada, quando se trata de média,
proporção esperada do evento, quando se trata de prevalência ou proporção.

O princípio é intuitivo. Quanto maior a precisão desejada, maior tende a ser a amostra necessária. Se o pesquisador aceitar margem de erro mais ampla, a amostra pode ser menor. Se deseja um intervalo de confiança mais estreito, precisa aumentar o número (n).

5.1.2 Exemplo prático de cálculo para estimativa

Imagine um estudo transversal cujo objetivo seja estimar a prevalência de úlcera venosa em uma população acompanhada em unidades básicas de saúde. O pesquisador precisa decidir qual margem de erro considera aceitável. Se quiser estimativa muito precisa, a amostra tenderá a crescer. Se aceitar uma faixa mais ampla de incerteza, o tamanho necessário será menor.

Outro exemplo seria um estudo que deseja estimar a média da pressão arterial sistólica em pacientes diabéticos. Nesse caso, a variabilidade esperada da pressão arterial será decisiva. Quanto maior a dispersão das medidas, maior precisará ser a amostra para obter uma média com precisão adequada.

5.1.3 Importância metodológica desse tipo de cálculo

O cálculo para estimativa é particularmente importante porque muitos pesquisadores, equivocadamente, associam cálculo amostral apenas à comparação entre grupos. Isso reduz a compreensão da metodologia quantitativa. Em muitos estudos epidemiológicos e clínicos, o objetivo principal é descritivo ou estimativo, e não comparativo. Nesses casos, o cálculo formal continua sendo necessário, mas sua lógica está centrada na precisão da estimativa, não no poder de detectar diferenças.

Assim, essa modalidade de cálculo reforça uma ideia fundamental, nem todo estudo quantitativo é desenhado para testar hipótese comparativa, e nem todo cálculo de amostra depende diretamente de contraste entre grupos.

5.2 Cálculo para diferença entre grupos

O cálculo para diferença entre grupos é uma das formas mais conhecidas de cálculo amostral. Ele é utilizado quando a pesquisa busca verificar se existe diferença estatisticamente detectável entre dois ou mais grupos, seja em relação a médias, proporções, riscos ou outros desfechos.

Esse tipo de cálculo aparece com frequência em ensaios clínicos, estudos experimentais, coortes comparativas e pesquisas observacionais analíticas. O pesquisador deseja saber, por exemplo, se um tratamento reduz mais a pressão arterial que outro, se a prevalência de um desfecho é diferente entre expostos e não expostos, ou se dois grupos apresentam médias distintas em determinado indicador.

5.2.1 A lógica central do cálculo comparativo

Nesse tipo de cálculo, o ponto decisivo é a diferença mínima de interesse que o estudo pretende detectar. Em outras palavras, o pesquisador precisa definir qual magnitude de diferença entre os grupos seria cientificamente, clinicamente ou praticamente relevante.

Essa decisão é central porque influencia diretamente o tamanho da amostra. Diferenças grandes podem ser detectadas com menor número de participantes. Diferenças pequenas exigem amostras maiores. Isso ocorre porque efeitos discretos são mais difíceis de distinguir do acaso.

Além disso, o cálculo comparativo costuma depender de:

nível de significância,
poder estatístico,
variabilidade da medida, nos desfechos contínuos,
frequência esperada do desfecho, nos desfechos binários,
razão entre grupos, quando os grupos não têm o mesmo tamanho.

5.2.2 Comparação de médias e comparação de proporções

Do ponto de vista didático, dois cenários são especialmente importantes.

O primeiro é a comparação de médias. Ocorre quando o desfecho principal é contínuo, como nível de dor, pressão arterial, índice de massa corporal ou tempo de internação. Aqui, entram em cena a diferença mínima de interesse entre as médias e a variabilidade esperada da medida.

O segundo é a comparação de proporções. Ocorre quando o desfecho é categórico, como presença ou ausência de infecção, cura ou não cura, óbito ou sobrevida, adesão ou não adesão. Nesse contexto, o cálculo depende da proporção esperada em cada grupo e da diferença que se considera relevante detectar.

5.2.3 Exemplo prático de cálculo para diferença entre grupos

Imagine um ensaio clínico em que o pesquisador pretende comparar um novo curativo com o tratamento padrão para cicatrização de feridas. O desfecho pode ser a proporção de cicatrização completa em 12 semanas. O tamanho da amostra dependerá da taxa esperada de cicatrização em cada grupo e da diferença mínima que se deseja identificar com confiança.

Em outro cenário, um estudo pode querer comparar a média de dor entre pacientes submetidos a duas técnicas anestésicas diferentes. Nesse caso, será necessário definir qual diferença média de dor seria relevante e qual é o desvio padrão esperado desta variável.

5.2.4 Relevância clínica e relevância estatística

Um ponto metodológico importante é que a diferença usada no cálculo não deve ser escolhida arbitrariamente. Ela precisa ter relevância científica ou clínica. Não basta selecionar qualquer diferença apenas para facilitar o cálculo. Uma diferença muito grande pode reduzir artificialmente a amostra necessária, mas produzir um estudo incapaz de detectar efeitos clinicamente importantes, porém menores. De modo oposto, definir diferenças muito pequenas pode gerar amostras impraticáveis ou estudos voltados para detectar efeitos irrelevantes.

Por esta razão, o cálculo comparativo requer um equilíbrio cuidadoso e bem ponderado entre a plausibilidade do ponto de vista estatístico e a relevância no que diz respeito ao conteúdo substantivo da questão.

5.3 Cálculo para correlação

O cálculo para correlação é utilizado quando o objetivo principal da pesquisa é avaliar a força e a direção da relação entre variáveis. Aqui, o interesse não está em estimar uma prevalência nem em comparar grupos, mas em examinar se duas medidas variam conjuntamente de modo sistemático.

Esse tipo de cálculo é muito utilizado em estudos observacionais, psicométricos, clínicos e epidemiológicos. O pesquisador pode querer avaliar, por exemplo, a correlação entre índice de massa corporal e glicemia, entre escore de gravidade clínica e qualidade de vida, entre idade e pressão arterial, ou entre dois métodos de mensuração.

5.3.1 Lógica do cálculo correlacional

A lógica do cálculo para correlação depende, em essência, de três elementos:

força da correlação esperada,
nível de significância,
poder estatístico.

O princípio é semelhante ao de outras formas de cálculo formal. Correlações fortes tendem a ser detectadas com amostras menores. Correlações fracas exigem amostras maiores. Isso ocorre porque relações discretas podem se confundir mais facilmente com flutuações aleatórias dos dados.

5.3.2 Exemplo prático de cálculo para correlação

Imagine uma pesquisa com pacientes vasculares cujo objetivo seja avaliar a correlação entre escore funcional de membros inferiores e qualidade de vida. Se o pesquisador espera relação apenas moderada ou fraca, a amostra precisará ser suficientemente ampla para detectar essa associação com segurança estatística. Se superestimar a força da correlação esperada, corre o risco de subdimensionar o estudo.

5.3.3 Limite importante

É importante distinguir cálculo para correlação de simples análise exploratória entre variáveis. Se a correlação constitui o objetivo principal do estudo, ela deve orientar formalmente o cálculo amostral. Se for apenas análise secundária, o cálculo pode estar baseado em outro desfecho principal. Essa distinção precisa ficar clara no desenho metodológico.

5.4 Cálculo para regressão ou modelagem

O cálculo para regressão ou modelagem é utilizado quando o objetivo principal da pesquisa é construir um modelo explicativo, associativo ou preditivo, envolvendo uma ou mais variáveis independentes e um desfecho de interesse.

Esse cenário é muito comum em epidemiologia, clínica, ciências sociais aplicadas e pesquisa em serviços de saúde. O pesquisador pode desejar identificar fatores associados à úlcera venosa, prever risco de complicações cirúrgicas, modelar determinantes de adesão ao tratamento ou estimar o efeito ajustado de múltiplas variáveis sobre um desfecho.

5.4.1 Complexidade maior desse tipo de cálculo

O cálculo amostral para regressão costuma ser mais complexo do que nos casos anteriores, porque não depende apenas do desfecho e do efeito esperado. Ele também sofre influência de:

número de variáveis preditoras,
frequência do desfecho, especialmente em regressão logística,
magnitude esperada das associações,
estrutura do modelo,
risco de sobreajuste,
estabilidade das estimativas.

Por isso, em muitos contextos, além de fórmulas formais, o pesquisador recorre a regras práticas complementares, como relações mínimas entre número de eventos e número de variáveis do modelo. Essas regras não substituem totalmente o raciocínio estatístico, mas ajudam a evitar modelos excessivamente ambiciosos para a quantidade de dados disponível.

5.4.2 Exemplo prático de cálculo para regressão

Imagine um estudo que pretende identificar fatores associados à ocorrência de pé diabético complicado. O pesquisador deseja incluir idade, sexo, tempo de diabetes, controle glicêmico, presença de neuropatia, tabagismo e doença arterial periférica em um modelo de regressão logística. Nesse cenário, não basta conhecer o número total de participantes. É necessário avaliar quantos eventos do desfecho ocorrerão, porque modelos logísticos dependem fortemente da quantidade de casos com o evento de interesse.

Se o número de variáveis for alto e o número de eventos for baixo, o modelo tende a ficar instável. Isso pode gerar coeficientes imprecisos, intervalos de confiança muito amplos e baixa capacidade preditiva.

5.4.3 Valor metodológico desse tipo de cálculo

O cálculo para regressão ensina ao pesquisador uma lição importante, nem sempre o número total de participantes é a melhor medida da suficiência amostral. Em alguns estudos, o que realmente limita a análise é o número de eventos, a complexidade do modelo e a relação entre variáveis e observações. Isso exige planejamento cuidadoso e forte coerência entre ambição analítica e viabilidade amostral.

Fechamento de transição

Os quatro subtipos apresentados mostram que o modelo formal de definição do tamanho da amostra é um conjunto articulado de estratégias, e não uma fórmula única. O cálculo adequado depende da finalidade central da pesquisa. Estudos voltados para estimativa precisam de precisão. Estudos voltados para comparação entre grupos precisam de poder para detectar diferenças relevantes. Estudos de correlação dependem da força esperada da associação. Estudos com regressão exigem atenção à complexidade do modelo e à estabilidade das estimativas.

Essa compreensão evita um erro frequente, usar qualquer cálculo amostral apenas para “preencher a metodologia”, sem alinhamento com o verdadeiro objetivo do estudo.

O próximo passo é examinar o modelo pragmático de definição do tamanho da amostra, mostrando como ele funciona, em que situações aparece e quais são seus limites.

6. Modelo pragmático de definição do tamanho da amostra

Embora o modelo formal seja a estratégia metodologicamente mais robusta para definir o tamanho da amostra, a prática científica mostra que nem toda pesquisa quantitativa consegue operar integralmente com essa lógica. Em muitas situações, o pesquisador trabalha com restrições concretas de tempo, acesso, financiamento, raridade do fenômeno, disponibilidade de registros ou estrutura institucional. É nesse contexto que surge o modelo pragmático de definição do tamanho da amostra.

No modelo pragmático, o número de observações não decorre prioritariamente de um cálculo estatístico construído a partir da hipótese ou do parâmetro de interesse. Em vez disso, ele é estabelecido com base em condições reais de viabilidade. Isso não significa, necessariamente, ausência de rigor. Significa que a justificativa do n nasce de outra lógica, mais operacional do que inferencial.

Esse ponto é importante porque muitos trabalhos utilizam amostras definidas pragmaticamente, mas não reconhecem isso de forma clara. Em vez de explicitar a limitação ou a estratégia adotada, usam linguagem vaga e produzem uma aparência de formalidade metodológica que o estudo, de fato, não possui. Do ponto de vista científico, é preferível assumir uma justificativa pragmática coerente do que simular um cálculo formal inexistente.

6.1 O que caracteriza o modelo pragmático

O modelo pragmático pode ser entendido como aquele em que o tamanho da amostra é definido por um dos seguintes caminhos:

viabilidade operacional,
disponibilidade de participantes ou registros,
uso de todos os casos elegíveis em um período,
banco de dados secundário já existente,
estudo piloto,
referência em estudos semelhantes.

Nessas situações, a pergunta principal deixa de ser “qual é o n ideal calculado estatisticamente?” e passa a ser “qual é o n possível, justificável e metodologicamente aproveitável neste contexto específico?”.

6.2 Principais formas do modelo pragmático

6.2.1 Amostra por viabilidade operacional

Essa é uma das formas mais comuns. O pesquisador define a amostra com base no número de participantes que consegue recrutar durante certo período, dentro dos recursos humanos, financeiros e logísticos disponíveis.

Exemplo, um estudo em ambulatório universitário pode incluir todos os pacientes elegíveis atendidos entre março e agosto. O número final não resulta de cálculo formal, mas da capacidade real de inclusão durante aquele intervalo.

Esse modelo é frequente em pesquisas acadêmicas de graduação, residência, especialização e em muitos estudos institucionais.

6.2.2 Inclusão de todos os casos disponíveis

Outra forma importante do modelo pragmático é a inclusão de todos os casos elegíveis. Aqui, o pesquisador não seleciona uma amostra a partir de universo maior, mas utiliza integralmente o conjunto de casos acessíveis dentro de um critério temporal ou institucional.

Exemplo, um estudo retrospectivo pode incluir todos os pacientes submetidos a determinado procedimento cirúrgico em um hospital entre 2021 e 2025. Nesse caso, o tamanho da amostra é dado pela realidade do serviço, e não por cálculo prévio.

Essa estratégia é muito comum em séries históricas, estudos retrospectivos e análises institucionais.

6.2.3 Uso de banco de dados secundário

Em pesquisas baseadas em bancos de dados já existentes, o tamanho da amostra muitas vezes é determinado pela própria base. O pesquisador trabalha com o conjunto de registros disponíveis que atendem aos critérios de elegibilidade.

Exemplo, um estudo pode utilizar todos os prontuários com diagnóstico de trombose venosa profunda registrados em um sistema hospitalar nos últimos cinco anos. O n final decorre da base acessível.

Nesses casos, o foco metodológico geralmente se desloca da pergunta “quantos participantes preciso?” para a pergunta “quantos registros válidos e utilizáveis tenho?”. Ainda assim, isso não dispensa análise crítica sobre suficiência, perdas de dados e limitações inferenciais.

6.2.4 Estudo piloto

O estudo piloto também costuma operar com lógica pragmática. Seu objetivo principal não é produzir inferência definitiva sobre a população, mas testar instrumentos, procedimentos, logística, adesão, aceitabilidade ou viabilidade do projeto principal.

Por isso, a amostra do piloto costuma ser definida por conveniência planejada, e não por cálculo voltado à hipótese principal. O importante é que o pesquisador deixe claro que se trata de um piloto e não de um estudo confirmatório.

6.2.5 Similaridade com estudos anteriores

Outra forma bastante difundida é utilizar como referência o tamanho da amostra de pesquisas semelhantes. O pesquisador observa que estudos sobre tema próximo trabalharam com determinado n e decide adotar número parecido.

Essa prática é comum, mas precisa ser manejada com cuidado. Ela pode servir como orientação inicial, mas não deve ser automaticamente tratada como equivalente a cálculo formal. Esse ponto será aprofundado na próxima seção.

6.3 Vantagens do modelo pragmático

O modelo pragmático tem algumas vantagens práticas importantes.

Viabiliza pesquisas reais, especialmente em cenários com limitação de recursos.
Permite aproveitar bases já existentes, o que reduz custo e tempo.
É adequado para estudos preliminares, exploratórios e pilotos.
Facilita a pesquisa em contextos de raridade, quando não há como ampliar artificialmente o número de casos.
Reflete honestamente a realidade de muitos serviços e instituições.

Essas vantagens mostram que o modelo pragmático não deve ser tratado como erro metodológico automático. Ele é, muitas vezes, uma resposta legítima a contextos reais de pesquisa.

6.4 Limitações do modelo pragmático

Apesar de sua utilidade, o modelo pragmático tem limites evidentes.

Pode gerar amostras insuficientes para detectar efeitos reais.
Pode produzir estimativas imprecisas, com intervalos de confiança amplos.
Pode reduzir a robustez de comparações entre grupos.
Pode comprometer modelos multivariados, especialmente quando há poucos eventos.
Pode ampliar o risco de viés de seleção, dependendo da forma de inclusão dos casos.
Pode fragilizar a generalização dos resultados.

Essas limitações não invalidam automaticamente o estudo, mas exigem cautela na interpretação e transparência na redação metodológica.

6.5 O ponto metodológico central

O principal critério de qualidade no modelo pragmático é a honestidade metodológica. O pesquisador precisa declarar com clareza:

por que a amostra foi definida pragmaticamente,
qual foi a lógica adotada,
quais são os limites dessa escolha,
como isso afeta a interpretação dos resultados.

Em termos científicos, uma justificativa pragmática bem apresentada é mais respeitável do que um cálculo formal mal compreendido ou artificialmente anexado ao estudo apenas para dar aparência de sofisticação.

7. O uso da similaridade com estudos anteriores

Entre todas as formas do modelo pragmático, a similaridade com estudos anteriores merece atenção especial, porque é extremamente frequente e, ao mesmo tempo, frequentemente mal utilizada. Muitos pesquisadores observam que trabalhos parecidos com o seu incluíram determinado número de participantes e concluem que podem usar o mesmo n.

À primeira vista, essa prática parece razoável. Se estudos semelhantes utilizaram 120 participantes, por que não repetir esse número? O problema é que a semelhança aparente nem sempre significa equivalência metodológica verdadeira. Dois estudos podem tratar do mesmo tema geral, mas difere em aspectos decisivos:

desfecho principal,
variabilidade da medida,
frequência do evento,
efeito esperado,
número de grupos,
tipo de análise estatística,
perfil da população,
perdas previstas.

Por isso, o uso de estudos anteriores pode ocorrer em dois níveis muito diferentes.

7.1 Uso fraco da similaridade

O uso fraco da similaridade ocorre quando o pesquisador simplesmente reproduz o número de participantes de outro estudo porque ele parece parecido com o seu.

Exemplo, um artigo sobre qualidade de vida em pacientes com insuficiência venosa crônica utilizou 150 participantes, e o novo estudo decide adotar o mesmo n apenas por essa razão.

Esse uso é metodologicamente frágil. Ele pode ser aceito, em certos contextos, como justificativa preliminar ou pragmática, mas não equivale a cálculo formal. O risco é copiar um número sem saber se ele é adequado ao novo objetivo do estudo.

7.2 Uso forte da similaridade

O uso forte da similaridade é mais sofisticado e metodologicamente muito mais defensável. Aqui, o pesquisador não copia o n do estudo anterior. Ele usa o estudo prévio para obter parâmetros que alimentam o cálculo formal.

Por exemplo, estudos anteriores podem fornecer:

prevalência esperada do desfecho,
desvio padrão de uma variável contínua,
diferença média plausível entre grupos,
proporções esperadas em cada grupo,
coeficiente de correlação esperado,
taxa de perdas ou recusas,
frequência do evento em regressão logística.

Nesse caso, a literatura anterior deixa de ser fonte para copiar o número final e passa a ser fonte para estimar os parâmetros do cálculo formal. Essa é uma forma muito superior de usar a similaridade.

7.3 Quando a similaridade ajuda de verdade

O uso de estudos anteriores pode ser útil em pelo menos quatro situações:

quando faltam dados locais para estimar parâmetros,
quando o estudo é pioneiro no próprio serviço,
quando se quer testar a plausibilidade de um cálculo formal,
quando se deseja comparar se o n planejado está em faixa coerente com a literatura.

Nesses casos, a literatura funciona como referência de calibração, e não como substituto automático do raciocínio metodológico.

7.4 Risco de copiar o n sem crítica

Copiar o número de outro artigo sem análise crítica pode gerar dois tipos de erro.

Subdimensionamento, quando o novo estudo precisaria de amostra maior, mas herda um n pequeno de pesquisa anterior.
Superdimensionamento, quando o pesquisador adota um número muito alto sem necessidade real, apenas porque outro trabalho o utilizou.

Ambos os erros decorrem do mesmo problema, a ausência de alinhamento entre o tamanho da amostra e o objetivo analítico específico do novo estudo.

7.5 Síntese metodológica desta seção

Em termos didáticos, vale fixar a seguinte regra:

copiar o n de outro estudo é justificativa fraca,
usar estudos anteriores para obter parâmetros do cálculo é justificativa forte.

Essa distinção é extremamente útil para ensinar metodologia de forma madura. Ela preserva a relevância da literatura prévia, mas impede que a semelhança superficial seja tratada como substituta do cálculo formal.

Fechamento de transição

Compreendidos o modelo pragmático e o papel da similaridade com estudos anteriores, o capítulo pode avançar para um ponto igualmente importante, os fatores adicionais que modificam o tamanho da amostra. Isso é necessário porque, mesmo quando o cálculo ou a justificativa básica parecem corretos, diversos elementos ainda podem ampliar ou reduzir o n necessário.

8. Fatores adicionais que modificam o tamanho da amostra

Mesmo quando o pesquisador escolhe corretamente entre o modelo formal e o modelo pragmático, ou quando define de modo adequado o tipo de cálculo dentro do modelo formal, a determinação final do tamanho da amostra ainda pode sofrer influência de vários fatores adicionais. Esses fatores funcionam como modificadores do n inicialmente pensado e, em muitos casos, são decisivos para evitar erros de planejamento.

Ignorá,los é um problema comum. Muitos estudos apresentam um cálculo aparentemente correto, mas esquecem de considerar perdas, subgrupos, raridade do desfecho ou a complexidade da análise. O resultado é um projeto com aparência metodológica adequada, porém com risco concreto de insuficiência prática.

8.1 Perdas e recusas

Um dos fatores mais importantes é a possibilidade de perdas e recusas. Em praticamente toda pesquisa com seres humanos existe o risco de que parte dos participantes elegíveis não aceite participar, abandone o estudo, apresente dados incompletos ou precise ser excluída posteriormente.

Por isso, o tamanho da amostra calculado ou inicialmente planejado raramente deve ser entendido como o número exato a recrutar. Em geral, é necessário acrescentar uma margem de segurança para compensar essas perdas previsíveis. Quanto maior a chance de evasão, seguimento incompleto ou falha na coleta, maior deve ser o ajuste.

Esse ponto é especialmente importante em estudos longitudinais, coortes, ensaios clínicos e pesquisas com acompanhamento prolongado.

8.2 Correção para população finita

Quando a população de interesse é muito grande, a maior parte dos cálculos pode ser feita sem preocupação prática com seu tamanho total. No entanto, quando o universo é pequeno e conhecido, pode ser necessário aplicar correção para população finita.

Isso ocorre, por exemplo, em estudos realizados com todos os alunos de uma turma, todos os profissionais de um setor, todos os residentes de um programa ou todos os pacientes cadastrados em um serviço específico. Nesses casos, a proporção entre amostra e população total deixa de ser desprezível, e o cálculo precisa ser ajustado.

Esse fator é particularmente relevante em pesquisas institucionais e acadêmicas locais.

8.3 Efeito do desenho amostral

Nem toda pesquisa quantitativa trabalha com amostragem aleatória simples. Algumas utilizam conglomerados, múltiplos estágios ou outras estratégias complexas de seleção. Nesses cenários, entra em cena o chamado efeito do desenho, que pode aumentar a necessidade amostral.

A razão é simples. Em amostras complexas, indivíduos do mesmo conglomerado tendem a se parecer mais entre si do que indivíduos escolhidos aleatoriamente em toda a população. Isso reduz a variabilidade efetiva da amostra e pode exigir ampliação do n para manter a precisão desejada.

Ignorar esse fator em inquéritos populacionais, estudos escolares, pesquisas multicêntricas ou levantamentos por unidades agregadas pode gerar subestimação do tamanho amostral.

8.4 Número de grupos comparados

Quando a pesquisa compara mais de dois grupos, o planejamento amostral pode se tornar mais exigente. Em alguns casos, o aumento do número de grupos demanda ampliação do total de participantes para preservar o poder estatístico das comparações relevantes.

Além disso, nem sempre basta saber quantos participantes serão incluídos no total. É preciso considerar também como eles serão distribuídos entre os grupos, e se essa distribuição será equilibrada ou não. Razões muito desiguais entre os grupos podem reduzir a eficiência estatística.

8.5 Raridade do desfecho

A raridade do desfecho é outro fator decisivo. Quando o evento de interesse é raro, o pesquisador pode precisar de amostras muito maiores para obter número suficiente de casos.

Isso é particularmente importante em estudos prognósticos, regressões logísticas, eventos adversos, desfechos graves e doenças pouco frequentes. Em algumas situações, o tamanho total da amostra parece grande, mas o número de eventos efetivos é pequeno demais para sustentar a análise planejada.

Esse problema ensina uma lição importante, em muitos estudos, especialmente os analíticos, o que realmente importa não é apenas o número total de participantes, mas a quantidade de ocorrências do desfecho principal.

8.6 Análises ajustadas e multivariadas

Quando o estudo prevê análises multivariadas, o tamanho da amostra precisa ser pensado de forma mais cautelosa. Modelos com múltiplos preditores exigem volume de dados suficiente para gerar estimativas estáveis.

Quanto maior o número de variáveis no modelo, maior tende a ser a exigência amostral. Se essa relação não for respeitada, o pesquisador corre o risco de construir modelos instáveis, com sobreajuste, coeficientes imprecisos e baixo valor preditivo.

Esse ponto é especialmente relevante em regressão logística, regressão linear múltipla, modelos de sobrevivência e validação de modelos preditivos.

8.7 Subgrupos de interesse

Muitas pesquisas não pretendem apenas analisar o total da amostra. Elas desejam comparar subgrupos, como homens e mulheres, jovens e idosos, expostos e não expostos, tipos diferentes de tratamento ou faixas clínicas distintas.

Quando essa intenção existe desde o início, ela precisa entrar no planejamento amostral. Uma amostra que parece suficiente para a análise global pode se tornar pequena demais quando dividida em subgrupos. Isso reduz a precisão e o poder estatístico.

Por isso, análises de subgrupos não devem ser tratadas como detalhe posterior. Se são parte importante do objetivo do estudo, devem influenciar a definição do n desde o planejamento.

8.8 Estudos de validação e testes diagnósticos

Pesquisas de validação de instrumentos, acurácia diagnóstica e desempenho de testes também podem exigir raciocínio amostral específico. Nesses estudos, o cálculo pode depender da sensibilidade, especificidade, prevalência da condição, erro aceitável e objetivo principal da validação.

Mais uma vez, isso reforça a ideia de que o cálculo da amostra não pode ser improvisado. Ele precisa acompanhar a natureza metodológica do estudo.

8.9 Síntese desta seção

Os fatores adicionais apresentados mostram que o tamanho da amostra não é definido apenas por uma fórmula inicial ou por uma escolha pragmática simples. Ele pode ser ampliado, corrigido ou reinterpretado conforme:

perdas previstas,
tamanho da população,
estrutura da amostragem,
raridade do evento,
complexidade da análise,
interesse em subgrupos,
características específicas do desenho.

Em outras palavras, o cálculo ou a justificativa inicial do n é apenas o começo. O planejamento amostral maduro exige refinamento.

9. Erros frequentes na definição do tamanho da amostra

Se a definição do tamanho da amostra é uma etapa central da pesquisa quantitativa, ela também é um dos pontos em que mais ocorrem erros metodológicos. Muitos desses erros não surgem por má fé, mas por simplificação excessiva, uso mecânico de ferramentas estatísticas ou repetição de hábitos mal fundamentados.

Conhecer esses erros é importante porque ajuda o pesquisador a evitá-los e melhora sua capacidade de leitura crítica de artigos, dissertações, teses e projetos.

9.1 Escolher o n por tradição ou costume da área

Um erro muito comum é selecionar o tamanho da amostra com base em frases como:

“nessa área os estudos costumam ter cerca de 100 pacientes”,
“geralmente trabalhos assim usam 30 por grupo”,
“esse número costuma ser aceito”.

Esse raciocínio é frágil. O fato de determinado número ser habitual em uma área não significa que ele seja adequado para o objetivo específico do novo estudo. O tamanho da amostra precisa ser coerente com a pergunta de pesquisa, e não apenas com a cultura informal do campo.

9.2 Copiar o n de outro artigo sem crítica

Outro erro frequente é copiar diretamente o número de participantes de um estudo anterior. Como já discutido, isso representa um uso fraco da similaridade. Dois estudos podem parecer parecidos e, ainda assim, exigir tamanhos amostrais diferentes. O problema não está em consultar a literatura anterior, mas em substituir o raciocínio metodológico pela simples reprodução de um número.

9.3 Não declarar os parâmetros usados no cálculo

Em muitos textos científicos, o autor afirma que “o tamanho da amostra foi calculado”, mas não informa:

qual foi o desfecho principal,
qual valor de alfa foi usado,
qual poder foi adotado,
qual efeito esperado foi considerado,
qual margem de erro foi definida,
se houve correção para perdas.

Sem esses parâmetros, o cálculo não pode ser avaliado criticamente. A justificativa fica opaca e metodologicamente pobre.

9.4 Ignorar perdas e recusas

Um cálculo amostral pode estar teoricamente correto e ainda assim falhar na prática se o pesquisador esquecer de adicionar margem para perdas. Esse erro é particularmente grave em estudos com seguimento, intervenções, populações vulneráveis ou coleta complexa.

Sem esse ajuste, o estudo pode terminar com número efetivo menor do que o necessário, comprometendo poder e precisão.

9.5 Confundir significância estatística com relevância clínica ou científica

Na definição do tamanho da amostra, especialmente em estudos comparativos, o pesquisador precisa escolher a diferença mínima de interesse. Um erro importante é selecionar diferenças estatisticamente detectáveis, mas sem relevância clínica, prática ou científica.

O resultado pode ser um estudo desenhado para encontrar diferenças pequenas demais para importar de verdade. Isso leva a uma pesquisa tecnicamente correta na estatística, mas pobre em sentido científico.

9.6 Superdimensionar a amostra sem necessidade

Existe a falsa ideia de que amostra maior é sempre melhor. Não é. Superdimensionar um estudo pode desperdiçar recursos, tempo e esforço, além de favorecer a detecção de diferenças muito pequenas, sem importância prática.

Em pesquisa com seres humanos, esse problema ganha também dimensão ética. Recrutar mais participantes do que o necessário, especialmente em contextos de risco, custo ou incômodo, não é uma decisão neutra.

9.7 Usar amostra de conveniência e apresentá,la como se fosse cálculo formal

Esse é um erro metodológico e redacional. O pesquisador trabalha com os casos disponíveis, por conveniência, mas descreve a amostra de forma vaga, sugerindo que houve definição estatística robusta.

A melhor conduta é declarar claramente a natureza pragmática da amostra, reconhecer seus limites e interpretar os resultados de forma coerente com essa escolha.

9.8 Não alinhar a amostra com o objetivo principal do estudo

Às vezes o pesquisador calcula a amostra com base em um parâmetro, mas o desfecho principal real do estudo é outro. Exemplo, calcula o n para estimar prevalência, mas o objetivo principal da análise é comparar grupos. Ou calcula para comparação simples, mas o foco final do artigo é regressão multivariada complexa.

Esse desalinhamento compromete a coerência interna da metodologia.

9.9 Tratar o cálculo como ritual e não como raciocínio

Talvez o erro mais profundo seja transformar o cálculo amostral em formalidade burocrática. O pesquisador insere números em um software, obtém um n e o inclui no método, mas não compreende a lógica do que fez. Quando isso acontece, o cálculo deixa de ser instrumento de planejamento e vira ornamento metodológico. O capítulo inteiro que estamos construindo procura justamente combater essa prática.

Fechamento de transição

Com a base conceitual sobre fatores que modificam o tamanho da amostra e erros de definição estabelecida, o próximo passo é abordar a justificação do tamanho amostral na redação do método, com exemplos práticos.

10. Como justificar o tamanho da amostra no método

Uma das maiores dificuldades dos pesquisadores não está apenas em definir o tamanho da amostra, mas em justificá,lo adequadamente na redação metodológica. Em muitos trabalhos, a decisão amostral até poderia ser aceitável, mas é mal descrita. Em outros, o texto usa linguagem genérica, sem deixar claro se houve cálculo formal, definição pragmática ou combinação de estratégias.

Uma boa justificativa metodológica deve responder, de modo claro, a quatro perguntas:

qual foi a lógica usada para definir a amostra,
quais parâmetros ou critérios foram considerados,
qual foi o número final planejado,
como esse número se relaciona com o objetivo principal do estudo.

Em termos práticos, o ideal é que o leitor consiga entender não apenas quantos participantes foram incluídos, mas por que esse número foi escolhido.

10.1 Quando houve cálculo formal para estimativa

Quando o estudo utiliza cálculo formal voltado para estimativa, a redação deve informar:

o parâmetro a ser estimado,
o nível de confiança adotado,
a margem de erro desejada,
a proporção ou variabilidade esperada,
eventual acréscimo para perdas.

Um modelo de redação possível seria:

“O tamanho da amostra foi calculado para estimar a prevalência de hipertensão arterial na população estudada, considerando nível de confiança de 95%, margem de erro de 5% e prevalência esperada de 30%, com acréscimo de 10% para perdas e recusas.”

Esse tipo de descrição permite ao leitor compreender a lógica da estimativa e avaliar se os parâmetros foram plausíveis.

10.2 Quando houve cálculo formal para comparação entre grupos

Nos estudos comparativos, a justificativa precisa indicar:

qual foi o desfecho principal,
qual diferença mínima de interesse foi considerada,
qual nível de significância foi adotado,
qual poder estatístico foi definido,
qual variabilidade ou proporções esperadas foram utilizadas,
se houve ajuste para perdas.

Um exemplo de redação seria:

“O tamanho da amostra foi calculado para detectar diferença mínima de 15 pontos no escore de dor entre os grupos, considerando desvio padrão de 25 pontos, poder de 80%, nível de significância de 5% e acréscimo de 15% para perdas.”

Se o desfecho for binário, a formulação pode usar proporções esperadas em cada grupo.

10.3 Quando houve cálculo formal para correlação

Quando o objetivo principal é avaliar correlação, o texto deve deixar explícito:

qual associação se pretendeu avaliar,
qual coeficiente de correlação esperado foi considerado,
qual poder foi adotado,
qual alfa foi utilizado.

Exemplo:

“O tamanho da amostra foi estimado para detectar correlação mínima de 0,30 entre o escore funcional e a qualidade de vida, com poder de 80% e nível de significância de 5%.”

Essa redação é breve, mas metodologicamente suficiente, desde que reflita com fidelidade o cálculo realizado.

10.4 Quando houve cálculo formal para regressão

Nos estudos com regressão, a justificativa metodológica costuma ser mais delicada. O pesquisador deve indicar:

qual modelo será utilizado,
qual é o desfecho principal,
quantas variáveis independentes pretende incluir,
qual frequência esperada do evento foi considerada, se aplicável,
qual critério orientou a suficiência amostral.

Uma redação possível seria:

“O tamanho da amostra foi planejado para análise por regressão logística, considerando a frequência esperada do desfecho e o número de variáveis independentes previstas no modelo, de modo a assegurar estabilidade das estimativas.”

Em alguns casos, quando se utilizam regras práticas complementares, isso deve ser explicitado com honestidade.

10.5 Quando a amostra foi definida pragmaticamente

Se a pesquisa não utilizou um cálculo formal para a determinação do tamanho da amostra, isso também pode e deve ser redigido na metodologia do trabalho de forma tecnicamente correta e transparente. O ponto crucial é garantir que não haja qualquer tentativa de mascarar a realidade metodológica empregada no estudo, apresentando fielmente a abordagem utilizada.

a) Todos os casos disponíveis – “Foram incluídos todos os pacientes elegíveis atendidos no serviço entre janeiro de 2023 e dezembro de 2025, totalizando 184 casos.”

b) Banco de dados secundário – “O estudo utilizou todos os registros disponíveis no banco institucional referentes ao período de 2020 a 2024 que atenderam aos critérios de elegibilidade.”

c) Amostra por viabilidade – “A amostra foi definida por viabilidade operacional, incluindo os participantes elegíveis recrutados durante o período de coleta previsto no projeto.”

d) Estudo piloto – “Por se tratar de estudo piloto, a amostra foi definida com base na viabilidade de aplicação dos instrumentos e na avaliação dos procedimentos de coleta.”

10.6 Quando foram usados estudos anteriores como referência

Se a literatura prévia foi usada apenas como apoio pragmático, isso deve ser dito com precisão. Exemplo:

“O número de participantes foi definido com base em estudos prévios sobre a mesma temática, que utilizaram amostras de magnitude semelhante.”

Contudo, se os estudos anteriores foram usados para alimentar o cálculo formal, a redação deve refletir esse uso mais robusto:

“O cálculo amostral utilizou como referência a prevalência esperada observada em estudo anterior conduzido em população semelhante.”

Essa diferença é muito importante, porque separa o uso fraco da similaridade do uso forte e metodologicamente mais adequado.

10.7 Regra prática para uma boa redação metodológica

Uma regra simples ajuda bastante: não basta informar o número final, é preciso informar a lógica que produziu esse número.

Quanto mais claro for esse caminho, maior a qualidade metodológica do texto.

11. Exemplos práticos de aplicação

Para consolidar o conteúdo do capítulo, vale apresentar alguns exemplos sintéticos de aplicação dos diferentes modelos e subtipos de definição amostral.

11.1 Exemplo de cálculo para estimativa

Imagine um estudo transversal que deseja estimar a prevalência de hipertensão arterial em adultos acompanhados por unidades básicas de saúde de um município.

O objetivo principal não é comparar grupos, mas obter uma estimativa confiável da prevalência. Nesse caso, o cálculo amostral deve ser orientado pela precisão da estimativa, considerando:

prevalência esperada,
margem de erro aceitável,
nível de confiança,
possível acréscimo para perdas.

Aqui, o modelo formal é do tipo estimativa.

11.2 Exemplo de cálculo para diferença entre grupos

Agora imagine um ensaio clínico que compara dois tipos de curativo em pacientes com feridas crônicas. O desfecho principal é a proporção de cicatrização completa após 12 semanas.

Nesse caso, o objetivo é identificar se existe diferença entre os grupos. O cálculo dependerá de:

proporção esperada de cicatrização em cada grupo,
diferença mínima de interesse,
alfa,
poder,
perdas previstas.

Aqui, o modelo formal é do tipo diferença entre grupos.

11.3 Exemplo de cálculo para correlação

Considere um estudo que pretende avaliar a relação entre índice de massa corporal e pressão arterial sistólica em adultos jovens.

O foco não é estimar prevalência nem comparar tratamento, mas examinar a força da associação entre duas variáveis quantitativas. O cálculo da amostra será baseado na correlação esperada, no alfa e no poder.

Aqui, o modelo formal é do tipo correlação.

11.4 Exemplo de cálculo para regressão

Suponha um estudo sobre fatores associados à ocorrência de úlcera venosa recidivante. O pesquisador deseja ajustar modelo com idade, sexo, obesidade, tempo de doença, mobilidade reduzida e adesão ao tratamento compressivo.

Nesse caso, a preocupação não se limita ao número total de participantes. É necessário considerar:

número de variáveis do modelo,
frequência do desfecho,
estabilidade das estimativas,
risco de sobreajuste.

Aqui, o modelo formal é do tipo regressão ou modelagem.

11.5 Exemplo de modelo pragmático por todos os casos disponíveis

Agora imagine um estudo retrospectivo sobre aneurisma de aorta abdominal em um hospital de referência. O serviço possui 126 casos registrados nos últimos seis anos, e o pesquisador decide incluir todos os pacientes elegíveis.

Nesse cenário, o tamanho da amostra não foi definido por cálculo estatístico prévio, mas pela disponibilidade integral dos casos. Trata-se de modelo pragmático, com inclusão de todos os registros elegíveis.

11.6 Exemplo de modelo pragmático com base em banco secundário

Considere uma pesquisa que usa base administrativa do SUS para analisar internações por pé diabético em determinado estado ao longo de cinco anos.

O número de observações decorre dos registros existentes na base, após aplicação dos critérios de seleção. Mais uma vez, trata-se de modelo pragmático, agora baseado em banco secundário.

11.7 Exemplo de uso fraco e uso forte da similaridade

Uso fraco

O pesquisador encontra um artigo semelhante com 200 participantes e decide usar o mesmo número, sem maior análise crítica.

Uso forte

O pesquisador consulta artigos semelhantes para identificar a prevalência esperada, o desvio padrão ou a diferença plausível entre grupos, e utiliza esses parâmetros no cálculo formal.

Esse contraste resume muito bem uma das ideias mais importantes do capítulo.

12. Considerações finais

O tamanho da amostra é uma das decisões metodológicas mais sensíveis da pesquisa quantitativa. Longe de ser um detalhe técnico ou um número definido por conveniência, ele interfere diretamente na capacidade do estudo de estimar parâmetros com precisão, detectar diferenças relevantes, identificar associações verdadeiras e construir modelos analíticos estáveis.

Ao longo deste capítulo, vimos que a definição amostral pode ser organizada em dois grandes modelos. O primeiro é o modelo formal, baseado em cálculo estatístico. O segundo é o modelo pragmático, baseado em viabilidade, disponibilidade de casos, bancos de dados existentes ou referência em estudos anteriores. Essa divisão tem grande valor didático porque ajuda o pesquisador a distinguir justificativas mais robustas de justificativas contextuais, sem confundir níveis diferentes de fundamentação metodológica.

Também foi destacado que, dentro do modelo formal, não existe um único tipo de cálculo. O raciocínio amostral varia conforme o objetivo principal da pesquisa. Pode ser voltado para estimativa, quando se deseja estimar prevalências, proporções ou médias com precisão adequada. Pode ser voltado para diferença entre grupos, quando o objetivo é comparar intervenções, exposições ou condições clínicas. Pode ainda ser orientado para correlação, quando se deseja avaliar a força de associação entre variáveis, ou para regressão, quando se pretende construir modelos explicativos ou preditivos.

Essa organização é importante porque impede uma simplificação frequente, a ideia de que todo cálculo amostral é, no fundo, o mesmo. Não é. O cálculo só faz sentido quando está alinhado ao desfecho principal, ao tipo de análise e à pergunta científica do estudo. Quando esse alinhamento não existe, o cálculo perde valor metodológico e se transforma em formalidade vazia.

O capítulo também mostrou que o uso de estudos anteriores pode ter dois níveis muito distintos. Copiar o número de participantes de outro artigo é uma justificativa fraca. Já utilizar a literatura anterior para obter parâmetros que alimentem o cálculo formal representa uma estratégia muito mais sólida. Essa distinção, aparentemente simples, melhora bastante a qualidade do raciocínio metodológico.

Outro ponto essencial foi a discussão dos fatores adicionais que modificam o tamanho da amostra, como perdas, recusas, população finita, desenho amostral, raridade do desfecho, complexidade das análises e interesse por subgrupos. Esses elementos mostram que a definição amostral não termina na primeira conta. Ela exige refinamento e julgamento científico.

Por fim, a principal mensagem deste capítulo pode ser resumida assim: o tamanho da amostra deve ser coerente com o objetivo do estudo, com o método analítico escolhido e com a realidade concreta da pesquisa. Sempre que possível, o cálculo formal deve ser a referência preferencial. Quando isso não for viável, o uso de justificativas pragmáticas precisa ser assumido com clareza, honestidade e senso crítico.

Em termos práticos, a boa pesquisa quantitativa não escolhe o n por hábito, tradição ou aparência de rigor. Ela constrói esse número como parte integrante da lógica científica do estudo.

Fontes comentadas

1. Martínez-Mesa J, González-Chica DA, Duquia RP, Bonamigo RR, Bastos JL. Sample size, how many participants do I need in my research? An Bras Dermatol. 2014;89(4):609-615.

Comentário:
Excelente texto introdutório. É uma das melhores referências para explicar, em linguagem didática, por que o tamanho da amostra interfere na validade do estudo e por que não existe um único número “ideal” para toda pesquisa. Ajuda muito na parte conceitual do capítulo. (PubMed)

URL:
https://pubmed.ncbi.nlm.nih.gov/25054748/
https://doi.org/10.1590/abd1806-4841.20143705

2. Miot HA. Sample size in clinical and experimental trials. J Vasc Bras. 2011;10(4):275-278.

Comentário:
Fonte muito útil para apresentar a lógica prática do cálculo amostral em estudos clínicos e experimentais. É particularmente boa para mostrar que o cálculo depende do tipo de variável, do nível de confiança, do erro aceitável e do efeito esperado. Tem vantagem adicional de circular bastante no contexto brasileiro.

URL:
https://www.jvascbras.org/article/doi/10.1590/S1677-54492011000400001
https://doi.org/10.1590/S1677-54492011000400001

3. Althubaiti A. Sample size determination, a practical guide for health researchers. J Gen Fam Med. 2023;24(2):72-78.

Comentário:
É uma revisão prática e atual, muito boa para um capítulo didático. Resume os principais elementos que entram no cálculo amostral, como objetivo do estudo, efeito esperado, significância, poder e perdas. Também é útil para mostrar que o cálculo deve acompanhar o desenho do estudo.

URL:
https://pubmed.ncbi.nlm.nih.gov/36909790/
https://doi.org/10.1002/jgf2.600

4. Charles P, Giraudeau B, Dechartres A, Baron G, Ravaud P. Reporting of sample size calculation in randomised controlled trials, review. BMJ. 2009;338:b1732.

Comentário:
Referência muito importante para a parte crítica do capítulo. Mostra que não basta dizer que “houve cálculo amostral”, é preciso relatar corretamente os parâmetros utilizados. É excelente para sustentar a seção sobre erros frequentes e sobre como justificar o tamanho da amostra no método.

URL:
https://www.bmj.com/content/338/bmj.b1732
https://doi.org/10.1136/bmj.b1732

5. Cook JA, Julious SA, Sones W, Hampson LV, Hewitt C, Berlin JA, et al. DELTA² guidance on choosing the target difference and undertaking and reporting the sample size calculation for a randomised controlled trial. BMJ. 2018;363:k3750.

Comentário:
Muito valiosa para a parte mais refinada do tema. Essa fonte ajuda a mostrar que, em estudos comparativos, um ponto central do cálculo amostral é a escolha da diferença alvo, isto é, a magnitude do efeito que o estudo pretende detectar. É referência importante para discutir relevância clínica versus relevância estatística.

URL:
https://www.bmj.com/content/363/bmj.k3750
https://doi.org/10.1136/bmj.k3750

Tabela, 7 pontos mais importantes sobre tamanho da amostra na pesquisa quantitativa

Nº	Ponto central	Explicação didática
1	O tamanho da amostra é uma decisão metodológica central	Ele afeta a validade, a precisão das estimativas, o poder estatístico e a credibilidade dos resultados.
2	Existem dois grandes modelos de definição amostral	O modelo formal, baseado em cálculo estatístico, e o modelo pragmático, baseado em viabilidade, dados disponíveis ou referência em estudos anteriores.
3	O modelo formal é o mais robusto	Sempre que possível, a amostra deve ser definida por cálculo estatístico compatível com o objetivo principal da pesquisa.
4	Dentro do modelo formal há diferentes finalidades	O cálculo pode ser orientado para estimativa, diferença entre grupos, correlação ou regressão/modelagem.
5	Não existe número mágico de participantes	O n adequado depende do desfecho principal, do efeito esperado, da variabilidade, da precisão desejada, do alfa, do poder e das perdas previstas.
6	Estudos anteriores podem ajudar, mas com limites	O melhor uso da literatura prévia é extrair parâmetros para o cálculo formal, e não apenas copiar o mesmo número de participantes.
7	A justificativa da amostra precisa ser transparente	No método, o pesquisador deve explicar como definiu o n, quais parâmetros usou e qual a relação entre esse número e o objetivo do estudo.

Síntese final

Se eu fosse condensar tudo em uma frase para o capítulo, seria esta:

O tamanho da amostra, em pesquisa quantitativa, deve ser definido de modo coerente com o objetivo do estudo, preferencialmente por cálculo formal, e justificado de forma clara no método.

Declaração de Uso de Inteligência Artificial Generativa. Declara-se a utilização da ferramenta de Inteligência Artificial Generativa ChatGPT, desenvolvida pela OpenAI, como recurso auxiliar na organização de ideias, na elaboração preliminar de trechos textuais e na criação de imagens relacionadas a este trabalho. O uso da ferramenta restringiu-se ao apoio técnico na estruturação do conteúdo, no aperfeiçoamento da linguagem e na geração inicial de material visual. A análise crítica, a verificação da adequação das informações, a interpretação dos dados, a redação final e a responsabilidade integral pelo conteúdo apresentado permanecem exclusivamente sob responsabilidade do autor.

***