A amostra de 30 é mágica? Origem, limites e riscos de uma regra estatística mal interpretada na pesquisa clínica

O número 30 não é mágico, é uma regra prática mal aplicada ao cálculo amostral

Aldemar Araujo Castro
Criação: 25/04/2026
Atualização: 25/04/2026
Palavras: 1823
Tempo de leitura: 9 minutos

Resumo

A ideia de que uma amostra com 30 participantes seria suficiente para qualquer pesquisa tornou se uma crença frequente no meio acadêmico. Sua origem está relacionada ao Teorema Central do Limite, à tradição do teste t de Student e à simplificação didática que separa amostras pequenas de amostras grandes. No entanto, em pesquisa clínica, o número 30 não garante validade, precisão, poder estatístico ou relevância clínica. O tamanho da amostra deve ser definido pela pergunta de pesquisa, pelo desenho do estudo, pelo desfecho principal, pela diferença clinicamente relevante, pela variabilidade dos dados e pelas perdas esperadas.

Em muitas apresentações acadêmicas, uma frase aparece com frequência surpreendente: “a amostra será composta por 30 participantes.” O número surge como se tivesse uma autoridade própria. Muitas vezes, não vem acompanhado de cálculo, não se relaciona claramente ao objetivo do estudo e não explica qual desfecho sustentou sua escolha. Ainda assim, parece confortável. Parece aceitável. Parece científico.

O problema é que o número 30 ganhou, em muitos ambientes acadêmicos, uma espécie de aura metodológica. Ele passou a funcionar como um número seguro, quase ritualístico. Quando o pesquisador não sabe exatamente como justificar o tamanho da amostra, 30 aparece como solução rápida. Quando o orientador deseja uma proposta viável, 30 parece razoável. Quando o aluno precisa entregar um projeto dentro do prazo, 30 parece suficiente.

Mas a pergunta central é simples: 30 é realmente um número mágico?

A resposta é não.

O número 30 não é mágico. Ele é uma regra prática, nascida de conceitos estatísticos legítimos, mas frequentemente transportada de maneira inadequada para contextos em que não deveria ser usada como critério universal.

A origem dessa ideia está fortemente associada ao Teorema Central do Limite. Esse teorema afirma que, sob determinadas condições, a distribuição das médias amostrais tende a se aproximar de uma distribuição normal conforme o tamanho da amostra aumenta. Em termos simples, quando coletamos muitas amostras de uma população e calculamos a média de cada uma, essas médias tendem a se organizar de modo aproximadamente normal, especialmente quando o número de observações por amostra cresce. Um artigo de revisão em estatística médica destaca justamente essa relação entre tamanho amostral, distribuição das médias e aproximação normal.

A partir desse raciocínio, muitos cursos introdutórios passaram a ensinar que, com amostras em torno de 30 observações, algumas aproximações estatísticas começam a se tornar mais aceitáveis. Essa ideia também aparece em materiais didáticos de estatística, nos quais n igual a 30 é frequentemente apresentado como regra de bolso, embora se ressalte que a qualidade da aproximação depende da distribuição original dos dados.

Aqui começa a confusão.

O Teorema Central do Limite não afirma que 30 pacientes são suficientes para uma pesquisa clínica. Ele também não afirma que 30 participantes garantem validade científica. O que ele sugere é algo mais específico: em certas condições, a distribuição da média amostral pode se aproximar da normalidade quando a amostra aumenta. Isso é muito diferente de dizer que 30 participantes bastam para responder qualquer pergunta científica.

Normalidade aproximada da média não é o mesmo que suficiência amostral.

Outra influência histórica importante vem do teste t de Student. William Sealy Gosset, que publicava sob o pseudônimo “Student”, desenvolveu o teste t no início do século XX para lidar com amostras pequenas, em um contexto em que os métodos baseados em grandes amostras eram inadequados para muitos problemas reais. A Britannica registra que Gosset desenvolveu o teste t e a distribuição t em 1908, justamente diante da necessidade de trabalhar com amostras pequenas.

A história do teste t também ajudou a consolidar uma distinção didática entre amostras pequenas e grandes. Há registros de que Gosset publicou tabelas estendidas para valores de n de 2 a 30, o que reforçou historicamente a presença desse número na prática estatística. Com o tempo, n menor que 30 passou a ser associado a “amostra pequena”, enquanto n igual ou maior que 30 passou a ser tratado, em muitos contextos didáticos, como “amostra grande” ou suficiente para aproximações normais.

O erro não está na origem estatística. O erro está na transformação de uma referência didática em uma regra universal.

Em pesquisa clínica, o tamanho da amostra não pode ser definido por tradição. Ele deve ser definido pela pergunta de pesquisa. Um estudo de prevalência, um ensaio clínico, uma coorte, um estudo caso controle, um estudo de acurácia diagnóstica, uma validação de instrumento e um consenso Delphi exigem raciocínios amostrais diferentes. Aplicar o mesmo número a todos esses desenhos é metodologicamente frágil.

Imagine um estudo que deseja estimar a prevalência de úlcera venosa em uma população. Nesse caso, o tamanho da amostra dependerá da prevalência esperada, da margem de erro aceitável e do nível de confiança. Agora imagine um ensaio clínico que deseja comparar dois curativos quanto à taxa de cicatrização em 12 semanas. Nesse caso, será necessário considerar a proporção esperada de cicatrização em cada grupo, a diferença clinicamente relevante, o nível de significância, o poder estatístico e as perdas previstas. São perguntas diferentes. Portanto, exigem cálculos diferentes.

Uma amostra de 30 participantes pode ser aceitável em alguns cenários. Pode ser útil em um estudo piloto. Pode servir para testar logística, treinar equipe, avaliar instrumentos, estimar tempo de coleta ou verificar a viabilidade de recrutamento. Também pode ser aceitável em estudos exploratórios claramente declarados como exploratórios. Nesses casos, o número 30 não é usado para provar eficácia ou estimar com alta precisão. Ele é usado para aprender sobre o processo de pesquisa.

O problema surge quando 30 é usado como justificativa automática para estudos que pretendem produzir conclusões clínicas fortes.

Se um estudo pretende demonstrar que uma intervenção reduz amputações, melhora cicatrização, diminui mortalidade ou aumenta a acurácia diagnóstica, o número 30 provavelmente será insuficiente, salvo em situações muito específicas e bem justificadas. Desfechos raros, diferenças pequenas e grande variabilidade exigem amostras maiores. Por outro lado, estudos qualitativos podem necessitar de menos de 30 participantes quando atingem saturação teórica. Portanto, o número isolado não resolve a questão.

A pergunta errada é:

“Tenho pelo menos 30 participantes?”

A pergunta correta é:

“Quantos participantes são necessários para responder ao objetivo principal com precisão, poder estatístico e relevância clínica?”

Essa mudança de pergunta é decisiva.

O cálculo amostral não é uma formalidade burocrática. Ele é uma ponte entre a pergunta científica e a validade da resposta. Uma amostra pequena demais pode levar a falso negativo, ou seja, o estudo pode não detectar uma diferença que realmente existe. Uma amostra grande demais pode expor mais participantes do que o necessário, consumir recursos excessivos e detectar diferenças estatisticamente significativas, porém sem importância clínica.

Por isso, o tamanho da amostra deve considerar pelo menos sete elementos: o tipo de estudo, a população alvo, o desfecho principal, a medida de efeito ou estimativa desejada, a diferença clinicamente relevante, a variabilidade esperada e as perdas previstas. Em estudos comparativos, entram também o nível de significância e o poder estatístico. Em estudos diagnósticos, entram sensibilidade, especificidade, prevalência da condição e precisão desejada. Em estudos de regressão, importa o número de eventos por variável e a estabilidade do modelo.

O número 30 não consegue carregar sozinho toda essa complexidade.

Talvez o mito dos 30 tenha sobrevivido justamente porque oferece uma resposta simples para uma pergunta difícil. Ele tranquiliza o pesquisador, facilita a aula, simplifica o projeto e evita discussões metodológicas mais profundas. Mas essa tranquilidade pode ser ilusória. Em ciência, um número não deve apenas parecer razoável. Ele precisa ser justificável.

A crítica ao número 30 não significa que ele nunca possa ser usado. Significa apenas que ele não deve ser usado como argumento final. O número pode aparecer, desde que venha acompanhado de uma justificativa coerente com o objetivo do estudo. Se for estudo piloto, que se declare como piloto. Se for estudo exploratório, que se declare como exploratório. Se for amostra de conveniência, que isso seja assumido como limitação. Se houver cálculo formal, que os parâmetros sejam apresentados com clareza.

O verdadeiro problema não é ter 30 participantes. O verdadeiro problema é ter 30 participantes sem pergunta clara, sem desfecho principal, sem cálculo, sem justificativa e sem consciência das limitações.

Na pesquisa clínica, o compromisso do pesquisador não é encontrar um número confortável. É encontrar um número necessário. Esse número pode ser 30, pode ser 300 ou pode ser 3.000. Depende da pergunta. Depende do desenho. Depende do desfecho. Depende do efeito que se deseja detectar. Depende da precisão que se deseja alcançar.

Portanto, a amostra de 30 não é mágica. Ela é uma memória histórica da forma como a estatística foi ensinada, simplificada e, muitas vezes, mal aplicada. Quando usamos 30 sem justificativa, trocamos método por costume. Quando calculamos a amostra a partir da pergunta, protegemos o participante, fortalecemos o projeto e aumentamos a chance de produzir conhecimento clinicamente útil.

A frase final poderia ser esta:

Em pesquisa clínica, o tamanho da amostra não deve nascer da tradição. Deve nascer da pergunta.

Fontes comentadas

Teorema Central do Limite

Kwak SG, Kim JH. Central limit theorem: the cornerstone of modern statistics. Korean J Anesthesiol. 2017;70(2):144 a 156. doi:10.4097/kjae.2017.70.2.144.
URL: https://pmc.ncbi.nlm.nih.gov/articles/PMC5370305/
Comentário: Fonte útil para explicar a origem estatística da ideia de que, a partir de certo tamanho amostral, a distribuição das médias amostrais tende a se aproximar da normalidade. Ela ajuda a esclarecer que o Teorema Central do Limite é uma base para aproximações estatísticas, mas não autoriza concluir que 30 participantes sejam suficientes para qualquer pesquisa clínica. É uma boa referência para a seção “De onde veio a ideia dos 30?”. (PMC)

Origem histórica do teste t de Student

Student. The probable error of a mean. Biometrika. 1908;6(1):1 a 25. doi:10.1093/biomet/6.1.1.
URL: https://academic.oup.com/biomet/article-abstract/6/1/1/225634
Comentário: Este é o artigo clássico de 1908 que originou a distribuição t de Student, publicada sob o pseudônimo “Student”. A fonte é importante para mostrar a raiz histórica da preocupação com amostras pequenas. Ela permite explicar que o número 30 se consolidou também pela tradição didática de separar amostras pequenas de amostras grandes, especialmente em contexto de testes de médias. (OUP Academic)

Cálculo amostral em pesquisa clínica

Whitley E, Ball J. Statistics review 4: sample size calculations. Crit Care. 2002;6(4):335 a 341. doi:10.1186/cc1521.
URL: https://ccforum.biomedcentral.com/articles/10.1186/cc1521
Comentário: Fonte prática e didática para explicar que o tamanho da amostra depende do desenho do estudo, da diferença a ser detectada, da variabilidade, do nível de significância e do poder estatístico. É especialmente útil para a parte do texto que afirma que o cálculo amostral não pode ser substituído pela regra informal dos 30 participantes. (Springer Nature Link)

***

Declaração de Uso de Inteligência Artificial Generativa. Declara-se a utilização da ferramenta de Inteligência Artificial Generativa ChatGPT, desenvolvida pela OpenAI, como recurso auxiliar na organização de ideias, na elaboração preliminar de trechos textuais e na criação de imagens relacionadas a este trabalho. O uso da ferramenta restringiu-se ao apoio técnico na estruturação do conteúdo, no aperfeiçoamento da linguagem e na geração inicial de material visual. A análise crítica, a verificação da adequação das informações, a interpretação dos dados, a redação final e a responsabilidade integral pelo conteúdo apresentado permanecem exclusivamente sob responsabilidade do autor.

***

Usina de Pesquisa: Planejar, Executar e Divulgar Pesquisa na Área da Saúde!