Princípios de Estatística Aplicada aos Estudos Clínicos Em Oncologia:

 

(Baseado no capítulo 4 do livro do Dr. Auro del Giglio: Câncer: uma introdução ao seu estudo e tratamento, Editora Pioneira, 1998).

 

 

Os procedimentos estatísticos comumente utilizados para a análise de estudos clínicos em Oncologia não são são muitos. Necessitamos basicamente:

 

a) Estimar a taxa de resposta de um dado tratamento e compará-la àquela obtida por um outro tipo de tratamento.

b) Comparar a sobrevida e sobrevida livre de doença entre grupos de doentes tratados diferentemente.

c) Calcular o número de pacientes necessários em um estudo para que com um determinado grau de confiança possamos provar ou não que exista uma determinada diferença entre dois tratamentos diferentes.

d) Estimar qual é a importância de diversas variáveis na determinação do exito de um tratamento, prognóstico de um doente, etc (Análise Multivariada).

 

 

Abordaremos aqui os métodos acima citados de maneira puramente conceitual sem entrarmos em detalhes de como se fazem os cálculos estatísticos necessários a obtenção dos resultados. Além disso, obviamente existem muitos outros procedimentos estatísticos em uso corrente em pesquisa no campo oncológico porém tanto a sua abordagem como os detalhes dos métodos aqui mencionados fogem ao objetivo deste capítulo .O leitor interessado encontrará no final deste livro referências bibliográficas específicas sobre estes testes estatísticos.

 

 

1) Conceito de p e de intervalo de confidência de 95%:

 

Um conceito básico antes de entrarmos nas considerações estatísticas que é fundamental para a interpretação de resultados de qualquer estudo é que a estatística não cria nenhum resultado, ela apenas os constata de maneira objetiva e mensurável. Portanto, podemos, muitas vezes, simplesmente ao analisar os dados de um estudo observar que os resultados de um tratamento são nitidamente superiores a outro.

Não é necessário nenhum procedimento estatístico para nos certificar, por exemplo, que um tratamento que produziu 30% de resposta em um grupo grande de pacientes é superior a um outro cuja resposta foi de 10%. A dúvida que sempre surge, no entanto, ao analisarmos resultados é : qual é a chance de que a diferença de 30% contra 10% seja apenas obra do acaso? Intuitivamente podemos dizer que se 2000 pacientes foram estudados é muito mais provável que esta diferença de 20% (30% - 10%) entre os grupos seja real e não obra do acaso. Se de outro lado estudássemos apenas 20 pacientes não estaríamos tão seguros que esta diferença de 20% não fosse apenas coincidental. O papel da estatística neste caso é estimar a probabilidade da ocorrência da diferença entre os dois grupos apenas por obra do acaso. O limite da probabilidade mais freqüentemente utilizado para considerar que um determinado fato não tenha ocorrido ao acaso é 5%. Ou seja, comumente acredita-se que se a chance de que uma diferença entre dois grupos tenha ocorrido ao acaso for menor que 5% então provavelmente a diferença não se deveu ao acaso e sim a alguma uma outra variável que distingue os dois grupos. Neste caso a variável que é diferente entre os dois grupos é o tratamento aplicado a eles. Assim no exemplo acima a probabilidade (p) desta diferença de 20% ser coincidental é p = 0.26 para o grupo de 20 pacientes e de p < 0.0001 para o grupo de 2000 pacientes. Observamos assim que uma mesma diferença de 20% entre dois tratamentos em um estudo de 20 pacientes tém uma probabilidade de ter ocorrido ao acaso de 26% (p= 0.26) que é muito maior do que se esta mesma diferença persistisse após um estudo de 2000 pacientes (p<0.001). No primeiro caso como 26% é maior que 5% julgamos esta diferença não significante enquanto no segundo caso a diferença é significativa do ponto de vista estatístico. A estatística neste caso confirmou a nossa impressão intuitiva e além disso a quantificou.

 

 

Quando não sabemos de antemão se um tratamento é superior ou inferior a outro devemos usar valores lores de p bilaterais ("two-sided"). Caso saibamos, no entanto, que, por exemplo, se um tratamento for diferente de outro ele será seguramente superior utilizamos valores de p unilaterais ("one- sided").

 

Nem sempre o que é estatisticamente significativo é clinicamente relevante. Assim uma diferença de 1% em um estudo de 100.000 pacientes pode ser estatisticamente significativa porém é muito pequena do ponto de vista clínico para justificar uma mudança do tipo de tratamento para uma determinada doença.

 

Um outro conceito importante é o de limite de confidência de 95%. Por exemplo, imaginemos que quiséssemos estimar a incidência de uma doença na população de São Paulo. Poderíamos hipoteticamente examinar todos os paulistanos e obteríamos a real incidência da doença X . Digamos que a incidência desta doença é de 22.34%. Se, por outro lado, entrevistássemos apenas 100 indivíduos para estimar a incidência da doença X na população como um todo poderíamos encontrar 30%. Ao entrevistarmos 1000 indivíduos talvez 24% e assim por diante. Observamos que cada medida fornece um número dentro de um intervalo ao redor do real valor de 22.34%. É intuitivo também que à medida que entrevistarmos um número maior de indivíduos a chance de estarmos diante de um número mais próximo do real 22.34% aumenta até chegarmos hipoteticamente a entrevistar toda a população chegando assim a exatamente a 22.34%. Ou seja, à medida que o número de pacientes entrevistados é maior os valores obtidos tendem a convergir em torno de 22.34%, reduzindo-se progressivamente o intervalo entre este valor e o obtido na entrevista. O Intervalo de Confidência de 95% estima o intervalo ao redor do hipotético valor real da população, calculado a partir de uma amostra da mesma, onde 95% dos resultados de estimativas semelhantes iriam estar. Portanto, quanto maior o número de paulistanos entrevistados, menor será o intervalo de confidência de 95%. O intervalo de confidência é calculado baseado em como os dados estão distribuídos ao redor da media na amostra da população estudada e no número de observações feitas. Um intervalo de confidência de 95% muito amplo atesta que a precisão da medida efetuada talvez não seja ideal ( por exemplo por ter poucos entrevistados), uma vez que novas entrevistas semelhantes podem fornecer resultados muito discrepantes entre si. Isto não ocorre no caso de se ter encontrado um intervalo pequeno.

 

 

 

O conceito de intervalo de confidência de 95% pode também ser aplicado a diferenças entre dois grupos de pacientes. Por exemplo, quando temos um intervalo de confidência de 95% de uma diferença de 20% entre dois grupos de pacientes tratados diferentemente indo de 10 a 30%, concluímos que ela é significativa. Isto ocorre pelo fato do valor mínimo deste intervalo (10% ) não passar pelo 0 (ou diferença nula entre os grupos) 95% das vezes. Ou seja a probabilidade desta diferença ser 0 e, portanto não haver real diferença entre os grupos, é menor que 5% e portanto a diferença de 20% entre os dois grupos é significativa. A estimativa do intervalo de confidência complementa o valor de p neste caso pois nos dá uma idéia de qual seria o valor mínimo e máximo das possíveis diferenças entre os dois grupos que poderiam ser encontradas caso quiséssemos reproduzir este mesmo estudo novamente de maneira semelhante 95% das vezes

 

2) Cálculo do tamanho da amostra (N):

 

Muitas vezes antes de iniciarmos um estudo clínico nos perguntamos quantos pacientes necessitaremos, por exemplo, em cada braço de um estudo comparativo, para provarmos que um dado tratamento é superior a um outro. O número necessário depende do conhecimento de algumas variáveis:

 

a) A probabilidade de erro tipo1 ou alfa: é a probabilidade de atribuirmos significância estatística a uma diferença que não seja realmente significativa (falso positivo). O valor de alfa é, como vimos, arbitrariamente de 5%.

 

b) A probabilidade de erro tipo 2 ou beta: é a probabilidade de não atribuirmos significância estatística a uma correlação que é realmente significativa (falso negativo). Beta é ordinariamente considerado igual a 20%. O poder do teste é , então, 1 - Beta que é igual a 80%. Isto significa que o teste em questão tem 80% de chance de detectar uma diferença realmente significativa.

 

c) A diferença (delta) estimada entre os dois tratamentos que se pretende estimar com o estudo em questão. Por exemplo, só nos interessaria mudar o tratamento de uma doença se o tratamento mais novo for melhor do que o concvencional em no mínimo 30%. Podemos então criar um estudo para constatar se há ou não esta diferença de 30% entre os dois tratamentos.

 

O cálculo de N depende então de alfa, beta e delta. Assim, se fixarmos alfa em 5% e beta em 20%, quanto maior delta menor N. Ou seja, Quanto maior é a diferença que queremos constatar menor será a chance de que se ela existir ela se deva ao acaso. Portanto, quanto maior delta menor será o número necessário de pacientes (N) no estudo para constatá-la. Se, por outro lado estivermos interessados em uma pequena diferença entre os dois grupos precisaremos de muitos mais pacientes no estudo para poder constatá-la.

 

3) Análise de diferenças entre dois grupos de pacientes envolvendo a consideração do tempo que cada paciente participou no estudo.

 

Um dos objetivos mais importantes dos estudos em Oncologia é a comparação da sobrevida livre de doença (SLD) e da sobrevida (SV) entre dois grupos de pacientes submetidos a tratamentos diferentes.

Um paciente pode ao receber um tratamento ter uma resposta completa, ou seja, o desaparecimento de toda a evidência mensurável de sua doença. Dizemos que ele esta sem evidência de doença e, portanto, todo o tempo que ele viver sem ela será a sua Sobrevida Livre de Doença (SLD). Já o tempo total entre o diagnóstico de câncer até a morte do indivíduo constitui a sua sobrevida (SV). Assim, geralmente, SV é maior que SLD porque mesmo após a recaída do tumor o indivíduo ainda pode receber outros tratamentos que prolonguem a sua sobrevida mesmo com o tumor presente clinicamente.

 

Apesar de SV e SLD serem variáveis diferentes, o seu tratamento estatístico é idêntico. Os métodos estatísticos que se aplicam a comparações de SV e SLD entre grupos diversos de pacientes , no entanto, são diferentes de todos os já mencionados. Isto se deve a que pacientes que entram em um estudo clínico o fazem em momentos diferentes devem ser considerados estatisticamente de acordo com o tempo em que participaram dele. Pacientes cujo seguimento foi interrompido por qualquer razão (mudança de domicílio, desinteresse do paciente, etc) também são levados em conta nestes estudos. Estes pacientes são censurados na data da última consulta e, portanto, fornecem dados para o estudo até este ponto. Assim, um paciente que entrou em um estudo há 5 anos e recebeu o tratamento A e está livre de doença até a conclusão do estudo 4 anos depois tém uma SLD de 4 anos e uma Sobrevida de 5+ anos. Por outro lado, um outro paciente que entrou no estudo há dois anos, recebeu o tratamento A e está vivo sem doença há um ano tém uma SLD de 1 ano e uma SV de 2+ anos. Portanto, apesar de ambos terem respondido ao mesmo tratamento A e estarem vivos e sem evidência de doença eles geram para o estudo dados diferentes. Isto ocorre porque cada paciente empresta para o estudo o tempo no qual ele está em risco para um evento (morte ou recaída tumoral). A comparação entre dois tratamentos diferentes é, em última análise, a análise de quantos pacientes em risco para um dado evento ainda existem, em um dado momento, em cada grupo. Se os valores observados para cada grupo forem muito diferentes dos esperados pelo acaso poderá então existir uma diferença estatísticamente significativa entre estes dois grupos de pacientes.

 

 

4) Conceito de Análise Multivariada:

 

Sabemos que a maioria dos fenômenos biológicos dependem de mais de uma variável. Portanto é importante que se possa identificar quais as variáveis envolvidas na determinação de um dado evento biológico e qual a importância relativa de cada uma delas no fenômeno em questão.

 

Assim, por exemplo, sabemos que a idade e a citogenética são variáveis importantes para o prognóstico de pacientes com Leucemia Mielóide Aguda (LMA). Pacientes jovens portadores de uma citogenética favorável têm melhor prognóstico. Existem duas possibilidades: a) A citogenética interage fortemente com a idade ou vice versa e, na verdade é a idade ou a citogenetica isoladamente quem determina o prognóstico, b) As duas variáveis são independentes entre si e cada uma explica uma parte da variação do prognóstico entre pacientes diferentes com LMA.

 

Em estudos onde se faz apenas uma análise univariada sabemos que tanto a citogenética como a idade são significativamente relacionadas ao prognóstico. Ou seja, variações da idade e da citogenética isoladamente se correlacionam de maneira significativa com variações do prognóstico em pacientes com LMA. Quando, no entanto, estudamos ambas variáveis em conjunto (idade e citogenética) através de uma análise multivariada queremos então saber se: a) ambas contribuem independentemente para explicar as variações de prognóstico entre pacientes diferentes e, b) se forem independentes entre si, qual é a contribuição relativa de cada uma delas para explicar as variações de prognóstico observadas.

 

Vou dar um exemplo da aplicação do conceito da Análise Multivariada. Suponhamos que não soubéssemos que o fumo causa câncer de pulmão. Poderíamos em uma observação inicial concluir que pacientes com dedos amarelados (pela nicotina) teriam um risco maior de câncer de pulmão. Como só quem fuma adquire dedos amarelados percebemos que ambas variáveis fumo e dedos amarelados interagem significativamente. Se testássemos ambas variáveis (hábito de fumar e dedos amarelados) em uma Análise Multivariada perceberíamos que só o hábito de fumar seria independentemente relacionado a câncer de pulmão. Isto se deve a forte interação entre as variáveis e ao fato de que o hábito de fumar explica muito mais da variabilidade da variável câncer de pulmão que dedos amarelados. Percebemos por este exemplo como a Análise Multivariiada pode nos dar pistas para tentar entender certos fenômenos biológicos.

 

 

Através da Análise Multivariada pode se construir, portanto, um modelo pelo qual podemos explicar a variação de uma variável dependente através de outras variáveis independentes. No nosso primeiro exemplo a variável dependente é o prognóstico e as independentes a idade e a citogenética. Através da Análise Multivariada se atribui a cada variável independente um coeficiente cuja magnitude expressa a contribuição relativa desta variável para o modelo como um todo. Nenhum modelo é perfeito e, portanto, todos os modelos construídos explicam apenas uma parte da variabilidade da variável dependente. Um dos procedimentos para Análise Multivariada freqüentemente empregado é o dos Riscos Proporcionais de Cox.

 

O leitor interessado encontrará maiores detalhes sobre todos os procedimentos estatísticos em textos especializados em bioestatística como os citados abaixo:

 

Referências bibliográficas:

 

1) Daly,L.E., Bourke,G.J., McGilvray,J. 1991. Interpretation and uses of Medical Statistics (4th ed.). Oxford: Blackwell Scientific Publications.

 

2) Zar, J.H. 1984. Biostatistical Analysis (2nd ed) Englewood Clifts: Prentice-Hall, Inc.

 

3) Costa-Neto,P.L.O. 1977. Estatística (Primeira ed) São Paulo: Edgard Blücher.