library(tibble)
library(dplyr)
library(ggplot2)

Introducció

Bàsicament, els assaigs clínics són experiments, realitzats d’acord amb unes determinades pautes estadístiques, mitjançant els quals comparem dues poblacions o més.

Si només tenim dues poblacions, a la població a qui apliquem el nou tractament se l’anomena grup tractament i a la població a qui apliquem el tractament estàndard o cap tractament, grup control. Si a aquesta segona població no se li aplicarà cap tractament, per raons psicològiques, als seus individus se li administra un fals tractament, sense cap efecte, anomenat placebo.

En principi, a totes dues poblacions se’ls ha d’aplicar els tractaments simultàniament i, a més a més, els individus han de ser assignats a un o altre grup aleatòriament, per evitar biaixos en les conclusions.

Podem dir que als assaigs clínics hi ha dues grans etapes. En un primer pas hem d’escollir els individus, l’observació dels quals donarà origen a les dades, de manera molt precisa, ja que aquestes seran la matèria primera a utilitzar a la segona part, dedicada a l’anàlisi dels resultats.

En aquest document ens centrarem l’etapa de creació de la mostra que per als assaijos clínics té unes caràcterístiques molt específiques i peculiars respecte al que es fa en altres àmbits.

Referències

A. García Pérez, Cuadernos de estadística aplicada: Área de salud, 2023.

Població i mostra

Una de les primeres coses a precisar, tant pel que fa a la seva importància com pel que fa al seu ordre temporal, és la Població a estudiar, respecte a la qual traurem les conclusions, i la Mostra entesa aquesta com a conjunt d’individus elegits de forma aleatòria de la Població.

La determinació d’ambdues és, en teoria, senzilla: primer es fixa la població en base a unes característiques que l’investigador vol estudiar (ser major de 30 anys, patir una determinada malaltia, etc.) i, mitjançant un mecanisme d’atzar, se seleccionen uns quants individus, els quals constituiran la mostra.

No obstant, excepte potser els assaigs clínics efectuats en un laboratori, la realitat sol ser diferent ja que se sol comptar amb una sèrie de dades referides a pacients, no triats mitjançant un mecanisme d’atzar, sinó que acudeixen a la consulta oa l’hospital quan pateixen la malaltia en estudi.

L’adequació de la teoria a la pràctica, de manera que els resultats obtinguts amb l’estadística puguin continuar sent vàlids, es basa en fixar, prèviament a l’obtenció de les dades, uns criteris d’admissió a l’assaig clàssic, de manera que els resultats amb les dades següents mateixes característiques d’aquells sotmesos a l’assaig.

Mida de la mostra i anàlisi de poder

La diferència dels assajos clínics amb les enquestes

Als assajos clínics es busca comprovar una hipòtesi experimental (ex. “el fàrmac redueix la pressió arterial”) avaluant una diferència mínima clínicament rellevant. Per contra, a les enquestes poblacionals busquem estimar paràmetres generals (ex. “la proporció de persones que fumen”) amb un marge d’error i un nivell de confiança determinats.

Aquest mètode és inapropiat per a enquestes perquè no hi ha efecte a mesurar: Com veurem, el càlcul per potència mínima requereix definir una “mida de l’efecte” (la magnitud de la diferència entre grups). Com que en una enquesta descriptiva no compares grups, no hi ha una mida de l’efecte predefinit.

Poder o potència de la mostra

En terme generals, és la probabilitat de trobar un resultat estadísticament significatiu, atesos una mida de mostra i un valor α (alfa, o nivell de significació estadístic). Per exemple, si jo hipotèticament tingués un poder de 0.8 (80%, que és el mínim acceptat a la literatura), i fes 100 estudis, de mitjana 80 d’aquests serien significatius, i 20 serien no significatius.

Definicions

\(n\): mida de mostra.
\(α\) (alfa o nivell de significació estadística): és la probabilitat d’Error Tipus I (fals positiu), que és detectar un efecte que no existeix (és a dir, un efecte que no existeix, però obtinc un resultat significatiu!). En altres paraules, amb un \(α = 0,05\) (o un altre valor), accepto que el 5% (o un altre valor) dels resultats siguin falsos positius. És aleshores el valor sota el qual considerem que un valor p és significatiu, i assumim que hem detectat un efecte (rebutjant la hipòtesi nul·la).
Mida de l’efecte \(\lambda_M\): mesura estandarditzada de la força d’un fenomen o una magnitud d’una relació entre variables (per exemple, \(r\), \(d\) de Cohen, \(f\) de Cohen o \(η^2\)).
Poder estadístic (també anomenat Potència estadística): es defineix com a \(1 − β\), on \(β\) és la probabilitat d’Error Tipus II (fals negatiu), que és no detectar un efecte que sí que existeix (és a dir, estudio un efecte que sí que existeix, però obtinc un resultat no significatiu!). Com que és una probabilitat, amb valors entre 0 i 1, es pot convertir en percentatge multiplicant per 100. Aleshores, si jo considero que és acceptable que en el 10% dels casos jo no detecti un error que sí existeix \((β = 0.1)\), el meu poder \((1 − β)\) seria de 0.9, o 9. En aquest cas, tindria 90% de probabilitats de detectar, com a significatiu, un efecte, si aquest existeix.

Si se’n saben tres, ja que estan interrelacionats, es pot calcular l’altre a ex-ante. Fer-ho és important ja que promou que els meus resultats siguin fiables, evita que jo faci estudis amb molt baix poder que em portin a conclusions errònies, i permet estimar la durada i el cost d’un estudi.

Aleshores, si conec \(\alpha\), la mida de l’efecte esperat (\(\lambda_M\)), y el poder estadístic (\(i-\beta\)) puc calcular la mida necessària de la mostra.

Mida mostral amb poblacions normals

La mida mostral mínima per a un test com l’aquí considerat de comparació de dues poblacions normals independents de variàncies conegudes serà \[ \small n_0 = \frac{(σ_1 + σ_2)^2 (z_α/2 + z_β)^2} {λ_M^2} \]

suposat un nivell de significació \(α\) i una potència mínima desitjada \(1−β\).

I d’aquí, l’assignació (allocation), és a dir, el repartiment de la mida mostral entre les dues poblacions hauria de ser igual a

\[ \small n_1 = \frac{n_0 σ_1}{σ_1 + σ_2} \\ \small n_2 =\frac{n_0σ_2}{σ_1+σ_2} \]

En el cas particular del mar \(σ_1=σ_2=σ\), la mida mínima mostral requerida serà igual a

\[ \small n_0= \frac{4σ^2(z_α/2+zβ)^2}{λ_M^2} \]

y \(n1=n2=n0/2\), fórmules habitualment utilitzades pels usuaris d’aquests mètodes i, com hem vist, només vàlides en alguns supòsits molt particulars que acabem d’especificar.

Càlcul amb R

R té diverses llibreries que permeten calcular la mida mostral. De fet, el que tenen són funcions que tenen com a arguments la potència i la mida mostral de manera que, si es fixa el valor de l’argument grandària mostral obtenim la potència i, si es fixa el valor de la potència, s’obté el valor de la mida mostral per al qual s’obté aquesta potència.

La llibreria `pwr`

La llibreria pwr que té les següents funcions per als tests que apareixen a la dreta de la taula

Función	Potencia para
pwr.2p.test	dos proporcions (n igual)
pwr.2p2n.test	dos proporcions (n diversos)
pwr.anova.test	ANOVA Completament Aleatoritzat
pwr.chisq.test	tests Chi-cuadrat
pwr.f2.test	Models Lineals
pwr.p.test	proporció (una mostra)
pwr.r.test	correlació
pwr.t.test test	de la t de Student (una mostra, 2 mostres igual n, dades aparellades)
pwr.t2n.test	test de la t de Student (2 mostres, diferent n)

Per exemple, per a un t test, la funció a emprar seria utilizar sería \[ \small\tt pwr.t.test(n,d,sig.level,power,type="two.sample", alternative="two.sided") \] on n és la mida de cadascuna de les dues mostres de la mateixa mida i d la mínima diferència clínica important estandarditzada, és a dir, \(\small\tt λ_M/σ\).

Exemple

El 1998 es va dur a terme un assaig clínic (MIST Study Group, 1998) per intentar establir algun tipus d’efectivitat (positiva o negativa) del zanamivir, un nou tractament per a la grip, comparant el grup tractat amb aquest medicament a un grup control tractat amb placebo.

Els investigadors van decidir que la variable d’interès seria el nombre de dies transcorreguts fins a la disminució apreciable dels símptomes, per a la qual van considerar raonable admetre una distribució normal a les dues poblacions. A més, un estudi previ havia establert com a raonables el valor \(σ = 2.75\) dies per a la desviació típica comuna i el valor \(λ_M = 1\) dia per a la mínima diferència clínica important.

Com que els investigadors van utilitzar en la seva anàlisi un nivell de significació \(α = 0′05\) i desitjaven assolir amb el seu test una potència mínima del 90 %, la mida mostral mínima ha de ser \[ \small n_0 = \frac{4σ^2 (z_{α/2} + z_β)^2} {λ_M^2} = \frac{4·2.75^2·(1.96 + 1.28)^2} {1^2} = 317.55 \]

en ser \(\small z_{\alpha /2}\) i \(\small z_\beta=z_{0.1}=1.28\).

Per tant, la mida mostral d’assaig ha de ser \(n_0 = 318\) i els individus a triar de cada grup (l’assignació), \(n_1=n_2=n_0/2 = 159\).

Si volem resoldre aquest exercici amb R, executarem pwr(), definint d=λ_M/σ=1/2.75, sig.level=α=0.05, power=0.9:

pwr::pwr.t.test(d=1/2.75,sig.level=0.05,power=0.9,type="two.sample",alternative="two.sided")

## 
##      Two-sample t test power calculation 
## 
##               n = 159.8912
##               d = 0.3636364
##       sig.level = 0.05
##           power = 0.9
##     alternative = two.sided
## 
## NOTE: n is number in *each* group

que ens donaria la mida mostral a triar a cadascuna de les dues poblacions, Tractament i Control. Per la qual cosa la mida mostral total seria

pwr::pwr.t.test(d=1/2.75,sig.level=0.05,power=0.9,type="two.sample",alternative="two.sided")$n*2

## [1] 319.7824

Mida mostral amb poblacions binomials

A l’apartat anterior es va determinar la mida mostral de l’assaig clínic, per a una potència determinada, en el cas que les poblacions fossin normals. A més, aquesta potència mínima que es garantia feia referència a un valor de la hipòtesi alternativa definit per la diferència de mitjanes poblacionals λ = µ1 − µ2, que anomenem \(λ_M\) mínima diferència clínica important.

Si les variables observades \(X_1\) i \(X_2\) són de tipus qualitatiu, amb distribucions binomials \(B(1, p1)\) i \(B(1, p2)\), l’assaig clínic habitualment tindrà per propòsit el contrastar la hipòtesi nul·la \(H_0:p_1=p_2\) front: podent utilitzar-se el mateix esquema desenvolupat a la secció anterior ja que els estimadors \(\hat p_1\) i \(\hat p_2\) són asintòticament normals. No obstant això, en aquest tipus de test ja no hem de caracteritzar l’alternativa com a diferència de les mitjanes \(p_1−p_2\), sinó que hem d’especificar valors concrets per a cadascun dels paràmetres \(p_1\) i \(p_2\), ja que no necessitarem la mateixa mida mostral quan vulguem, per exemple, contrastar un canvi en la taxa de mortalitat del 20 mortalitat del 45% al 30%. En suma, ara ja no hi ha invariància respecte a translacions a l’espai d’alternatives.

La mida de mostra mínima de l’assaig de nivell de significació \(α\), per a una potencia \(1 − β\) se puede calcular con la transformación arcoseno de Cohen: \[ \small n_0 = \frac {(zα/2 + zβ)^2} {(\text{arcsin}(\sqrt{p_1}) − \text{arcsin}(\sqrt{p_2}))^2} \]

Amb `pwr::pwr2p.test()`

Aquesta funció aplica la transformació arco-sen de Cohen, mitjanant la funció pwr::ES.h()

## pwr::ES.h(0.2, 0.05) = 2 * (asin(sqrt(0.20)) - asin(sqrt(0.05))) =  0.4762684

pwr::pwr.2p.test(h= 2 * (asin(sqrt(0.20)) - asin(sqrt(0.05))), 
                sig.level = 0.05, 
                power=0.95)

## 
##      Difference of proportion power calculation for binomial distribution (arcsine transformation) 
## 
##               h = 0.4762684
##               n = 114.5758
##       sig.level = 0.05
##           power = 0.95
##     alternative = two.sided
## 
## NOTE: same sample sizes

Amb power.prop.test()

Si intentem fer servir la funció nativa de R power.prop.test(p1=0.20, p2=0.05, power=0.95), notarem que el resultat variarà encara més (ens donarà prop de 124 per grup). Això passa perquè power.prop.test() no utilitza la transformació arc sinus de Cohen. En el seu lloc, aplica l’aproximació normal directa de la distribució binomial utilitzant les variàncies estimades reals de les proporcions:

\[ \small n = \frac{\left(Z_{\alpha/2}\sqrt{2\bar{p}(1-\bar{p})} + Z_\beta\sqrt{p_1(1-p_1) + p_2(1-p_2)}\right)^2}{(p_1 - p_2)^2} \]

power.prop.test(p1=0.20, p2=0.05, power=0.95)

## 
##      Two-sample comparison of proportions power calculation 
## 
##               n = 123.3515
##              p1 = 0.2
##              p2 = 0.05
##       sig.level = 0.05
##           power = 0.95
##     alternative = two.sided
## 
## NOTE: n is number in *each* group

Assignació proporcional (proportional allocation)

Un cop determinada la mida mostral \(n_0\) que ha de tenir l’assaig clínic per assolir una potència determinada, una qüestió de molt interès és la de l’assignació (proportional allocation), consistent en el repartiment dels \(n_0\) individus entre les poblacions a comparar; és a dir, suposat que només comparem dues poblacions, quants individus dels \(n_0\) han de formar el grup tractament? (els altres passaran a formar part del grup control) i, com s’assignarà als pacients un tractament o un altre?

Una resposta òbvia seria anar tirant una moneda i si surt cara l’individu aniria, per exemple, al grup tractament i si surt creu, al grup control. Això faria que possiblement la mida de l’assignació de cadascun dels dos grups no fos la mateixa i implicaria una pèrdua de potència.

A més, a fi d’evitar possibles biaixos no desitjats en els resultats, és molt recomanable que el pacient no conegui quin tractament se li aplica (single-blind trial), per això la utilització de placebos, encara que, d’altra banda, darrerament es parla de l’efecte placebo com una millora subjectiva del pacient. tractada amb placebo i una altra no tractada amb res, per esbrinar si realment hi ha aquest efecte placebo.

También es muy recomendable que el médico desconozca qué tratamiento se le va a aplicar a cada paciente en concreto, con objeto de evitar de nuevo posibles sesgos (double-blind trial).

library(pwr)
n1 <- seq(2,298, by=1)

alfa <- 0.05                # Nivell de significació
d_efecto <- 0.5             # Mida de l'efecto 



power <- sapply(n1, function(x) pwr.t2n.test(x, 300-x, d = 0.5, sig.level = 0.05)$power)

plot(seq(1,297,by=1),power, type = "l",
     main = "Potència d'una prova en funció del repartiment \nd'individus entre dues mostres (n1 i n2)",
     xlab = "n1",
     ylab = "Potència n1")

Por tanto, si a los individuos que se van incorporando al ensayo, los vamos asignando a uno u otro grupo al azar de forma independiente y equiprobable y resulta una asignación desigual, es decir, no balanceada, estaremos perdiendo potencia en el test. Tampoco podremos finalizar las asignaciones de forma no aleatoria cuando hayamos llegado a la mitad del tamaño muestral del ensayo (es decir, si el ensayo debe tener tamaño muestral \(n_0 = 30\) y ya hemos asignado 15 individuos al grupo control y 13 al grupo tratamiento, no debemos asignar a los dos ´ultimos al grupo tratamiento), puesto que no estar´ıamos ante una asignación completamente aleatoria.

Grups de tractaments permutats aleatòriament

Si volem comparar dos tractaments i la mida del nostre assaig clínic es va fixar en \(n_0 = 6\) individus, de manera que desitgem aplicar cadascun dels dos tractaments a tres individus per tenir un experiment balancejat, un pot pensar a assignar un dels dos tractaments a l’individu que s’incorpora a l’assaig mitjançant un mecanisme d’atzar equivalent a la d’una binomial \(B(1,0′5)\). Si s’utilitza R, obtindreu seqüències com la que veiem a baix, que porta a aplicar al primer individu incorporat a l’estudi, el tractament denominat 1, al segon pacient incorporat a l’estudi l’altre tractament, denominat 0, i així successivament, aplicant a quatre pacients el tractament 1 ia quatre el 0, de manera que no tindríem un assaig no balancejat.

Al següent apartat veurem algunes maneres de realitzar l’assignació de forma aleatòria, mantenint una assignació igual. Apuntem, no obstant que, llevat que l’assignació sigui molt desproporcionada, no es perdrà molta potència i, de vegades pot ser que fins i tot sigui convenient considerar un assaig no balancejat, com per exemple quan provem un nou tractament i desitgem obtenir-ne molta informació; en aquesta situació prenem més individus de la població a qui apliquem el nou tractament que de l’altra població i després calculem la potència de l’assaig clínic per veure si no ha disminuït la mínima desitjada.

Una forma alternativa d’assignar de forma aleatòria i equiprobable els dos tractaments als 6 individus de l’estudi segons vagin arribant, obtenint a més un assaig balancejat, és la d’escriure primer totes les possibles alternatives de col·locar-ne tres uns i tres zeros. Aquestes seran les permutacions amb repetició de 6 elements, un dels quals es repeteix 3 cops i un altre 3 cops (vegeu CB-secció 3.6); el seu número és

\[ \small RP_6^{3,3}=\frac{6!}{3! 3!} = 20 \]

ara triaríem a l’atzar de forma equiprobable un dels 20 números i si obtenim, per exemple, el \(\small 15 ={0,1,0,0,1,1}\), aniríem aplicant als individus que s’anessin incorporant a l’assaig la seqüència de tractaments número \(\small 15\); és a dir, al primer individu que s’incorpori a l’assaig aplicarem el tractament 0, al segon el tractament 1, i així successivament fins al sisè, al qual aplicaríem el tractament 1.

El conjunt de 20 seqüències com les anteriors es denomina grup de tractaments permutats aleatòriament, en aquest cas, de longitud 6. En anglès solen denominar-se random permuted blocks, però aquesta denominació podria confondre’s amb un tipus de Disseny d’Experiment.

Com que el nombre d’individus als quals s’aplicarà l’assaig clínic sol ser elevat, se solen utilitzar grups de tractaments permutats aleatòriament de longitud 4, el nombre dels quals seria \[ RP_4^2,2= \frac{4!} {2! 2!} = 6 \]

y su expresión \[ \begin{array} {lll} \small 1.~~~1100 &\small 2.~~~1001 &\small 3.~~~1010\\ \small 4.~~~0011 &\small 5.~~~0110 &\small 6.~~~0101 \end{array} \] sortejan després, de forma equiprobable, els números \(\{1,2,3,4,5,6\}\) fins a formar una mostra de la mida requerida per l’assaig clínic.

Així per exemple, si volem que el nostre assaig tingui una mida mostral igual a 20 individus escolliríem primer de forma equiprobable i independent cinc números d’entre \(\small \{1, 2, 3, 4, 5, 6\}\) i si obtenim, per exemple, els números \(\small 1,4,2,1,3\), encadenaríem una selecció de tractaments de mòdul 4, resultant la següent successió de tractaments a aplicar: \[ \small 1, 1, 0, 0, 0, 0, 1, 1, 1, 0, 0, 1, 1, 1, 0, 0, 1, 0, 1, 0 \]

Mida de la mostra i poder en assajos clinics

Notes d’estadística aplicada

Stefano Sanfilippo

2026

Introducció

Referències

Població i mostra

Mida de la mostra i anàlisi de poder

La diferència dels assajos clínics amb les enquestes

Poder o potència de la mostra

Definicions

Mida mostral amb poblacions normals

Càlcul amb R

La llibreria `pwr`

Exemple

Mida mostral amb poblacions binomials

Amb `pwr::pwr2p.test()`

Amb power.prop.test()

Assignació proporcional (proportional allocation)

Grups de tractaments permutats aleatòriament

Mida de la mostra i poder en assajos clinics

Notes d’estadística aplicada

Stefano Sanfilippo

2026

Introducció

Referències

Població i mostra

Mida de la mostra i anàlisi de poder

La diferència dels assajos clínics amb les enquestes

Poder o potència de la mostra

Definicions

Mida mostral amb poblacions normals

Càlcul amb R

La llibreria pwr

Exemple

Mida mostral amb poblacions binomials

Amb pwr::pwr2p.test()

Amb power.prop.test()

Assignació proporcional (proportional allocation)

Grups de tractaments permutats aleatòriament

La llibreria `pwr`

Amb `pwr::pwr2p.test()`