15 - Tema 1-15 - Tamaño de Muestra y Potencia - 2324
15 - Tema 1-15 - Tamaño de Muestra y Potencia - 2324
15 - Tema 1-15 - Tamaño de Muestra y Potencia - 2324
Taller 1-15
1. Para hablar del tamaño “necesario” de la muestra para hacer un test es necesario manejar el concepto
de Potencia Estadística de una investigación. La Potencia es la probabilidad de una probabilidad, y ese
concepto tiene un cierto grado de dificultad que no es de tipo de tipo matemático, sino puramente lógico.
2. Este ejemplo puede ayudarnos a manejar el concepto de “probabilidad de una probabilidad”. Debemos
distinguir la prob de tener bola roja si saco una bola al azar de una caja, de la probabilidad de obtener
cada tipo de caja si tomamos una caja al azar de ese conjunto de cajas.
248
A igual S, cuanto mayor N, mas información nos da à menor valor P e IC mas estrecho
Pero no hay un Valor P frontera ni una anchura de IC “buena”. Cuanto menores, mejor
3. Sabemos que la variable “ R “ (que indica resistencia ante las infecciones) tiene en la población sedentaria
media 60 y nos preguntamos si la media poblacional de los deportistas es mayor de 60.
4. Planteamos como hipótesis nula que no hay diferencia entre ambas poblaciones y tomamos una muestra
de 16 deportistas, en la que encontramos media 70 y S = 30. El valor P del test es 0.10, no muy
significativo. Si hubiéramos encontrado esa misma media y desviación en una muestra de tamaño 36, el
valor P es 0.023. Y con una muestra de tamaño 100 el valor P sería 0.0004. A igual media y desviación,
cuanto mayor es N, menor es el valor de P y más estrecho es el intervalo de confianza.
5. Pero ningún tamaño de muestra, nos asegura totalmente que vamos a encontrar un valor P
suficientemente pequeño. Solo sabemos que cuanto mayor es la N, es más probable encontrar un valor
P pequeño, que nos lleve a rechazar la hipótesis nula. Llamamos potencia estadística de una
investigación a la prob de encontrar un valor de P tan pequeño como el investigador desea o aún menor.
249
6. Veamos un ejemplo ajeno al cálculo estadístico para entender lo que es la POTENCIA ESTADÍSTICA de
un proyecto. Creo que un collar de 100 perlas se me cayó en un frondoso jardín de 400 m 2. Si lo busco
solo yo, la probabilidad de encontrar las perlas es muy pequeña (esa acción tiene poca “potencia”).
Aunque estén allí es muy pequeña la probabilidad de encontrarlas. Si decimos, por ejemplo, que la
potencia es 0.04, queremos decir que de cada 100 veces que se diera esa situación y buscando de ese
modo, solo en 4 se encontrarían las perlas. No es aconsejable actuar de ese modo.
7. Si lo buscan 15 personas, la probabilidad de encontrar las perlas es grande, si están allí. Decimos que
esa acción tiene grande “potencia”. Si decimos, por ejemplo, que la potencia es 0.90, queremos decir que
de cada 100 veces que se diera esa situación y buscando de ese modo, en 90 veces se encontrarían las
perlas.
8. La potencia depende del número de personas que busquen y también de otras circunstancias como, por
ejemplo, el tamaño de las perlas, que la vegetación sea alta o baja, el tamaño del jardín… por ello no se
puede hablar de “potencia de esa búsqueda“, si no se especifica cada una de las circunstancias que
influyen en la probabilidad de éxito.
9. En una investigación biomédica solemos plantear una hipótesis nula y rechazarla si los datos encontrados
nos llevan a un valor P del test muy pequeño. La potencia estadística es la probabilidad de encontrar un
valor P del test del tamaño que el investigador quiera encontrar.
10. Para calcular esa probabilidad hay que concretar cuánto es ese valor de P que se quiere encontrar y
algunas otras características. En la siguiente diapositiva vemos la expresión que relaciona el tamaño de
la muestra con la potencia estadística y el valor del test que se quiere encontrar y la desviación estándar
de la variable implicada y el efecto real, en el caso de un test para una media con una variable cuantitativa.
11. Consideramos la situación en que sabemos que la media de una variable es 60 en la población de
sedentarios y sospechamos que en la población de deportistas es mayor de 60. El único modo de saber
si eso es cierto es medirla en todos los individuos de la población de deportistas y calcular su media
250
poblacional. Pero siendo eso imposible, tomaremos una muestra de deportistas y con la media muestral
encontrada haremos un test planteando como Ho que la media poblacional de deportistas es 60.
12. Si con una muestra de N = 9 deportistas obtenemos media 70 y desviación estándar de muestra 30, el
valor P del test es 0.16. Pero si esa misma media y desviación se obtiene con una muestra de 144
individuos, el valor P del test es 0.000 03. En general, a igualdad de otras circunstancias, cuanto mayor
tamaño de muestra se usa, más fácil es obtener un valor P suficientemente pequeño como para rechazar
la hipótesis nula.
13. Pero ningún tamaño de muestra nos da seguridad absoluta de encontrar determinado valor P del test.
Cuanto mayor sea ese tamaño más probable es encontrar ese valor de P, es decir mayor es la potencia
estadística del estudio
14. La fórmula de la diapo nos dice cuanta N necesitamos, según sean esas 4 condiciones:
La Potencia: Prob de encontrar el Valor P del test que yo decida.
Valor P que yo quiero encontrar
La desviación de la variable
El Efecto Real, es decir, cuanto aventaja la media poblacional de deportistas a la de sedentarios.
15. Calcular la potencia de una investigación médica puede ser más o menos complicado, pero hacer ese
cálculo no compete al médico. La función del médico es interpretar adecuadamente la potencia cuando
ya nos la dan calculada.
16. Vemos el N que da la fórmula para distintas combinaciones de los cuatro valores que entran en juego.
Por ejemplo, si es S = 9, necesito N = 2 para tener prob 80% de encontrar P < 0.025, si es µD = 80. Es
decir, si muchos médicos hacen ese estudio con N = 2, 80% de ellos encontrarán P < 0.025.
17. Pero si es S = 18, necesito N = 315 para tener prob 99% de encontrar P < 0.005, si es µD = 65. Es decir,
si muchos médicos hacen ese estudio con N = 315, 99% de ellos encontrarán P < 0.005.
251
18. La potencia de un estudio depende del numero de individuos, N, y del efecto real, que en este ejemplo es
cuanto aventaja la media poblacional de deportistas a la de sedentarios. Obviamente, no conocemos esa
cantidad, por eso hacemos este estudio. Calculamos la potencia para distintos valores del efecto real. Y
vemos que se puede obtener casi cualquier potencia.
19. Cuando el general preguntó a su ayudante “qué hora es”, este contestó: “La que usted quiera, mi general”.
Igualmente, cuando un evaluador de un proyecto pregunte cuanta potencia estadística tiene el proyecto
con el tamaño de muestra propuesto por el investigador, se le puede contestar: “casi la que usted quiera”.
20. Para hacer un test estadístico comprando dos proporción, la situación es en todo similar al caso de la
variable cuantitativa.
21. Se proyecta hacer un Ensayo Clínico, EC, comparando el % de curaciones de cierta enfermedad con un
fármaco y con placebo. Ninguna fórmula dice cuál es la cantidad “adecuada” de individuos que hay que
estudiar. Pero hay una fórmula que relaciona el N con 4 requerimientos, como ocurría con la situación
vista en la diapositiva anterior. Usando la fórmula con algunos valores concretos se crea la tabla de la
diapositiva, en la que vemos, por ejemplo, que
Si quiero tener prob 0.80 de que el test me de P < 0.025, si con placebo curan en torno al 10%:
Necesito 686 en cada grupo, si el fármaco cura 5 puntos porcentuales, pp, más que el placebo.
Pero nos bastan 199 si el fármaco cura 10 pp más que el placebo.
Y nos bastan 62 si el fármaco cura 20 pp más que el placebo.
Si quiero tener prob 0.99 de que el test me de P < 0.005, si con placebo curan en torno al 40%,
necesito 4693 en cada grupo, si el fármaco cura 5 puntos porcentuales, pp, más que el placebo.
Pero nos bastan 1184 si el fármaco cura 10 pp más que el placebo.
Y nos bastan 295 si el fármaco cura 20 pp más que el placebo.
Y si nos preguntan cual es la prob de encontrar P ≤ 0.005 si es πPlace ≈ 0.40 y πFarm ≈ 0.45 (D = 0.05) ,
la respuesta es que depende de cuantos individuos estudiemos. Con 2282 en cada grupo la potencia es
80% y con = 4693 individuos la potencia es 99%.
22. Vemos que variando los requerimientos dentro de valores que son todos razonable se obtienen valores
de N muy distintos. Una vez más hay que subrayar que cualquiera de esos N’s es válido y ninguno es “el
adecuado”.
253
23. El investigador que pregunta al estadístico cual es el N que debe usar, puede optar por estudiar, por
ejemplo, 100 individuos en cada grupo, es decir 200 en total, en base a sus recursos materiales y
humanos. Y publicará los resultados obtenidos, que sin duda aportan información útil, si se interpretan
correctamente.
24. Si, por ejemplo, se obtienen 32% de curados con el fármaco y 10% con el placebo, tenemos fortísima
evidencia a favor de que el fármaco es útil. Y tenemos 95% de confianza en que, en población, el % de
curaciones con el fármaco aventaja entre 11 y 33 puntos porcentuales, pp, al de placebo. El resultado es
muy contundente y no cabe discutir la potencia que tenía este proyecto antes de realizarlo.
25. NO tiene sentido preguntar por la potencia cuando ya se ha realizado el estudio y el resultado ha sido
muy significativo
26. Y hay que tener en cuenta que esa potencia depende, además del tamaño de la muestra, del valor P que
se aspire a conseguir. Y una vez fijados estos valores (tamaño 200 y valor P = 0.01) aun depende del %
que cura el placebo y del efecto real del fármaco (en cuanto supera al placebo). En la tabla vemos que
poniendo en la fórmula valores de estos conceptos compatibles con el resultado, con pequeñas
variaciones de ellos, se obtienen valores de la potencia muy diferentes. Es decir, NO, cabe hablar de la
potencia de un estudio, puesto que toma muchos valores diferentes.
27. Si ya se ha realizado el estudio y el resultado no invita a rechazar la hipótesis nula, el cálculo de la potencia
estadística suele dar resultados muy elásticos y poco útiles. Si, por ejemplo, se obtienen 28% de curados
con el fármaco y 25% con el placebo, no tenemos fuerte evidencia a favor de que el fármaco es útil. Los
datos son compatibles con que supere al placebo en 12 pp de curaciones. Y también lo son con que esté
6 pp por debajo del placebo. Si el investigador tiene motivos fundados para confiar en la efectividad del
fármaco, puede plantearse ampliar el estudio con más individuos.
254
28. Para decidir cuantos nuevos individuos procede estudiar ahora, podría tener cierta utilidad la fórmula que
relaciona N con los 4 requerimientos implicados. Pero de nuevo debemos ser conscientes de que esa
utilidad es muy moderada. Por ejemplo, se encuentra que si se hubieran obtenido 28% de curados con el
fármaco y 25% con el placebo, con muestras de 2000 (en vez de 200) el valor P del test sería P = 0.02.
Pero ese cálculo no garantiza que con esas muestras grandes aparecieran exactamente esos % de
curaciones en cada grupo, ni ese valor P .
29. Por otra parte, algunos revisores preguntan, cuál ERA la potencia de este estudio, que ha dado el
resultado publicado. Y de nuevo no hay respuesta única para esa pregunta. La tabla inferior derecha
muestra que la potencia puede tomar valores muy diversos. Todos los valores incluidos en estos cálculos
están en torno a los encontrados en la muestra y por ello todos los valores de la potencia encontrados
son válidos. Es obvio que con esos datos NO se responde a la pregunta sobre cuantos nuevos individuos
habría que usar.
30. De acuerdo con lo razonado anteriormente, si la potencia del estudio es muy baja, tiene todo el sentido
aumentar la muestra para ver si el fármaco es efectivo. Y si la potencia es alta, más bien sospecharemos
que el fármaco NO es efectivo (puesto que un estudio que tenía muchas prob de detectarlo no consiguió
hacerlo). El razonamiento es muy adecuado, pero en este contexto tiene poca utilidad. Pues vemos que
la potencia del estudio puede ser tan pequeña como 2% y tan grande como 86%. Y todo ello variando los
datos dentro de márgenes muy razonables, compatibles con el resultado obtenido.
N1 = 120 à RCV = 11 / 120 = 9% (3 y 18) N2 = 100 à RCV = 31 / 100 = 31% (21 y 42) P < 0.0001
No queda claro que el tamaño de muestra C D A
sea suficiente para detectar esa diferencias
¡¡¡ Error gravísimo !!!
Nos informan que a unos 80 metros bajo el suelo hay una bolsa de petróleo de gran valor.
Abel anuncia que va a hacer una prospección con una sonda de 30 m
No pertinente. Aunque el petróleo esté allí, la probabilidad de encontrarlo es casi nula
Cosme anuncia que hizo una prospección con una sonda de 75 m y no encontró petrol.
Puede que el petróleo esté allí y la sonda se quedó corta
David anuncia que hizo una prospección con una sonda de 75 m y…¡¡Encontró petróleo !!
¡¡¡ No podemos objetar que la sonda era insuficiente !!! 1.15i
31. En 2012 la REC, Revista Española de Cardiología, con factor de impacto que la sitúa a la altura de las
buenas revistas internacionales, recibió – con la intención de ser publicado - un trabajo en el que se
mostraba que el riesgo de patología cardiovascular subía muy significativamente (P < 0.0001) tras ocho
años residiendo en España, en emigrantes que habían llegado con bajo riesgo.
255
32. Uno de los revisores a quien la revista encargo la evaluación del trabajo respondió “no está claro que el
tamaño de muestra usado sea el adecuado para esa investigación”. Veremos que ese comentario
delata una profunda ignorancia en este problema. Y es muy grave que errores semejantes se produzcan
continuamente y que se transmitan de una generación a la siguiente sin ser detectados y evitados.
33. Este ejemplo nos ayudará a ver en qué momento y bajo qué circunstancias tiene sentido preguntarse si
el tamaño de muestra es suficiente y en cuáles esa pregunta está fuera de lugar. Sospechamos que a
unos 80 metros bajo el suelo hay una bolsa de petróleo de gran valor.
34. Si Abel anuncia que va a hacer una prospección con una sonda de 30 m, pensamos que ello no procede,
porque aunque el petróleo esté allí, la probabilidad de encontrarlo es prácticamente nula. Es un proyecto
con muy poca potencia.
35. Si Blas anuncia su intención de hacer una prospección con una sonda de 75 m, le diremos que no es muy
pertinente, porque aunque el petróleo esté allí es fácil que no lo encuentre.
36. Si Cosme anuncia que hizo una prospección con una sonda de 75 m, y no encontró petróleo, ello no
demuestra que no esté allí, porque aunque esté, con esa sonda es poco probable encontrarlo. Estaría
justificado hacer una nueva perforación con una sonda más larga. Nótese que hacemos esa reflexión tras
la realización del trabajo y habiendo fracasado en el intento de obtener petróleo.
37. Si David anuncia que hizo una prospección perforando con una sonda de 75 m, y que encontró petróleo,
NO podemos objetar que la longitud de la sonda es insuficiente. Es evidente que fue suficiente, puesto
que el petróleo fue encontrado.
38. Las objeciones sobre el tamaño de la sonda pueden tener sentido antes de realizar el estudio, o después
de realizado, si no se ha encontrado el petróleo. Pero si el resultado es positivo, no ha lugar a esas
objeciones. Por la misma razón, las objeciones sobre el tamaño de la muestra pueden tener sentido antes
de realizar el estudio, o después de realizado, si el resultado no es significativo. Pero si el resultado es
significativo, no ha lugar a esas objeciones.
¿Quién es mayor Abel o Leo? Abel es mayor que Ana y Ana mayor que Leo
No porque el profe lo diga No tomo apuntes Abel es mayor que Leo
1.15j
39. Volvamos a otro ejemplo ajeno al cálculo estadístico para entender lo que es la potencia estadística de
un proyecto. Creo que un collar de 100 perlas se me cayó en un frondoso jardín de 400 m 2. Si lo busco
solo yo, la probabilidad de encontrar las perlas es muy pequeña (esa acción tiene poca “potencia”).
256
Aunque estén allí es muy pequeña la probabilidad de encontrarlas. Si decimos, por ejemplo, que la
potencia es 0.04, queremos decir que de cada 100 veces que se diera esa situación y buscando de ese
modo, solo en 4 se encontrarían las perlas. No es aconsejable actuar de ese modo.
40. Si lo buscan 15 personas la probabilidad de encontrar las perlas es grande, si están allí (esa acción tiene
grande “potencia”). Si decimos, por ejemplo, que la potencia es 0.90, queremos decir que de cada 100
veces que se diera situación y buscando de ese modo, en 90 se encontrarían las perlas.
41. Si voy solo a la búsqueda y no las encuentro, no concluimos que las perlas están en otro lugar. Sabemos
que aunque estén allí es muy difícil que una sola persona la encuentre. Si tenemos razones sólidas para
creer que están allí, el fracaso de un solo buscador no atenta seriamente contra esa sospecha. Está
justificado hacer una nueva búsqueda con muchas personas, que tendría más potencia).
42. Pero si voy solo y encuentro las perlas, no podemos cuestionar el resultado. Antes de realizar la búsqueda
podemos valorar si cierto número de personas es o no adecuado. Pero una vez hecha, si ha tenido éxito
no tiene sentido discutir sobre si el número de buscadores era suficiente. Cuando un estudio da
resultado muy significativo NO cabe argumentar que el tamaño muestral era insuficiente.
43. Cuando un estudio con poca potencia da resultado poco significativo, el resultado “negativo” no constituye
evidencia a favor de la hipótesis nula. Está justificado hacer otro estudio con muestra mayor.
44. Los proyectos en los que el interés se centra muy específicamente en una variable respuesta, como suele
ocurrir en los Ensayos Clínicos, deben incluir una estimación del tipo de potencia que tiene el estudio para
la magnitud del efecto real que se sospecha o que se consideraría aceptable. Si esa potencia no es
“suficientemente alta”, no procede hacer el estudio. Pero debe estar claro que no hay una cifra que marque
la separación entre los valores aceptables de potencia y los que no lo son. Insistir en acordar un valor
frontera es un error conceptual grave y ocasiona dificultades injustificadas. Es obvio que una potencia de
99% es muy buena, mientras que una de 20%, es muy mala. Pero no hay una cifra que delimite ambas
situaciones. Y no hay ningún criterio “matemático” ni “científico” que justifique decidir un valor frontera. Si
el proyecto contempla analizar varias respuestas, la estimación de la potencia debería referirse a la más
importante de ellas.
45. Repetimos: En los artículos que reportan trabajos ya realizados, hay que distinguir dos casos:
Pero la utilidad práctica de este razonamiento se ve muy limitada por el hecho de que la
potencia del estudio no es una cantidad concreta, sino que depende de:
a) valor P que nos pongamos como objetivo,
b) el efecto real del factor y
c) la desviación de la variable.
Por ello al calcular la potencia podemos encontrar casi cualquier valor y por ello nos
ayuda muy poco a valorar si procede o no ampliar el estudio con nuevos casos.
En la diapositiva que sigue se repiten estas mismas ideas acompañadas con el ejemplo de la
joya que se pierde y de la bolsa de petróleo.
258
SIE 15: 2 Perdimos un diamante y sospechamos que se nos cayó en un frondoso jardín de 400 m 2
1. Si lo buscan 20 personas durante 5 horas y no aparece, aún tenemos fuerte sospecha de que está en ese jardín.
2. Si lo buscan 20 personas durante 5 horas y no aparece, tenemos fuerte sospecha de que NO está en ese jardín.
3. Digo que un estudio tiene mucha potencia estadística si tiene alta prob de detectar un efecto que realmente hay.
4. Digo que un estudio tiene baja potencia estadística si tiene escasa prob de detectar un efecto que realmente hay.
5. Si nos presentan un proyecto con baja potencia estadística, lo razonable es autorizarlo, porque es muy probable
que se encuentre lo que se está buscando.
SIE 15: 3 Perdimos un diamante y sospechamos que se nos cayó en un frondoso jardín de 400 m 2
1. Si nos presentan un proyecto con gran potencia estadística, lo razonable es autorizarlo, porque es muy probable
que se encuentre lo que se está buscando.
2. La potencia estadística de un estudio nos dice la prob de rechazar la Ho, cuando es cierta.
3. La potencia estadística de un estudio nos dice la prob de detectar que un fármaco es útil, si realmente lo es.
4. En general, la potencia estadística de un estudio es mayor cuanto más útil es el fármaco realmente
5. La potencia estadística de un estudio es menor cuanto mayor es la muestra.
2. La hipótesis nula, Ho, que se plantea es que “A” es inútil, es decir, que si se da a toda la población de enfermos
curarán 25%.
3. La potencia estadística del test es la probabilidad de obtener valor P del Test < 0.05 (si se acordó rechazar con ese
valor de P) si “A” es inútil.
4. La potencia estadística del test es la probabilidad de obtener valor P del Test < 0.05 (si se acordó rechazar con ese
valor de P) si “A” es útil, y para calcular la potencia hay que concretar cuan útil es, es decir, cuanto cura realmente.
5. Para calcular la potencia estadística hay que concretar cuanto cura realmente “A”.
SIE 15: 6 La enfermedad “E” cura espontáneamente en el 25% de los enfermos. Se dará la medicina “A" a una
muestra de N pacientes y se hará un test para ver si es útil.
La frase “Con ese tamaño de muestra la potencia de ese test es 0.90”
1. Tiene sentido y puede ser útil para el médico.
2. No tiene sentido porque falta, entre otras cosas, especificar a qué valor P del test se refiere (el valor P del test para
el que se acuerda rechazar la Ho).
3. No tiene sentido porque falta, entre otras cosas, especificar a qué efecto real de “A” se refiere.
4. Si A realmente cura un alto porcentaje de enfermos es más fácil que el test de valor P pequeño.
5. La frase válida sería del tipo de “Con este tamaño la potencia de ese test es 0.90 si el fármaco “A” cura realmente el
30% y queremos obtener valor P menor de 0.01 y la desviación estándar de la variable es del orden de 15”.
SIE 15: 7 En sanos la variable “X” tiene media: µ = 300. Para ver si en enfermos de “E” esa variable
está incrementada, es decir, si la µ de esos enfermos es mayor de 300, se tomará una muestra y a la vista
de la media muestral se hará un test para ver si es razonable rechazar la hipótesis nula. Los cálculos
muestran que si queremos tener potencia 0.90 de encontrar P < 0.01 y es µE = 320 y la desviación es 20,
necesitamos N = 14.
1. La hipótesis nula, Ho, que se plantea es que la media poblacional de los “E” es 300, µE = 300.
2. Potencia 0.90 quiere decir que tenemos probabilidad 90% de que sea µE > 300.
3. Potencia 0.90 quiere decir que tenemos probabilidad 90% de que la muestra tenga 14 individuos si es µE = 320 y la
desviación es 20.
4. Potencia 0.90 quiere decir que tenemos probabilidad 90% de que el test de P < 0.01, si es µE = 320 y la desviación
es 20 y usamos una muestra de N = 14.
5. Potencia 0.90 quiere decir que si repetimos muchas veces ese estudio, con N = 14 y es µE = 320 y S = 20, en 90
de cada 100 estudios sale P < 0.01
SIE 15: 8 En sanos la variable “X” tiene media: µ = 300. Para ver si en enfermos de “E” esa variable
está incrementada, es decir, si la µ de esos enfermos es mayor de 300, se tomará una muestra y a la vista
de la media muestral se hará un test para ver si es útil. Los cálculos muestran que si queremos tener
potencia 0.9 de encontrar P < 0.01 y es µE = 320 y la desviación es 20, necesitamos N = 14.
1. µE = 350 la potencia sería mayor de 0.90.
Si en realidad es
2. µE = 310 la potencia sería mayor de 0.90.
Si en realidad es
3. Si en realidad es µE = 310, obtendríamos P < 0.01 en menos de 90 estudios de cada 100.
4. Si hacemos el estudio con N = 50 la potencia sería mayor de 0.90, para P < 0.01 y µE = 320 y S = 20.
5. Si es desviación = 45 la potencia sería mayor de 0.90.
260
46. La potencia de un estudio es la prob de que al calcular la P del test se encuentre un valor menor de una
cantidad que el investigador se pone como objetivo. Ejemplo: se sabe que la variable “X” tiene DN, media
500 y desviación 60 en la población de sedentarios. Tomamos una muestra de N = 36 Deportistas y
planteamos como Ho que la media poblacional es 500. Queremos calcular la prob de que el test de,
por ejemplo, valor P < 0.001. Ese valor P corresponde a Z = 3 y ese valor Z aparece si la media muestral
es 530, ya que la desviación de las medias muestrales del muestreo repetido es 60 / 6 = 10 y por ello
261
sería Z = (530 – 500) / 10 = 3. ( ES IMPOSIBLE ENTENDER ESTE TEMA SI NO SE ENTIENDEN LOS TALLERES
PRIMEROS)
47. Por tanto, la prob de encontrar P < 0.001 es la prob de encontrar Media muestral > 530. Y la prob de que
aparezca Media Muestral > 530, depende de cual sea la media poblacional de deportistas, cosa que
el investigador no sabe. Si, por ejemplo, la media poblacional de deportistas es 510, en el muestreo
repetido de una población con media 510 las medias muestrales tomarán valores alrededor de 510 y con
desviación 10. Al valor 530 le corresponde Z = ( 530 – 510) / 10 = 20 / 10 = 2.
48. La prob de que la media sea mayor de 530 es la prob de que sea Z > 2 = 0.02. Si la media poblacional de
deport es 510, en 2 de cada 100 estudios con N = 36, aparecerá P < 0.001.
49. Si, por ejemplo, la media poblacional de deport es 520, en el muestreo repetido las medias muestrales
tomaran valores alrededor de 520 y con desviación 10. Al valor 530 le corresponde Z = ( 530 – 520) / 10
= 10 / 10 = 1. La prob de que la media sea mayor de 530 es la prob de que sea Z > 1 = 0.16. Si la media
poblacional es 520, en 16 de cada 100 estudios con N = 36, aparecerá P < 0.001.
50. Si, por ejemplo, la media poblacional de deport es 540, en el muestreo repetido las medias muestrales
tomaran valores alrededor de 540 y con desviación 10. Al valor 530 le corresponde Z = ( 530 – 540) / 10
= -10 / 10 = -1. La prob de que la media sea mayor de 530 es la prob de que sea Z > -1 = 0.84. Si la media
poblacional es de deport 540, en 84 de cada 100 estudios con N = 36, aparecerá P < 0.001.
51. Vemos, una vez más, que no cabe hablar de la potencia de un estudio sin especificar - además del tamaño
de la muestra - el valor de P del test y el valor real de la media a los que se refiere, así como la desviación
de la variable (si es cuantitativa).
262
52. La potencia también depende de la dispersión de la variable. Con desviación 60 veíamos que para
µD = 540, la potencia es 0.84. Pero con desviación 30 y el mismo N = 36, la desviación de las medias
muestrales del MR es 30 / √ 36 = 5. Para que sea Z = 3, tiene que ser MD = 515 (15 / 5 = 3). La Región
de Rechazo empieza en 515. Cualquier valor de la MD que valga mas de 515, da Z > 3 y por ello P <
0.001. Si la media poblacional de deportistas es 540: ¿Cuan probable es que una muestra de N = 36
deport tenga media mayor de 515? ZPOT = (515 - 540) /5 = -25 /5 = -5. Y P(Z> -5) = 0.9999999.
53. Pero con desviación 90 y el mismo N = 36, la desviación de las medias muestrales del MR es 90 / √ 36 =
15. Para que sea Z = 3, tiene que ser MD = 545 . La Región de Rechazo empieza en 545. Cualquier valor
de la MD que valga mas de 545, da Z > 3 y por ello P < 0.001. Si la media poblacional de deportistas es
540: ¿Cuan probable es que una muestra de N = 36 deport tenga media mayor de 545? ZPOT = (545 -
540) /15 = 5 /15 = 0.33. Y P(Z> 0.33) = 0.38.
263
54. Veamos ahora la potencia de un estudio con variable cualitativa dicotómica, por ej., curar o no curar, C.
En un población de viejos son sanos, “S”, el 20%. De la población de viejos que hacen deporte vamos a
tomar una muestra de N = 5. La Ho es que el % de S en los deportistas es igual, es decir πDep= 0.20. Si
es cierta, entre los 5 esperamos en torno a 1 S, pero puede haber mas o menos de 1. La distribución Bin
(5, 0.2) nos dice que si tomamos muestras de N = 5 no deportista, 33% de las muestras tendrán 0 S, 40%
de las muestras tendrán 1 S , ….. 3 por diez mil muestras tendrán los 5 S.
55. Si el deporte no aumenta el % de S, es difícil que salgan 4 S y muy difícil que salgan 5 S. Si decido que
rechazaré Ho (en favor de que es πFDep > 0.20 ) si es Valor P < 0.01, rechazaré si hay 4 ó 5 S. La pregunta
es: ¿ Cuan probable es que salgan 4 ó 5 S, si es πFDep = 0.40 ? Es lo mismo que preguntar cuan probable
es que salgan 4 ó 5 bolas rojas en una muestra tomada al azar de un caja donde son rojas el 40%. A esto
nos responde la Binomial (5, 0.4). Si es πFDep = 0.40 solamente en 87 + 10 = 87 estudios cada mil
encontraríamos 4 ó 5 S, y con ello P < 0.01. La potencia es solamente 8.7%, lo que nos sugiere no hacer
ese estudio.
264
56. Pero si es πFDep = 0.90, en 92 estudios cada cien encontraríamos 4 ó 5 S , es decir P < 0.01. La potencia
esb 92%, lo que anima a sí hacer ese estudio.
57. Pero si preferimos rechazar la Ho solo cuando sea P < 0.001, rechazaremos cuando haya 5 s. En ese
caso para πDEP = 0.40 la potencia es 0.01 y para πDEP = 0.90 la potencia es 0.59
¿Verdadera o falso?
X: 0 1 2 3 4 5
% .33 .40 .21 .051 .006 .0003 Tomaré muestra de N=5 deport H0: πS = 0.20
0.3 1- Si en la poblac de deport son S el 40%, la prob de que
0.2
0.1 haya 4 S es 0.006
2 - Si en la poblac de deport son S el 40%, y decido
rechazar Ho con P< 0.10, la potencia es 0.248
Bin (5, 0.4)
¿Verdadera o falso?
Potencia Estadística de un test con Bin (8, 0.25) y con Bin (8, 0.80)
MR de N = 8 de población con 25% de “Enf” La enfermedad Voy a probar
Bin (8, 0.25) Esperado: 2 “E” cura sin trat- el fármaco “F”
amie. en el 25% en N = 8 enf
X 0 1 2 3 4 5 6 7 8
% 0 .125 .25 .375 .50 .625 .75 .875 1
H0: πF = 0.25 y acordamos rechazar
FR .100 .267 .208 .087 .023 .004 .0004 10-5 Ho y decir que F es útil si es P < 0.05
Cola .367 .322 .114 .027 .004 .0004 1- Rechazaremos si curan mas de 4
Resume
266
X 0 1 2 3 4 5 6 7 8
% 0 .125 .25 .375 .50 .625 .75 .875 1
FR 10 -6 10 -4 .001 .009 .046 .147 .294 .336 .168
cola 10 -4 .001 .010 .056 .203
3. Si elegimos aceptar como evidencia fuerte contra la Ho valor P < 0.01, la Región critica de
Rechazo es X < 4 y si con K mueren realmente el 25%, la Potencia del estudio es 20.8%
4. Si elegimos aceptar como evidencia fuerte contra la Ho valor P < 0.01, la Región critica de
Rechazo es X < 4 y si con K mueren realmente el 25%, la Potencia del estudio es 88.6%
5. Si con K mueren realmente el 25%, de cada mil estudios en los que se da K a 8 enfermos, 886
darán menos de 4 muertos y de acuerdo con nuestros valor P exigido ( P < 0.01) consideraremos
el resultado como suficiente evidencia a favor de que K baja realmente el num de muertos
Z 0.10 0.20 0.25 0.50 0.75 1.00 1.50 2.00 2.50 3.00 3.50 4.00 4.50 5.00
P más allá .46 .42 .40 .31 .23 .16 .07 .02 .006 .001 .0002 .000 03 .000 003 .000000 3
La variable se distribuye en los varones N (200, 40). Sospechamos en mujeres tiene en promedio mayor valor:
µM > µV, es decir, D = µM - µV > 0. Tomaremos muestra de N = 16 mujeres. Asumimos que es V M.
1. Para D = 10, es decir media en la muestra de mujeres es 210, la potencia para obtener Valor P < 0.16
es 0.50
2. Si realmente es µM - µV, = 10, la mitad de los estudios que se hagan con N = 16 obtendrán valor P < 0.16
3. Si un medico hace muchos estudios, tomando 16 mujeres en cada uno, encontrará P < 0.16 en la mitad
268
5. Si realmente es µM - µV, = 10, 16% de los estudios que se hagan con N = 16 obtendrán valor P < 0.02