0% encontró este documento útil (0 votos)
34 vistas12 páginas

Tipos de Estadística

La estadística es la disciplina científica que se ocupa de recolectar, organizar y analizar datos para obtener explicaciones y predicciones sobre fenómenos observados. Se divide en estadística descriptiva, que describe los datos, y estadística inferencial, que hace predicciones y generalizaciones a partir de los datos teniendo en cuenta la incertidumbre. Dentro de la estadística inferencial se encuentra la estadística paramétrica, que asume ciertas distribuciones de los datos, y la no paramétrica,

Cargado por

joseph garcia
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
0% encontró este documento útil (0 votos)
34 vistas12 páginas

Tipos de Estadística

La estadística es la disciplina científica que se ocupa de recolectar, organizar y analizar datos para obtener explicaciones y predicciones sobre fenómenos observados. Se divide en estadística descriptiva, que describe los datos, y estadística inferencial, que hace predicciones y generalizaciones a partir de los datos teniendo en cuenta la incertidumbre. Dentro de la estadística inferencial se encuentra la estadística paramétrica, que asume ciertas distribuciones de los datos, y la no paramétrica,

Cargado por

joseph garcia
Derechos de autor
© © All Rights Reserved
Nos tomamos en serio los derechos de los contenidos. Si sospechas que se trata de tu contenido, reclámalo aquí.
Formatos disponibles
Descarga como DOCX, PDF, TXT o lee en línea desde Scribd
Está en la página 1/ 12

La estadística es una disciplina científica que se ocupa de la obtención, orden y análisis de un

conjunto de datos con el fin de obtener explicaciones y predicciones sobre fenómenos


observados.

La estadística consiste en métodos, procedimientos y fórmulas que permiten recolectar


información para luego analizarla y extraer de ella conclusiones relevantes. Se puede decir que es
la Ciencia de los Datos y que su principal objetivo es mejorar la comprensión de los hechos a partir
de la información disponible.

El origen de la palabra estadística se suele atribuir al economista Gottfried Achenwall (prusiano,


1719-1772) que entendía la estadística como “ciencia de las cosas que pertenecen al Estado”.

Tipos de estadística

Los tipos de estadística se puede subdividir en dos grandes ramas: descriptiva e inferencial.

 Estadística descriptiva: Se refiere a los métodos de recolección, organización, resumen y


presentación de un conjunto de datos. Se trata principalmente de describir las
características fundamentales de los datos y para ellos se suelen utilizar indicadores,
gráficos y tablas.
 Estadística inferencial: Se trata de un paso más allá de la mera descripción. Se refiere a los
métodos utilizados para poder hacer predicciones, generalizaciones y obtener
conclusiones a partir de los datos analizados teniendo en cuenta el grado de
incertidumbre existente.

La estadística inferencial se subdivide a su vez en dos grandes tipos: estadística paramétrica y no


paramétrica.

 Estadística paramétrica: Se caracteriza porque asume que los datos tienen una
determinada distribución o se especifican determinados parámetros que deberían
cumplirse. Así por ejemplo, en un análisis paramétrico podemos trabajar bajo el supuesto
de que la población se distribuye como una Normal (hay que justificar nuestro supuesto) y
luego sacar conclusiones bajo el supuesto que esta condición se cumple.
 Estadística no paramétrica: En ella no es posible asumir ningún tipo de distribución
subyacente en los datos ni tampoco un parámetro específico. Un ejemplo de este tipo de
análisis es la prueba binomial.

¿Qué son los datos agrupados y no agrupados?

o Los datos agrupados son los que se clasifican en categorías o clases, que es el número de


subconjuntos, tomando como criterio su frecuencia. Se trata de hacer más fácil y de
simplificar el manejo de grandes cantidades de datos y poder así establecer cuáles son
sus tendencias. Es recomendable agruparlos si se trata de 20 o más elementos que tienen
características comunes y pueden ser organizados en categorías, de esta forma se puede
conseguir manejar mejor y analizar en forma más profunda.

Los datos agrupados se organizan en una tabla de frecuencia, siendo esta tabla el número de
veces que cada valor se repite en la serie de datos.

o Por su parte, los  datos no agrupados  constituyen el conjunto de datos que no han sido
clasificados y que son presentados en una tabla de datos en forma individual, es decir que
no forman parte de un conjunto. De manera general constituye una cantidad de elementos
que es menor a 30 con muy poca o nula repetición.

Existen así las medidas de tendencia central para datos no agrupados, cuyos datos se
manejan en forma simple. Primero son recolectados los datos de la población de estudio y
estos son distribuidos en una tabla y analizados sin formar clases, que son el número de
subconjuntos en que se han agrupado los datos  con los mismos: cada dato mantiene su
propia identidad luego de que se ha elaborado la distribución de frecuencia.

Estos datos provienen directamente de la encuesta o estudio que se realiza, por ejemplo:

o Resultado de un examen de matemáticas: 4,8; 3,2; 3,5; 4,2; 3,1; 4,9.

o Edades de los empleados de una tienda: 19, 22, 18, 23, 21, 19, 18, 26, 24, 26.

¿Cuáles son las medidas de tendencia central para datos no agrupados?

Entre las medidas de tendencia central para datos no agrupados más utilizadas se


encuentran:

La media o media aritmética

Esta es la primera de las medidas de tendencia central para datos no agrupados de la que


hablaremos. Está determinada por el valor en promedio de una serie de conjunto de datos
numéricos. Con esta medida, los cálculos se realizan a través de la sumatoria de todos los
valores que se encuentren divididos, es el punto medio entre el valor máximo y valor mínimo
de las cantidades existentes.

La media es el centro de toda la distribución, ya que en esta son representados los valores
observados; por ejemplo, si existe un grupo de personas que tienen una estatura media de
1.60 metros, pues esta cantidad representa la estatura promedio de todos, a pesar de que no
es la estatura de ninguna de las personas en forma particular. 

La mediana o mediana aritmética

Esta es una de las medidas de tendencia central para datos no agrupados también conocida


como promedio aritmético: esta es el valor encontrado en el centro del conjunto de los
datos luego de haber sido ordenados.

La moda
Es la tercera de las medidas de tendencia central para datos no agrupados. Esta medida sirve
para identificar cuando un dato aparece continuamente, como también durante un periodo de
tiempo determinado. Es en sí el dato que más aparece en un grupo, también pudiendo existir
dos modas, conociéndose así como bimodal o, cuando hay más de dos modas recibe la
denominación de multimodal, que es cuando el máximo número de repeticiones se da para
tres o más números.  

Para calcular la moda se deben escribir los números del conjunto y luego escribir el número o
los números que se repiten mayor cantidad de veces. En un conjunto con los siguientes
componentes: 4, 5, 8, 8, 7, 6, 8; la moda es el número 8 al ser el número que se repite más.

Estas medidas de tendencia central para datos no agrupados te permitirán analizar los datos
de un conjunto.

Media Aritmética para Datos Agrupados

La media aritmética también se conoce como PROMEDIO, y básicamente se calcula como la


suma de todos los datos dividida entre el número total de datos. Pero esto aplica para datos
sueltos… es decir… NO AGRUPADOS…

Para los datos agrupados debemos considerar con un valor REPRESENTATIVO de cada
intervalo que se denomina MARCA DE CLASE y asumir que TODAS las cantidades de la
frecuencia absoluta se ven representadas por ese valor.

Analicemos el segundo intervalo de nuestro ejemplo: Debemos asumir que esas 11 personas


tienen 23.5 años
Y así para todos los intervalos de la tabla.

La formula para calcular la media aritmética en datos agrupados es la siguiente:

La media se calcula sumando todos los datos y dividiendo entre el total de ellos. Pero para
datos agrupados asumimos que por ejemplo en el primer intervalo esas 5 personas todas
tienen 14.5 años… entonces queda más práctico multiplicar 5×14.5 o lo que es lo mismo
14.5+14.5+14.5+14.5+14.5.

Tabla de frecuencias

Una tabla de frecuencias es un arreglo tabular de las frecuencias con que ocurre cada
característica en que se han dividido los datos. A continuación se dan algunas definiciones
relacionadas en la construcción de la tabla de frecuencias

Definición 1

Un intervalo de clase, es cada uno de los rangos de valores en que se ha decidido agrupar
parcialmente los datos con el propósito de hacer un resumen de ellos.

Definición 2
El número de mediciones que quedan dentro del intervalo se llama frecuencia del intervalo y
se denota por  . La diferencia entre el extremo mayor y el extremo menor del intervalo se
llama longitud o ancho del intervalo.

Definición 3

La marca de clase, es el punto medio del intervalo de la clase, se denota por   Su valor es
obtenido al promediar los extremos del intervalo.

Definición 4

La frecuencia absoluta acumulada de la clase  , es el número resultante de sumar la


frecuencia de la clase   con la frecuencia de las clases antecedentes y se denota 

Definición 5

La frecuencia relativa de la clase   es el cociente entre la frecuencia de la clase   y el número


de datos total, se denota por  .

Definición 6

La frecuencia acumulada relativa, de la clase   es el cociente entre la frecuencia acumulada de


la clase   y el número de observaciones, se denota por 

Todas las anteriores clases de distribuciones reciben el nombre de distribuciones empíricas.

Sugerencias para la construcción de la tabla de distribución de frecuencias 

La construcción de una tabla de frecuencias para datos cuantitativos presenta como su punto
de mayor importancia la determinación del número de intervalos (clases) que la conformaran.
Este número depende de la cantidad y de la naturaleza de los datos a resumir y del propósito
que se busca con el resumen. A continuación se presentan ciertas pautas para la construcción
de una tabla de frecuencias.

1. El número de intervalos debe escogerse de acuerdo con el número de datos.

2. Una vez escogido el número de intervalos, se determina la longitud   que deben tener los
intervalos, dividiendo el rango en el número de clases o intervalos.  rango/Número de
clases.

3. El primer intervalo debe contener el menor de los datos y el último el mayor.

Tabla de frecuencia o tabla resumen

La construcción de una tabla de frecuencia para datos cualitativos requiere solo del
conteo del número de elementos o individuos que caen dentro de cierta clase o
categoria.
¿Qué es la estadística inferencial?

Se llama estadística inferencial o inferencia estadística a la rama de la


Estadística encargada de hacer deducciones, es decir, inferir
propiedades, conclusiones y tendencias, a partir de una muestra del conjunto. Su
papel es interpretar, hacer proyecciones y comparaciones.

La estadística inferencial emplea usualmente mecanismos que le permiten llevar a


cabo dichas deducciones, tales como pruebas de estimación puntual (o de
intervalos de confianza), pruebas de hipótesis, pruebas paramétricas (como de
media, de diferencia de medias, proporciones, etc.) y no paramétricas (como la
prueba del chi-cuadrado, etc.). También le son útiles los análisis de correlación y
de regresión, las series cronológicas, el análisis de varianza, entre otros.

Algunos ejemplos de la aplicación de la estadística inferencial son:

 Sondeos de tendencia de voto. Antes de una elección importante,


diversas encuestadoras sondean la opinión pública para recabar datos
relevantes y luego, teniendo la muestra analizada y desglosada, inferir
tendencias: quién es el favorito, quién va segundo, etc.
 Análisis de mercado. Las empresas a menudo contratan otras empresas
especializadas en marketing para que analicen sus nichos de mercado a
través de diversas herramientas estadísticas y diferenciales, como
encuestas y focus  groups, a partir de las cuales deducir qué productos
prefiere la gente y en qué contexto, etc.
 Epidemiología médica. Teniendo los datos concretos de afectación de una
población determinada por una o varias enfermedades puntuales, los
epidemiólogos y especialistas en salud pública pueden llegar a
conclusiones respecto a qué medidas públicas son necesarias para evitar
que dichas enfermedades se esparzan y contribuir a su erradicación.

Clasificación de los tipos de muestreo

En la investigación existen dos técnicas principales de muestreo: las que están


basadas en la probabilidad y las que no. Vamos a analizar los diferentes tipos de
muestreo que puedes crear utilizando ambas técnicas para una
eficiente recolección de datos de tu próxima investigación.
 Tipos de muestreo no probabilístico

El muestreo no probabilístico es una técnica de muestreo donde las muestras se


recogen por medio de un proceso que no les brinda a todos los individuos de la
población las mismas oportunidades de ser seleccionados.

Existen 4 tipos de muestreo que puedes crear de esta manera.

1. Muestreo por conveniencia

El muestreo por conveniencia es el que se basa en los sujetos disponibles, como


detener a las personas en la esquina de la calle mientras pasan por ahí, es un
método de muestreo, aunque es extremadamente riesgoso y debe realizarse con
cautela.

2. Muestreo deliberado, crítico o por juicio

El muestreo deliberado, crítico o por juicio es aquel que se selecciona con base en
el conocimiento de una población o propósito del estudio.

3. Muestreo Bola de Nieve

Es adecuado utilizar un muestreo bola de nieve  cuando los miembros de una


población son difíciles de localizar, como las personas sin hogar, trabajadores
migrantes o inmigrantes indocumentados.
4. Muestreo por Cuotas

El muestreo por cuotas es aquel en la que las unidades son seleccionadas en una
muestra partiendo de las características predeterminadas, de modo que la muestra
total tenga la misma distribución de características que se supone que existen en
la población que está siendo estudiada.  

Tipos de muestreo probabilístico

El muestreo probabilístico es una técnica en la cual las muestras son recogidas


mediante un proceso que le brinda a todos los individuos de la población la misma
oportunidad de ser seleccionados.

Vamos a analizar los 4 tipos de muestreo probabilístico.

1. Muestreo aleatorio simple

El muestreo aleatorio simple es el método de muestreo básico utilizado en


métodos estadísticos y cálculos

2. Muestreo sistemático

El muestreo sistemático es aquel en el que los elementos de la población se ponen


en una lista y luego cada enésimo elemento de la lista se selecciona
sistemáticamente para su inclusión en la muestra.

3. Muestreo estratificado

El muestreo estratificado es una técnica de muestreo en la que el investigador


divide a toda la población objetivo en diferentes subgrupos o estratos, y luego
selecciona aleatoriamente a los sujetos finales de los diferentes estratos de forma
proporcional.

4. Muestreo por conglomerados

El muestreo por conglomerados puede ser utilizado cuando es imposible o


impráctico elaborar una lista exhaustiva de los elementos que constituyen a la
población objetivo. Sin embargo, generalmente los elementos de la población ya
están agrupados en subpoblaciones y las listas de esas subpoblaciones ya existen
o pueden ser creadas.

Intervalo de confianza

Un intervalo de confianza es una técnica de estimación utilizada en inferencia


estadística que permite acotar un par o varios pares de valores, dentro de los
cuales se encontrará la estimación puntual buscada (con una determinada
probabilidad).
Un intervalo de confianza nos va a permitir calcular dos valores alrededor de una
media muestral (uno superior y otro inferior). Estos valores van a acotar
un rango dentro del cual, con una determinada probabilidad, se va a localizar el
parámetro poblacional.

Intervalo de confianza = media +- margen de error

Conocer el verdadero poblacional, por lo general, suele ser algo muy complicado.
Pensemos en una población de 4 millones de personas. ¿Podríamos saber el gasto
medio en consumo por hogar de esa población? En principio sí. Simplemente
tendríamos que hacer una encuesta entre todos los hogares y calcular la media.
Sin embargo, seguir ese proceso sería tremendamente laborioso y complicaría
bastante el estudio.

Nivel de confianza

El nivel de confianza, en estadística, es la probabilidad máxima con la que


podríamos asegurar que el parámetro a estimar se encuentra dentro de nuestro
intervalo estimado.

El nivel de confianza se define como 1-alfa y sus valores más comunes son 90%,
95% y 99%.

En estadística es común tener que estimar parámetros, los cuales, nunca vamos a
poder afirmar al 100% que son el valor real que buscamos. Por ejemplo,
observando a simple vista la altura de 10 alumnos en una clase podríamos estimar
que la altura está entre 1,70 y 1,75.

Sería difícil saber con un 100% de certeza la altura media si no medimos a cada
alumno y hacemos los cálculos. Por el contrario, sí podríamos acotar un intervalo y
situar el valor dentro de este.

¿Qué es el error máximo de estimación?

Error máximo permitido (EMP) Tal y como figura en el VIM (Vocabulario


Internacional de Metrología) el Error Máximo Permitido es el valor extremo de
medida, con respecto a un valor de referencia conocido, para una medición,
instrumento o sistema de medida dado.

¿Qué es el tamaño de la muestra?

Una muestra es una selección de los encuestados elegidos y que representan a la


población total. El tamaño de la muestra es una porción significativa de la
población que cumple con las características de la investigación reduciendo los
costos y el tiempo.

Saber cómo determinar el tamaño de la muestra antes de comenzar una


investigación es un principio estadístico que nos ayuda a evitar el sesgo en la
interpretación de los resultados obtenidos.
¿Cómo calcular el tamaño de la muestra?

El tamaño de la muestra de una encuesta es muy importante para poder realizar


una investigación de manera correcta, por lo que hay que tener en cuenta los
objetivos y las circunstancias en que se desarrolle la investigación.

Recuerda que la finalidad es que las personas completen la encuesta y te otorguen


los datos que estás buscando.
Contraste de hipótesis

El contraste de hipótesis es un tipo de modelo utilizado en inferencia


estadística cuyo objetivo es comprobar si una estimación se adapta a los
valores poblacionales. En palabras menos abstractas, el objetivo de los métodos
de contraste de hipótesis es verificar si una estimación se adapta a la realidad de
forma ‘fiable’.

Los supuestos se denominan hipótesis paramétricas. Es decir, se estable un


criterio de decisión. Si con esa condición se acepta la hipótesis de referencia,
entonces podemos afirmar con cierta probabilidad que la estimación puede ser
muy cercana al supuesto valor real.

En todo contraste de hipótesis existen dos supuestos. La hipótesis nula (H0) que


recoge la idea de que una variable tiene un valor predeterminado, y la hipótesis
alternativa(H1), que es la que se acepta cuando se rechaza la hipótesis nula
(H0).

Ejemplo de contraste de hipótesis

Siguiendo con los resultados anteriores.

 Partido A: 32%
 Partido B: 51%
 Partido C: 17%

Contraste de hipótesis sobre que A tenga un 32% al 95% de confianza.

 H0: No tiene un 32% de votos con un 95% de probabilidad


 H1: Tiene tiene un 32% de votos con un 95% de probabilidad

En el caso que podamos rechazar la hipótesis nula (H0), podemos afirmar la


hipótesis alternativa. Es decir, en ese escenario, se podría asegurar que el partido
A tiene un 32% de votos con un 95% de probabilidad.

Una hipótesis estadística es una proposición o supuesto sobre los


parámetros de una o más poblaciones. Es importante recordar que las
hipótesis siempre son proposiciones sobre la población o distribución bajo
estudio, no proposiciones sobre la muestra.

También podría gustarte