1 Estadistica Introduccion IES Abra Pampa

Descargar como pdf o txt
Descargar como pdf o txt
Está en la página 1de 6

ESTADISTICA

INTRODUCCION:
La Estadística, nace de las necesidades reales del hombre. La variada y cuantiosa información relacionada con éste y que es
necesaria para la toma de decisiones, hace que la estadística sea hoy, una importante herramienta de trabajo.
Entre las tareas principales de la Estadística, está el de reunir la información integrada por un conjunto de datos, con el
propósito de obtener conclusiones válidas del comportamiento de éstos, como también hacer una inferencia sobre
comportamientos futuros.
En cuanto al uso y la aplicación, puede decirse que abarca todo el ámbito humano encontrándose en las relaciones
comerciales, financieras, políticas, sociales, etc. siendo fundamental en el campo de la investigación y en la toma de
decisiones.
Es así también como en el área de las empresas de servicio y manufactura es posible realizar un análisis profundo del
proceso estadístico al control de la productividad y de la calidad.
DEFINICION: Es la ciencia cuyo objetivo consiste en acumular, analizar e inferir conclusiones a partir de los datos
disponibles en un sistema conocido.
La estadística se puede dividir en dos ramas: Estadística Descriptiva y Estadística Inferencial.

 ESTADISTICA DESCRIPTIVA: Es el conjunto de métodos que permiten recolectar, organizar, representar


gráficamente e interpretar un conjunto de datos de manera de describir una o varias características en estudio.
Es decir que comprende cualquier cosa que se haga con los datos y que este diseñada para resumirlos, o
describirlos, sin tener que ir más lejos, es decir sin intentar deducir nada que escape a los datos mismos.
 ESTADISTICA INFERENCIAL: Es el conjunto de procedimientos que permiten tomar decisiones con respecto
a una población, basándose en datos obtenidos de una muestra.
Hace posible la estimación de una característica de una población, o la toma de una decisión con respecto a una
población, con base únicamente en resultados muestrales.

La Estadística actúa como puente entre los modelos matemáticos y los fenómenos reales.

ESTADISTICA DESCRIPTIVA

Recolección de Datos

Organizar y resumir

Tablas, gráficos,
descripción, etc.estadisticas

los datos son MUESTRA

POBLACION Método de inferencia estadística

Conclusiones sobre la población

Recuento, relevamiento o recolección de datos

 POBLACION: Una población (o universo) es la totalidad de elementos, cosas u observaciones que se consideran o
en los cuales se está interesado. Se dice también que es un conjunto completo de todos los elementos que se van a
estudiar.
El número de observaciones en la población se define como tamaño en la población.
Son ejemplos de poblaciones:
 Alumnos que cursan 5to año en el colegio “Isaac Newton”
 Hectáreas sembradas con soja en un campo experimental.
 Temperaturas diarias mínimas durante un año en una determinada localidad.
 Los niños con problemas visuales en un determinado radio escolar.

 MUESTRA: Es un conjunto de individuos que componen una parte representativa de la población. Para que los
estudios realizados sobre la muestra sean válidos, la muestra debe ser representativa de la población.
 UNIDAD DE OBSERVACION O UNIDAD EXPERIMENTAL O INDIVIDUO: Es aquella sobre la cual se
efectúan mediciones o se intenta clasificar en categorías. Las unidades de observación pueden ser personas o
grupos de personas como familias, viviendas, etc. También pueden ser objetos tales como células san guineas,
plantas, animales, tornillos, etc. En el proceso de observación se registra, para cada unidad experimental alguna
característica y ésta observación constituye un dato
 VARIABLE: Una variable es cualquier característica que varia de una unidad experimental a otra en la población
o en la muestra.
Tipos de variables:
Variable

Cualitativa o categórica Cuantitativa o numérica

Escala nominal Escala ordinal Discreta Continua

Escala de intervalo Escala de razón

VARIABLES CATEGORICAS O CUALITATIVAS: No toman valores numéricos y describen cualidades o atributos.


Están definidas por las clases o categorías que las componen.
Son ejemplos: Clasificar una pieza como defectuosa o no defectuosa, sexo, nacionalidad, el titulo universitario, distinguir a
las personas en empleadas y desocupadas, etc.
VARIABLES NUMERICAS O CUANTITATIVAS: toman valores numéricos. Se pueden clasificar en discretas y
continuas.
Variables discretas: Las variables numéricas discretas toman valores que surgen de un proceso de conteo o por asignación
de ciertos códigos numéricos a las categorías de las variables cualitativas. Toman valores naturales.
Ejemplo: cantidad de árboles frutales atacados por un gusano en cada parcela. Cantidad de vacas vacunadas contra una
cierta enfermedad por establecimiento rural. Cantidad de espigas por planta. Cantidad de alumnos repitentes por curso.
Cantidad de personas por vivienda. etc.

Variables continuas: Toman valores en un intervalo que surgen de un proceso de medición de magnitudes continuas
(tiempo, longitud, etc.)
Ejemplo: Longitud de las espigas de trigo. Peso de determinados materiales. Temperaturas medias mensuales. Edad de una
persona, etc.

ESCALAS DE MEDICION
Los datos recopilados pueden también describirse de acuerdo al nivel de medición que se logre.
Una medición es establecer números o categorías o códigos a las observaciones mediante escalas adecuadas.
Las escalas se diferencian por propiedades de orden y distancia.
Los cuatro niveles de medición son del más débil al más fuerte: escala nominal, escala ordinal, escala de intervalo y
escala de razón
Escala Nominal: Si los datos que se observan para una variable cualitativa simplemente se clasifican en distintas
categorías que no implican orden y en consecuencia distancia, se tiene un nivel de medición nominal.
Ejemplos: sexo (varón, mujer); ocupación (docente, albañil, medico, etc.), color de cabello (negro, blanco, castaño).
Los datos no se pueden acomodar en un esquema de orden (como del más bajo al más alto). Puesto que los datos
nominales carecen de orden y no tienen un significado numérico, no se deben utilizar para hacer cálculos.
Escala Ordinal: Cuando los datos pueden acomodarse en algún orden, aunque no es posible determinar diferencias entre
los valores de los datos o tales diferencias carecen de significado.
Podemos establecer una escala ordinal: menor a mayor o mayor a menor.

Ejemplo: Un profesor universitario asigna calificaciones de A, B, C, D, E o F. Tales calificaciones se pueden ordenar,


aunque no es posible determinar diferencias entre tales calificaciones. Por ejemplo sabemos que A es mayor que B (por lo
que hay un orden) pero no podemos restar B de A (por lo que no se puede calcular la diferencia).
Las personas y el hábito de fumar se pueden ordenar en las categorías: Fumadores empedernidos, Fumadores Moderados, y
No Fumadores. (Mayor a menor)
Las personas y el nivel de educación podemos ordenarlas en: Educación Primaria, Secundaria, Terciaria y
Universitaria.(Menor a mayor)
En ningún caso sabemos con certeza cuanto mayor es una categoría con respecto a la otra pues no existe una medición de
distancia.
Escala de Intervalo: Se parece al nivel ordinal, pero con la propiedad adicional de que la diferencia entre dos valores de
datos cualesquiera tiene un significado y tiene el mismo significado en cualquier parte de las escala. sin embargo, los datos
en este nivel no tienen punto de partida cero natural inherente( donde nada de la cantidad esta presente) por el contrario el
cero no indica ausencia.
Ejemplo: Las temperaturas corporales de 98,2ºF y 98,6ºF son ejemplos de datos a nivel de medición de intervalo. Dichos
valores están ordenados,. y podemos determinar su diferencia de 0,4F.Sin embargo, no existe un punto de inicio natural.
Pareciera que el valor de 0ºF es un punto de inicio, si embargo; éste es arbitrario y no representa la ausencia total de calor,
es una temperatura más. Puesto que 0ºF no es un punto de partida cero natural, sería incorrecto decir que 50ºF es dos veces
mas caliente que 25ºF.
Los años 1000,2010, 1776 y 1492. (El tiempo no inicio en el año cero, por lo que el año 0 es arbitrario y no constituye un
punto de partida cero natural que represente “la ausencia de tiempo”).

Escala de Razón: es similar al nivel de intervalo, pero con la propiedad adicional de que si tiene un punto de partida cero
natural (donde el cero indica que nada de la cantidad esta presente). Para avalores a este nivel, tanto las diferencias como
las proporciones tienen significado.
Ejemplos: Lo siguientes son ejemplos de datos al nivel de medición de razón. Observe la presencia de un valor cero natural,
asi como el uso de proporciones que significan “dos veces” y “tres veces”.
Los pesos (en quilates) de anillos de compromiso de diamante (el 0 realmente representa la ausencia de peso y 4 quilates es
dos veces el peso de dos quilates).
Los precios de libros de texto universitario ($0 realmente representa ningún costo y un libro de $90 es tres veces mas caro
que un libro de $30).
Este nivel de medición se denomina de razón porque el punto de partida cero hace que las razones o cocientes tengan
significado
NOTA: Para diferenciar una escala de intervalo y de razón hay que preguntarse: si el 0 indica ausencia de algo es de
razón; si no indica ausencia de algo es de intervalo.

PARAMETRO: Es una medición numérica que describe algunas características de una población.
ESTADISTICO: Es una medición numérica que describe algunas características de una muestra.

Ejemplos: En la ciudad de SS de Jujuy hay 150 semáforos que los ciudadanos emplean en las intersecciones del transito, se
descubrió que un 20% de esos semáforos no funciona correctamente. La cifra 20% es un parámetro porque esta basada en
la población de todos los 150 semáforos para los ciudadanos.
Con base en una muestra de 877 ejecutivos encuestados, se encontró que el 45% de ellos no contrataría a alguien con error
ortográfico en su solicitud de empleo. Esta cifra del 45% es un estadístico, ya que esta basado en una muestra y no en la
población completa de todos los ejecutivos.

Organización y resumen de datos cualitativos o cuantitativos


Cuando se realiza un relevamiento o un censo, los datos de cada unidad de observación o individuo se anotan,
generalmente, en una ficha o planilla según la cantidad de datos requeridos.
En los experimentos estadísticos los datos recolectados pueden corresponder a una o población muestra. En ambos casos
los procedimientos de resumen de datos son análogos y designaremos por:
N= Tamaño de la población estudiada
n= Tamaño de la muestra (parte de la población)
Con el objeto de realizar un mejor estudio de los datos es necesario organizar éstos, mediante el uso de distribuciones de
frecuencia.
Generalmente como el numero de observaciones es muy grande o bien hay datos que se repiten, se trata de reducir la tabla
agrupando convenientemente los datos, para los cual se confecciona una tabla llamada Tabla de frecuencias o tabla de
distribución de frecuencias.
Una Tabla de frecuencias es una tabla que asocia a cada valor de la variable con el número de veces que se observa dicho
valor.
A) Tabulación de datos cualitativos
La construcción de una distribución de frecuencia de atributos o distribución de frecuencia de variable cualitativa es
simple, basta enumerar los diversos atributos con su respectiva frecuencia de ocurrencia.

a) Frecuencia Absoluta: Es el número de veces que se repite cada valor de la variable. La denotaremos con f i
NOTA: la suma de las frecuencias absolutas da el total de las observaciones.
b) Tamaño de la muestra (n): indica la cantidad de elementos que conforman la muestra, se obtiene sumando todas
las frecuencias absolutas.
m
n   fi m=número de clases distintas
i 1

c) Frecuencia Relativa: Es la proporción de veces que se repite cada valor de la variable. Dicho de otra manera es el
cociente entre la frecuencia absoluta de cada valor de la variable y el número total de observaciones. Se denota con
fr
fi
y se calcula: f r  .
N
NOTA: la suma de las frecuencias relativas es 1.
d) Frecuencia Porcentual: Es la frecuencia relativa expresada en porcentaje. Se denota con f p y se
fi
calcula: f p  .100%  f r .100%
N
NOTA: La suma de las frecuencias porcentuales es igual al 100%
Distribución de frecuencias
Variable X Frecuencia absoluta f i Frecuencia relativa f r Frecuencia Porcentual f p
X1 f1 f1 f1
.100%
n n
X2 f2 f2 f2
.100%
n n
X3 f3 f3 f3
.100%
n n
… … … …

Xk fk fk fk
.100%
n n
Total N 1 100%

Ejemplo: Consideremos un grupo de 40 adultos que son interrogados sobre su gaseosa preferida.
La unidad de observación es cada alumno. Cada una de las respuestas constituye un dato. La variable de interés que le
podriamos identificar con x = “Gaseosa preferida” es una variable cualitativa.

Variable de Interés Numero de adultos Proporción de Adultos Porcentaje de adultos


X=“Gaseosa fi fr fp
preferida”
COCA-COLA 16 0,4 40%
FANTA 8 0,2 20%
SPRITE 12 0,3 30%
NINGUNA 4 0,1 10%
total N=40 1 100%

B) Tabulación de variable cuantitativa


Distinguiremos dos casos:
B.1) Tabulación de variable discreta (que toma un conjunto pequeño de datos distintos)
Las tablas de frecuencia de variable discreta llevan cinco columnas donde los elementos que participan son los siguientes:
a) Frecuencia absoluta ( f i )
b) Frecuencia relativa ( f r )
c) Frecuencia porcentual ( f p )
d) Frecuencia absoluta acumulada ( Fi ) indica la cantidad de datos que se encuentran hasta cierta clase.
k
Fi   f i
i 1
Distribución de frecuencias
Variable X Frecuencia Frecuencia Frecuencia Frecuencia Absoluta
absoluta f i relativa f r Porcentual f p Acumulada Fi
X1 f1 f1 f1 f1
.100%
n n
X2 f2 f2 f2 f1  f 2
.100%
n n
X3 f3 f3 f3 f1  f 2  f3
.100%
n n
… … … … …

Xk fk fk fk k

n n
.100% f
i 1
i 1

Total N 1 100%

Ejercicio
Una empresa que tiene trabajadores se propone reestructurar las remuneraciones, se estudia los años de servicio de los
trabajadores determinándose los siguientes resultados:

N=50 tamaño de la población


Se pide:
a) Tabular la información.
b) ¿ Qué cantidad de trabajadores tiene 8 años de servicio ?.
c) ¿ Qué porcentaje de trabajadores tiene 6 años de servicio ?.
d) Si aquellos trabajadores que tengan a lo menos siete años de servicio reciben un aumento del 8%.¿ Qué porcentaje de
los trabajadores recibió dicho aumento?.
e) Si todos los trabajadores que tengan a lo más cinco años de servicio reciben una bonificación de $20000.¿ Qué
cantidad de trabajadores recibió dicha bonificación?.
f) Si la empresa decide otorgar una bonificación especial de $ 13200 por cada año de servicio.¿
¿Cuánto será el dinero necesario para cumplir dicha bonificación?.

B.2) Tabulación de variable continua o discreta

Para tabular una variable continua o discreta (que tome un gran número de datos distintos) se necesitan los siguientes
elementos:
a) RANGO: Se lo define como la diferencia que existe entre el mayor y el menor valor observado, que toma la variable
de estudio.
RANGO= X max- Xmin
b) Número de intervalos o clases(k): Es el número de grupos en que es posible dividir los valores de la variable. El
número de clases no debe ser ni muy grande ni muy pequeño, un número pequeño de clases puede ocultar la naturaleza
general de los datos y un número muy grande puede ser demasiado detallado como para revelar alguna información útil.
Como regla general se recomienda que el número de clases esté entre cinco y veinte. Hay una regla llamada que puede dar
una aproximación razonable Regla de Sturges para el número de clases, ella es:
N  2k 1
log N  log  2k 1 
log N   k  1 .log 2
log N
1  k
log 2
1
.log N  1  k
log 2
3,322.log N  1  k

3,322.log N  1  k donde  k  es el número de intervalos de clase


c) Amplitud del intervalo o amplitud de la clase (h)
Los intervalos tienen una determinada amplitud. se aconseja redondear al entero superior para evitar que el mayor o
menor valor que toma la variable queden excluidos.
La fórmula para calcular la amplitud es:
RANGO X max  X min
h 
k k
e) Límites de un intervalo: Son los valores extremos de una clase. El menor valor es considerado como el Limite
inferior y el valor que se obtiene sumando al límite inferior la amplitud del intervalo es el límite superior de la
segunda clase.
f) Límites reales de un intervalo Se obtienen calculando el promedio entre el límite superior de una clase y el límite
inferior de la clase siguiente.
g) Marca de clase (mi): Es el punto medio de un intervalo.
Distribución de frecuencias
Clases Marca Palotes Frecuencia Frecuencia Frecuencia Frecuencia Frecuencia
(Limites de de (conteo) absoluta f i relativa f r Porcentual f p Absoluta Relativa
un clases Acumulada Acumulada Fr
intervalo m F i
i
X1 m1 //////…. f1 f1 f1 f1 f1
.100%
n n n
X2 m2 //////…. f2 f2 f2 f1  f 2 f1 f 2
.100% 
n n n n
X3 m3 //////…. f3 f3 f3 f1  f 2  f3 f1 f 2 f3
.100%  
n n n n n
… …. …. … … … … …..

Xk mk //////…. fk fk fk k k
fi
n n
.100% f
i 1
i 1 n
i 1
1

Total N 1 100%
Ejemplo
Los siguientes datos corresponden a las notas obtenidas por 100 alumnos en un curso de Estadística

A) Construya la correspondiente distribución de frecuencia.


B) ¿En qué clase se concentra el mayor número de notas?
C) ¿Cuál es la frecuencia absoluta del cuarto intervalo? . Interprete el resultado
D) ¿Qué porcentaje de los alumnos tienen una nota inferior a 57?
E) ¿Cuántos alumnos tienen una nota superior a 46?.
F) Interprete la frecuencia acumulada del sexto intervalo.
G) Interprete la frecuencia relativa acumulada del quinto intervalo.

También podría gustarte