I' Estadística I

Descargar como docx, pdf o txt
Descargar como docx, pdf o txt
Está en la página 1de 48

REPÚBLICA BOLIVARIANA DE VENEZUELA

UNIVERSIDAD NACIONAL EXPERIMENTAL

“RAFAEL MARÍA BARALT”

PROGRAMA INGENIERÍA

MANTENIMIENTO MECÁNICO

HISTORIA DE LA ESTADÍSTICA; RECOLECCIÓN,


ORGANIZACIÓN Y PRESENTACIÓN DE LOS DATOS
ESTADÍSTICOS.

Informe de Investigación

Autora: Nicole Matos CI: 29755740

Tutora: Ing. Karina Eurresta

Cátedra: Estadística I

San Pedro, Junio del 2024


INTRODUCCIÓN

Aunque comúnmente se asocie a estudios demográficos, económicos y


sociológicos, gran parte de los logros de la estadística se derivan del interés
de los científicos por desarrollar modelos que expliquen el comportamiento
de las propiedades de la materia y de los caracteres biológicos. La medicina,
la biología, la física y, en definitiva, casi todos los campos de las ciencias
emplean instrumentos estadísticos de importancia fundamental para el
desarrollo de sus modelos de trabajo.

La estadística es una ciencia de aplicación práctica casi universal en


todos los campos científicos:

 En las ciencias naturales: se emplea con profusión en la descripción


de modelos termodinámicos complejos (mecánica estadística), en
física cuántica, en mecánica de fluidos o en la teoría cinética de los
gases, entre otros muchos campos.
 En las ciencias sociales y económicas: es un pilar básico del
desarrollo de la demografía y la sociología aplicada.
 En economía: suministra los valores que ayudan a descubrir
interrelaciones entre múltiples parámetros macro y microeconómicos.
 En las ciencias médicas: permite establecer pautas sobre la
evolución de las enfermedades y los enfermos, los índices de
mortalidad asociados a procesos morbosos, el grado de eficacia de un
medicamento, etcétera.

En este sentido, la estadística desempeña un papel crucial en diferentes


ámbitos de la vida, ya que nos proporciona herramientas para comprender y
analizar datos de manera efectiva. En una sociedad cada vez más basada en
la información, la capacidad de interpretar datos de manera adecuada se ha
vuelto esencial.
ESTADÍSTICA, EVOLUCIÓN DE LA ESTADÍSTICA, TIPOS DE
ESTADÍSTICA.

ESTADÍSTICA

La estadística es una rama de las matemáticas que permite recopilar,


organizar y analizar datos según la necesidad que tengamos, por ejemplo:
obtener un resultado, comparar información, tomar mejores decisiones,
entre muchas cosas más.

Al utilizar métodos, procedimientos y fórmulas, la estadística es


considerada la ciencia del análisis de datos y su principal objetivo es
ayudar a comprender lo que sucede en tu entorno a partir de la información
disponible.

La estadística sirve para conocer comportamientos, aspectos de la


industria y tendencias en el mercado.

Ese es el caso de Netflix, la plataforma de películas y series que reúnen


datos de sus usuarios para saber cuál es el contenido que más les gusta.
Así, pueden decidir cuál será la película del momento o qué serie lanzarán el
próximo mes.

Google también procesa millones de búsquedas a diario y las analiza


para mejorar la experiencia de sus usuarios.

Además, la estadística se utiliza en investigaciones médicas para


comprobar la eficacia de un medicamento, en la economía para saber cuáles
productos son los más consumidos, en la educación para conocer cuántas
personas están estudiando en el país. En fin, en diferentes campos y
situaciones en las que es necesario interpretar grandes cantidades de
información.
Ventajas de la estadística

- Te permite resumir grandes cantidades de información, hacer


comparaciones y predecir resultados.
- Es muy útil al momento de tomar decisiones acertadas o responder
preguntas sobre cualquier objeto de estudio.
- Si existen ideas o afirmaciones con pocos argumentos, puedes
apoyarte en la estadística para justificarlas.
- Es una gran herramienta para dar conclusiones objetivas en las
investigaciones.

EVOLUCIÓN DE LA ESTADÍSTICA

Enumerar a las personas con fines administrativos, por ejemplo, para la


recaudación de los impuestos o para el manejo de las fuerzas armadas, ha
sido una necesidad para los pueblos desde tiempos muy remotos. Hay
registros muy antiguos de censos realizados por las culturas babilónica (3800
años A.C.), egipcia (3340 A.C.) y hebrea (en el Libro de los números, 1300
A.C.)

La palabra "censo" es un legado romano; proviene del latín censere que


significa "estimar". El primer censo realizado en Roma fue el del año 212
A.C. bajo el gobierno de Servio Tulio. A partir de las cifras generadas en
esos censos, los sabios de la época producían algunos resúmenes
denominados "estadísticas", porque eran usadas por los "estadistas" u
hombres de estado.

En los siglos posteriores la estadística fue evolucionando, se integró como


parte del pensamiento científico y fue desarrollando un cuerpo de
conocimientos fundamentados en la teoría de probabilidades. Hitos en este
desarrollo son los trabajos de Bernoulli (s. XVII) cuyo libro póstumo sugiere
distintas aplicaciones a problemas económicos; el estudio de los errores
realizado por Gauss (s. XVIII), quien nos dejó la "distribución normal", una de
las distribuciones más empleadas en el modelaje de fenómenos
antropológicos, sociales, naturales y psicológicos, entre otros; y el concepto
de regresión de Galton (s. XIX), que obtuvo al tratar de justificar la teoría de
la evolución de Darwin.

El desarrollo de esta ciencia se aceleró en la primera mitad del siglo XX;


cuando surgieron el diseño estadístico de experimentos de Fisher, y la
estadística matemática con las bases de probabilidad dadas por matemáticos
como Kolmogorov. Esto inició una cadena de contribuciones que ha crecido
a la par de los grandes descubrimientos científicos y tecnológicos de nuestra
era, como el ADN, el avance del cómputo, las comunicaciones, y más
recientemente la secuenciación del genoma humano completo.

Dada la inmensa cantidad de datos que somos capaces de generar,


actualmente la estadística tiene nuevos retos, como el de rescatar, a través
de procedimientos inferenciales apropiados, la información que sea relevante
para el entendimiento de los fenómenos bajo estudio y la mejora en la toma
de decisiones. Este proceso produce nuevos descubrimientos en ambas
direcciones, al interior de la estadística misma y a su intrínseca capacidad
interdisciplinaria, y ha colocado a la profesión estadística como una de las
profesiones con mayor futuro, junto con las matemáticas, la actuaría y las
ciencias computacionales.

TIPOS DE ESTADÍSTICA

Hay dos tipos de estadística: la descriptiva y la inferencial.

1. Estadística descriptiva: te ayuda a organizar una gran cantidad de


datos a través de métodos, tablas y gráficos que te permiten presentar
los resultados de forma ordenada. Esta técnica es imprescindible
cuando se trata de cuantificar datos y hacerlos comprensibles. Este
enfoque solo estudia los datos recopilados en la investigación, sin
realizar inferencias ni hipótesis.
La gran ventaja de las estadísticas, incluyendo las estadísticas
descriptivas, es que pueden usarse para toda clase de: Estudios,
Investigaciones, Programas de desarrollo, Reportes, Proyectos
empresariales, Lanzamientos de productos, Estudios de mercado,
Análisis de rendimiento, entre muchas otras aplicaciones. En otras
palabras, sirven para todas las áreas, industrias y disciplinas que
utilicen datos cuantificables, ya sea la educación, la política, la
investigación, el marketing y la gestión empresarial, entre otras.

Tipos de variables: La estadística descriptiva trabaja en base a las


dos siguientes tipos de variables:

- Variable cuantitativa: Esta corresponde a todos los valores numéricos


exactos. Valores con los que puedes realizar operaciones y cálculos.
Pero veámoslo con ejemplos reales:
Edad: por ejemplo, 25 años, 40 años, 65 años.
Peso: 60 kg, 75.5 kg, 90.2 kg.
Ingresos: $2.000, $5.000, $10.000.
Tiempo de respuesta: representa el tiempo transcurrido entre una
acción y su consecuencia. Por ejemplo, 2 segundos, 5.5 segundos,
8.3 segundos.
Número de hijos: 0 hijos, 2 hijos, 4 hijos.
Como verás, todos y cada uno de estos casos pueden representarse
sin problemas en términos numéricos.
- Variable cualitativa: Esta se refiere a valores no definidos, valores que
no pueden plasmarse en número. O sea, los valores que la estadística
descriptiva busca definir.
Por ejemplo: Género. Estado civil. Color de ojos. Ocupación.

Parámetros estadísticos
Cuando hablamos de la estadística descriptiva, estos son los tres
parámetros más comunes:
1. Distribución de frecuencias.
2. Medidas de tendencia central.
3. Medidas de variabilidad.

Las 4 etapas de la estadística descriptiva


Para asegurar que nuestro modelo estadístico sea exitoso y nos
brinde resultados impecables, podemos seguir el siguiente paso a
paso:
1. Recopilación de datos
2. Organización de la información
3. Presentación y tabulación.
4. Análisis de resultados.

2. Estadística inferencial: La estadística inferencial es una rama de la


estadística que se enfoca en hacer conclusiones y generalizaciones
sobre una población a partir de la información obtenida de una
muestra de la misma.
Imaginemos que queremos saber la altura promedio de todos los
estudiantes de una escuela, pero sería difícil medir la altura de cada
uno de ellos. En cambio, podríamos medir la altura de una muestra de
estudiantes y usar esa información para hacer una inferencia sobre la
altura promedio de todos los estudiantes en la escuela.
Para hacer esta inferencia, aplicamos técnicas estadísticas a los datos
de la muestra para estimar el valor desconocido de la población (en
este caso, la altura promedio de todos los estudiantes). Estas técnicas
pueden incluir la estimación de parámetros de una distribución de
probabilidad, el cálculo de intervalos de confianza o la realización de
pruebas de hipótesis.
El objetivo principal de la estadística inferencial es hacer
generalizaciones precisas sobre una población a partir de una muestra
de datos obtenidos de esa población.
La estadística inferencial es útil porque no siempre es posible medir
todos los elementos de una población. Por lo tanto, la inferencia
estadística nos permite tomar decisiones y hacer predicciones
basadas en una muestra representativa de la población en lugar de
medir todos los elementos de la población.

Importancia de la estadística inferencial: La estadística inferencial


es importante por varias razones:
- Permite hacer generalizaciones precisas sobre una población a partir
de una muestra.
- Ayuda a tomar decisiones informadas.
- Es importante en los negocios y la industria.

Principales usos de la estadística inferencial: La estadística


inferencial se utiliza en una variedad de campos para hacer
predicciones y tomar decisiones basadas en datos. Aquí hay algunos
ejemplos de cómo se puede usar la estadística inferencial: En
investigaciones científicas, en negocios, en salud y en política.
Tipos de estadística inferencial: La estadística inferencial se divide
en dos categorías:
 Pruebas de hipótesis.
 Análisis de regresión.

Ejemplo de estadística inferencial


Un ejemplo sencillo de cómo se puede aplicar la estadística inferencial
a la investigación de mercados sería el siguiente:
Supongamos que una empresa quiere saber si los consumidores
están satisfechos con un nuevo producto que han lanzado al mercado.
Para hacer esto, la empresa puede seleccionar una muestra aleatoria
de consumidores y pedirles que califiquen el producto en una escala
del 1 al 10.

Una vez que la empresa tiene los datos de la muestra, puede utilizar
la estadística inferencial para hacer generalizaciones sobre la
población completa de consumidores que compraron el producto.
Por ejemplo, puede calcular el promedio y la desviación estándar de
las calificaciones de la muestra y usar estos valores para estimar la
calificación promedio de todos los consumidores que compraron el
producto.
La empresa también puede utilizar técnicas estadísticas para evaluar
la confianza en la precisión de sus estimaciones. Por ejemplo, puede
calcular un intervalo de confianza para la calificación promedio y
determinar la probabilidad de que la verdadera calificación promedio
de la población caiga dentro de ese intervalo.
La estadística inferencial se puede utilizar en la investigación de
mercados para hacer inferencias precisas sobre la opinión de los
consumidores sobre un producto o servicio, lo que puede ayudarte a
tomar decisiones informadas sobre cómo mejorar o promocionar tus
productos.

Diferencia entre estadística inferencial y estadística descriptiva


Ambos tipos de estadística son importantes en la investigación y
análisis de datos. La principal diferencia entre la estadística inferencial
y la estadística descriptiva es que esta se utiliza para resumir y
describir los datos de una muestra, mientras que la estadística
inferencial se utiliza para hacer generalizaciones precisas sobre una
población a partir de una muestra.
La estadística descriptiva se enfoca en describir las características
de una muestra, como la media, la mediana, la moda, la desviación
estándar y otros parámetros. Estos parámetros proporcionan una
comprensión básica de los datos y pueden utilizarse para resumir los
hallazgos de la muestra y hacer comparaciones entre diferentes
muestras.
Por otro lado, la estadística inferencial se utiliza para hacer
predicciones y tomar decisiones basadas en datos de una muestra
que se extrajo de una población. La estadística inferencial utiliza
técnicas como pruebas de hipótesis, intervalos de confianza y análisis
de regresión para hacer inferencias precisas sobre la población a
partir de la muestra. Esto permite que las conclusiones obtenidas de la
muestra se apliquen a la población en su conjunto.

ESTADÍSTICA ESTADÍSTICA
ASPECTO
DESCRIPTIVA INFERENCIAL
Hacer inferencias sobre
Resumir y describir
Propósito poblaciones a partir de
datos
muestras
Datos observados y
Datos utilizados Muestras de datos
recopilados
Estimar parámetros
Resumir, organizar y
Objetivo principal poblacionales y probar
visualizar datos
hipótesis
Estimaciones de
Medidas de tendencia
parámetros, intervalos
Resultados típicos central, dispersión y
de confianza y pruebas
gráficos
de hipótesis
Se aplica a toda la Se aplica a una
Población vs. Muestra
población de datos muestra de la población
No es necesario un El tamaño de la
Tamaño de muestra tamaño de muestra muestra es crítico para
específico la precisión
Estimar el promedio de
Calcular el promedio de
calificaciones en una
Ejemplo práctico las calificaciones en
población a partir de
una clase
una muestra
Puede haber error de
Menos propenso a muestreo y otros
errores debido a que errores debido a la
Riesgo de error
trabaja con datos extrapolación de
completos resultados de la
muestra a la población
Con un 95% de
El promedio de las confianza, estimamos
Ejemplo de resultado edades en un grupo es que el promedio de
de 35 años. edades en la población
es de 33 a 37 años.
MUESTRA, POBLACIÓN, DATOS, CLASIFICACIÓN DE
DATOS, FUENTES DE DATOS.

MUESTRA

Una muestra estadística (o en contextos referidos explícitamente a lo


estadístico, una muestra) se entiende como un subconjunto más o menos
representativo de una población estadística, aislado del resto con fines de
evaluación y estudio. Es decir, se trata de un fragmento de la totalidad de
elementos a estudiar, compuesta por un número más manejable de ellos,
seleccionados (idealmente) al azar.

La lógica detrás de la toma de una muestra estadística es que, dadas las


condiciones propicias, puede estudiarse un conjunto muy voluminoso a
través de porciones más pequeñas que resulten representativas, o sea, que
sean más o menos proporcionales al resto.

Por ejemplo, si deseamos estudiar el universo de los millones de


electores de un país, deberemos tomar una muestra lo suficientemente
amplia como para llevarnos, en un grupo reducido de unos pocos cientos de
personas, un reflejo de las opiniones políticas que hay en la población
entera. Así, de una población de millones de individuos, estudiaríamos una
muestra de cientos de ellos.

Dichas muestras se obtienen a través de diferentes técnicas estadísticas,


que garantizan a través de distintos mecanismos una aleatoriedad adecuada
para el menor sesgo posible en la selección, es decir, la mayor posible
objetividad que permita obtener aproximaciones válidas al universo
estadístico. Si, por el contrario, se obtiene una muestra sesgada, las
conclusiones posibles serán menos fidedignas y por lo tanto menos útiles.
Obviamente, toda muestra forma parte de una población, de modo que si se
tienen varias poblaciones, se deberán tener también varias muestras. El
muestreo es el proceso de obtención de una muestra estadística y es común
en disciplinas tan diferentes como la demografía, la biología o la política.

Características de una muestra estadística: A grandes rasgos, una


muestra estadística se caracteriza por lo siguiente:

 Forma parte de un conjunto mayor, que es la población


estadística o universo estadístico, de la cual es, idealmente,
representativa.
 Posee un número reducido y por lo tanto manejable de
elementos de interés estadístico, en comparación con la población
entera.
 Se elige al azar y a través de distintas técnicas de muestreo.
Puede ser más o menos fidedigna, dependiendo de esto último.
 Su tamaño es objeto de estudio matemático, a fin de garantizar
las proporciones justas para que resulte representativa del total.

Tipos de muestra estadística: Las muestras estadísticas se clasifican, en


primer lugar, en dos grandes grupos: probabilísticas y no probabilísticas,
cada uno con sus propia clasificación independiente.

1. Muestras estadísticas probabilísticas. Son aquellas que se escogen


a través de métodos más o menos aleatorios, para garantizar la menor
intervención de los criterios del investigador en la muestra. A su vez,
se clasifican en:
 Muestras aleatorias simples. Las más simples de todas, se
eligen absolutamente al azar entre la población. Es el caso, por
ejemplo, de un sondeo de opinión pública nacional para el cual son
elegidos algunos ciudadanos por su número de documento.
 Muestras estratificadas. Se eligen de manera aleatoria entre los
distintos estratos o niveles de clasificación en los que previamente
se ha organizado la población. Por ejemplo, se puede escoger la
muestra al azar entre los distintos rangos de edad de la población,
obteniendo así una muestra al azar, pero estratificada.
 Muestras por conglomerado. Similares a las estratificadas, se
eligen aleatoriamente entre un conjunto previamente determinado,
pero en este caso estos conjuntos no son fruto de los criterios del
investigador, sino que están dados de manera espontánea, natural.
Por ejemplo, una muestra de los vecinos de un barrio determinado,
o de los trabajadores de un determinado edificio.
2. Muestras estadísticas no probabilísticas. Son aquellas cuya
selección no está libradas al azar, sino a determinados criterios de
búsqueda del investigador, debido a limitantes que impiden un
muestreo mayor. Por ende, este tipo de muestras no son realmente
representativas del universo estadístico estudiado, pero permiten
obtener una aproximación, dotada de un cierto margen de error. Estas
muestras pueden ser de los siguientes tipos:
 Muestras intencionales. Aquellas que son escogidas de acuerdo
a los criterios del investigador, o sea, tomando aquellas que
considera darán mejores resultados, al ser más representativas.
Un ejemplo de ello es cuando un periodista pide opiniones a
ciertas personas que ha elegido de antemano.
 Muestras por conveniencia. Aquellas que son escogidas de
acuerdo a lo que está más a mano, o sea, limitadas a lo inmediato.
Es lo que ocurre, por ejemplo, cuando un representante de una
empresa ofrece sus productos a quienes pasen cerca.
 Muestras consecutivas. Aquellas que forman parte de un
recorrido del investigador, que va de grupo en grupo extrayendo
los datos para posteriormente constituir un todo. Un ejemplo de
esto lo constituyen los métodos de aproximación al público de
ciertos vendedores o promotores, en los que invitan a la gente a
detenerse para escuchar las virtudes del producto: algunos lo
hacen y otros no, y posteriormente el vendedor cambia de área. Al
final, se reunirán todos los datos de las distintas áreas en que
estuvo.
 Muestras por cuotas. Se trata de una combinación de las
muestras estratificadas y las muestras intencionales, ya que el
investigador elige a las personas que entrevistar de acuerdo a su
pertenencia (y representatividad) de un determinado estrato o
grupo determinado de antemano.

POBLACIÓN

Una población estadística (o, en un ámbito clara y abiertamente referido al


mundo de la estadística, simplemente como población), es el conjunto de
elementos que son de interés para un experimento, un estudio o una
consideración de algún tipo. Los elementos que lo componen pueden ser por
ejemplo individuos, animales, fenómenos u eventos.

De hecho, todas las formas de estudio estadístico aspiran a dar


información sobre una población determinada de antemano, ya sea real y
existente (como el total de votantes de un país), o hipotética (como el total de
veces que arrojemos al aire una moneda).

Por lo tanto, la población estadística representa el universo de los


elementos a considerar, o sea, su totalidad plena, y en ello se distingue de
una muestra estadística. Esta última es una porción de dicho universo, o sea,
un subconjunto de la población, que se toma para análisis ya que resulta
mucho más pequeño y manejable que el total, pero aun así representativo
del mismo.

Una población estadística se diferencia de una muestra estadística en que


esta última forma parte de ella, dado que una población equivale a la
totalidad de los elementos o individuos de interés para la investigación.
O sea, la población estadística es el universo estadístico: el todo, la masa
entera de posibles elementos de investigación.

Características de una población estadística: Una población estadística


se caracteriza por lo siguiente:

 Constituye un total de elementos de interés estadístico por


alguna razón, del cual se pueden tomar muestras representativas.
 Puede ser más o menos uniforme o heterogénea, y del mismo
modo puede estar constituida por elementos reales o imaginarios,
finitos o virtualmente ilimitados.
 No debe confundirse con muestra estadística.

Tipos de poblaciones estadísticas: Las poblaciones estadísticas se


clasifican en dos, de acuerdo a su finitud:

 Población estadística finita. Como su nombre lo indica, está


constituida por una cantidad delimitada y abarcable de elementos,
que en un instante determinado del tiempo equivale a un número
concreto. Por ejemplo: la cantidad de automóviles en circulación en
una ciudad un lunes por la mañana.
 Población estadística infinita. En cambio, este tipo de
poblaciones estadísticas poseen un número virtualmente ilimitado
de elementos, es decir, no tienen un fin determinado en un
momento dado, ya sea porque realmente son ilimitados, o porque
su número es tan grande, que jamás podríamos saberlo con
certeza. Por ejemplo: la cantidad de átomos de sodio en el
universo.

Subpoblación estadística:

Una subpoblación estadística es una porción de la población


estadística que puede ser considerada un universo en sí misma, dado que
sus integrantes comparten un rasgo exclusivo respecto del resto. Es
decir, una subpoblación estadística es una población dentro de la población,
que se genera al añadir rasgos específicos al criterio de selección.

Por ejemplo: en el universo de los ciudadanos europeos actuales, es


posible elegir distintas subpoblaciones de acuerdo a su nacionalidad
particular: italiana, francesa, española, alemana, etc. Dentro de cada una de
estas subpoblaciones, es posible volver a hacer lo mismo si consideramos
las subpoblaciones de alemanes varones y alemanes mujeres, por ejemplo.

DATOS

Una variable es una característica de los elementos u objetos que se


estudian. Y los datos son los valores que se obtienen para cada variable.

Al conjunto de las mediciones obtenidas para un determinado elemento u


objeto se le llama observación.

Existen dos tipos de datos: cuantitativos y cualitativos.

1. Datos cualitativos:
Los datos cualitativos representan una manera de denominar.
Comprenden etiquetas o nominaciones que identifican un atributo del
objeto que se estudia.
Ejemplo: Definirle un nombre a las especies; a cada subespecie; y a
cada ejemplar de las especies.
Permiten categorizar a los datos:
- Con una escala nominal: creando categorías.
- Con una escala ordinal: creando una jerarquía (1º, 2º, 3º).
No permiten realizar operaciones aritméticas.

2. Datos cuantitativos:
Los datos cuantitativos requieren valores numéricos que indiquen
cuánto o cuántos.
Ejemplos: La número de especies están en peligro de extinción. La
cantidad de toneladas de materias en suspensión se encuentran en el
aire.
Permiten generar estadísticos numéricos: media, promedio,
coeficiente de variación, etc.
La estadística como disciplina, en general, trata de datos cuantitativos
los cuales son antes cualificados por datos cualitativos.

CLASIFICACIÓN DE DATOS

La Clasificación de Datos implica categorizar o estructurar datos en orden


de importancia o relevancia. Generalmente la clasificación se realiza según
la criticidad de los documentos o según su sensibilidad (confidencial,
restringido, uso general y público). Clasificar la información es el primer paso
para después poder protegerla.
La Clasificación de Datos es la piedra angular en la gestión de la
información que permite minimizar el riesgo de fuga de datos.

El proceso de clasificación de datos no es un proceso sencillo ya que


requiere atención a los detalles y un control adecuado. Existen distintos
métodos de clasificación de datos disponibles, así como diferentes criterios
en la disposición de los datos de un repositorio. En su mayoría, estos
métodos son utilizados para ordenar datos no estructurados, los mismos que
componen la mayor parte de la información en una organización. Las
grandes cantidades de datos no estructurados significa grandes retos para
quien quiere clasificar.

Idealmente, cualquier proceso de clasificación de datos debería tomar en


cuenta los siguientes puntos:

1. Definición del propósito.


2. Creación de la Metodología.
3. Definición de Categorías y Criterios de Clasificación.
4. Definición de Resultados.

FUENTES DE DATOS

Los datos son la columna vertebral de cualquier trabajo de análisis


realizado en el proceso de investigación. Los datos son una colección de
hechos y números no organizados procedentes de diferentes fuentes.

En resumen, las fuentes de datos son lugares físicos o digitales donde


se almacena la información en una tabla de datos, un objeto de datos o algún
otro formato de almacenamiento.

Los datos pueden proceder de dos lugares: fuentes internas y externas.


La información recogida de fuentes internas se denomina «datos primarios«,
mientras que la información recogida de referencias externas se denomina
“datos secundarios”.

Para el análisis de los datos, todos ellos deben recogerse a través de la


investigación primaria o secundaria. Una fuente de datos es un conjunto de
hechos estadísticos y no estadísticos que un investigador o analista puede
utilizar para profundizar en su investigación.

Existen principalmente dos tipos de orígenes de la información:

 Estadística
 Censos

Los investigadores utilizan ambas fuentes en su trabajo. Los datos se


recogen a partir de ellas utilizando métodos de investigación primarios o
secundarios.

Ejemplo de fuentes de datos: Imaginemos una marca de moda que


vende productos en línea. El sitio web utiliza una base de datos de inventario
para determinar si un artículo está disponible. En este caso, las tablas de
inventario son una fuente de datos que la aplicación web utiliza para servir el
sitio web a los clientes.

Tipos de fuentes de datos: Estos son los tipos de datos más comunes:

 Fuentes de datos estadísticos: Las fuentes estadísticas son


encuestas y otros informes estadísticos utilizados con fines
oficiales. En ellas, se hacen varias preguntas a las personas, que
pueden ser cualitativas o cuantitativas. Las fuentes de datos
cualitativos no utilizan números, mientras que los cuantitativos sí.
 Fuentes de datos censales: Según este método, los datos se
toman del informe del censo publicado anteriormente. Es lo
contrario de las encuestas estadísticas. El método del censo
examina de cerca todas las partes de la población durante el
proceso de investigación.

Otras fuentes de datos: Además de las fuentes de datos anteriores,


también se tienen en cuenta otros orígenes a la hora de recopilar datos.
Éstas son:

 Fuentes de datos internas: Las referencias de datos internas son


cosas como informes y registros que se publican dentro de la
organización.
 Fuentes de datos externas: Cuando la recogida de datos se
produce fuera de la organización, se denomina fuente de datos
externa. En todos los sentidos, están fuera de la empresa. Como
investigador, puede trabajar en la recopilación de datos externos.
 Publicaciones gubernamentales.
 Publicaciones no gubernamentales.
 Servicios de sindicación.
 Fuentes de datos experimentales.
 CRD – Diseño completamente aleatorizado.
 RBD – Diseño de bloques aleatorios.
 LSD – Diseño de cuadrado latino.
 FD – Diseño factorial.
USO DE: ADICIÓN DE NÚMEROS ENTEROS, ADICIÓN DE
NÚMEROS DECIMALES, REDONDEO.

ADICIÓN DE NÚMEROS ENTEROS

La adición o suma es la operación matemática de composición que


consiste en combinar o añadir dos números o más para obtener una cantidad
final o total.

ADICIÓN DE NÚMEROS DECIMALES

Para sumar o restar decimales se colocan los números decimales uno


debajo del otro, haciendo que coincidan las unidades en la misma columna.
De esta manera, también tienen que coincidir las décimas, las centésimas y
la coma.

REDONDEO

El redondeo es la operación o proceso a través del cual se modifica un


número o dígito hasta que alcance un valor determinado de acuerdo a una
serie de normas. Durante el redondeo podemos optar por aumentar el valor
de una cifra, o de reducirlo a otro valor diferente.

Esta operación es muy frecuente en cualquier situación o contexto en la


que utilicemos los valores numéricos. Por ejemplo, lo usamos al hacer
operaciones matemáticas o financieras, así como en la contabilidad de una
empresa o como compradores en las distintas transacciones comerciales
que podemos realizar.

Aunque lo habitual es utilizar el redondeo en números con decimales,


también podemos usarlo para redondear una cifra a cualquier unidad que
queramos. Ya sea la unidad, la decena, centena o cualquier otra opción
numérica que queramos.

Por ejemplo, el número 55,1564 puede ser redondeado a estos valores:

55,16

55,20

55

60

Todos ellos son un redondeo válido, pues estamos reduciendo sus cifras
teniendo en cuenta distintos valores. Mientras que el primer valor numérico
redondea al alza en su tercer decimal, la penúltima cifra lo hace a la baja
eliminando todos los decimales.

¿Qué ventajas de aplicar el redondeo?

 Claridad y limpieza: nos permite obtener una imagen más clara


de lo que nos están contando al reducir la cifra a un valor más
sencillo de leer y estudiar.
 Facilita el trabajo al hacer cálculos: al reducir el tamaño de un
valor numérico, las operaciones matemáticas que se hagan con
esa cifra serán más simples y rápidos de realizar, agilizando de
esta manera el proceso de todas las operaciones que se hagan.
 Previene que se necesiten monedas inexistentes en el
mercado: al redondear a 2 decimales, el valor de un bien o
servicio, se logra que la cuantía pueda ser pagada de manera
física por el consumidor. No podemos realizar un pago de 5,153 €
si no existe una moneda de 0,003 €. En su lugar, sí que podemos
pagar el redondeo a 5,15 €.

¿Qué desventajas tiene aplicar el redondeo numérico?


 Errores de cálculo arrastrados: al modificar el valor de un
número al redondearlo a otra cifra diferente, los cálculos que se
hagan llevarán un error sobre la cifra real.
Esa es la única desventaja que tiene el redondeo. Aunque puede
parecer algo poco significativo, si se lleva a cabo con decenas,
centenares o miles de operaciones, algo muy posible en una
empresa, la diferencia puede ser considerable.

2 ejemplos habituales de redondeo a nivel comercial

 En nuestras compras y adquisiciones de bienes o servicios: si


compramos algo que vale 39,95 € y lo queremos pagar en efectivo,
es probable que hagamos un redondeo y le demos al vendedor 40
€. Es decir, que hemos redondeado el precio para facilitar la
operación a nuestro favor. Ahora solo tenemos que esperar la
vuelta, o el cambio, con la diferencia entre el precio y el dinero que
hemos dado
 En el cálculo de impuestos: tributos como el IVA o el impuesto
especial sobre los hidrocarburos son algunos de los más
habituales para un consumidor y son un ejemplo perfecto de
redondeo tributario. En esta situación, el importe se ve
incrementado un porcentaje que varía en función del impuesto
asociado, lo que hace que en la mayoría de ocasiones se generen
cifras con más de dos decimales. Así que, para que el
contribuyente pueda realizar el pago, se redondea la cifra a dos
decimales para su recaudación

Tipos de redondeo que se pueden aplicar


Es posible aplicar dos tipos de redondeo distintos, uno a la baja o por
defecto, y otro al alza o por exceso.

 Redondeo por defecto o a la baja: lo hacemos cuando reducimos


el valor de una cifra a un número más pequeño cuando su última
cifra relevante está entre el 0 y el 4. Por ejemplo, 6,132 se podría
redondear a 6,13 o 6,1.
 Redondeo por exceso o al alza: se da cuando aumentamos el
valor inicial de un número para simplificarlo. En este caso, si la
última cifra se encuentra entre 5 y 9, se hace un redondeo al alza
al siguiente número más cercano. Es decir, que el número 6,156
podría ser 6,16 o 6,20 en función del redondeo por exceso que
hagamos.

4 reglas de aplicación del redondeo

Aunque el redondeo es muy sencillo de realizar, hay unas reglas básicas


que debemos seguir para aplicarlo correctamente.

- Regla 1: si la última cifra del número que queremos redondear es


menor que 5, dejaremos sin modificar el último dígito. Por ejemplo:
5,554 sería 5,55.
- Regla 2: cuando la última cifra sea un 5 o superior, se aumentará el
valor al siguiente número más próximo. Por ejemplo: 5,556 se
convertiría en 5,56.
- Regla 3: si el último valor numérico es par, y tras él encontramos un 5
como siguiente cifra o un número cualquiera de 0, entonces se trunca
el número. Por ejemplo: 5,56500 y 5,565 se redondearía a 5,56.
- Regla 4: si el último número es impar y la siguiente cifra es 5 o un
número cualquiera de 0, se lleva a cabo un redondeo al alza en una
unidad. Por ejemplo: 2,21500 o 2,215 se transforma tras el redondeo
en 2,22.
Los datos estadísticos se presentan generalmente expresando el valor de
la frecuencia absoluta que toman las variables significativas de un estudio, ya
correspondan a una población o a una muestra. La frecuencia absoluta de un
valor o de una modalidad de una variable estadística es el número de datos
observados que presentan ese valor o modalidad. El cociente entre la
frecuencia absoluta de un valor o modalidad y el número total de datos es
llamado frecuencia relativa. También suelen presentarse los datos en forma
de porcentaje (es decir, en forma de razón de denominador 100).

Una razón se obtiene como el cociente entre dos cantidades numéricas


comparables. Si el cociente se refiere a dos cantidades que se indican en
unidades distintas, la razón recibe el nombre de tasa. Un ejemplo de tasa es
la densidad de población, que se define como el número de habitantes por
kilómetro cuadrado y que se aplica habitualmente en los estudios
demográficos.

Dada una suma de varios sumandos, si el cociente hace referencia a la


división numérica entre uno de los sumandos y la suma total, la cantidad
expresada se denomina proporción.

Ejemplo Práctico de la Regla de la Suma en Pruebas de Detección de


Drogas

Un ejemplo práctico de la regla de la suma se observa en el análisis de


pruebas de detección de drogas. Al seleccionar aleatoriamente a una
persona de un grupo de 300 sujetos examinados, se puede calcular la
probabilidad de que el sujeto haya dado positivo en la prueba o haya
consumido marihuana. La probabilidad se obtiene sumando los individuos
que dieron positivo y los que consumieron marihuana, y restando aquellos
que están en ambos grupos para evitar el conteo doble. Este cálculo resulta
en una probabilidad de 0.487. Este ejemplo demuestra la importancia de no
contar dos veces el mismo resultado y cómo la regla de la suma se aplica
sumando las probabilidades de cada evento individual y sustrayendo la
probabilidad de su intersección.

CLASIFICACIÓN DE DATOS, ORGANIZACIÓN DE DATOS,


INTERPRETACIÓN DE DATOS, TABULACIÓN, GRAFICACIÓN.
CLASIFICACIÓN DE DATOS

La Clasificación de Datos implica categorizar o estructurar datos en orden


de importancia o relevancia. Generalmente la clasificación se realiza según
la criticidad de los documentos o según su sensibilidad (confidencial,
restringido, uso general y público). Clasificar la información es el primer paso
para después poder protegerla.

La Clasificación de Datos es la piedra angular en la gestión de la


información que permite minimizar el riesgo de fuga de datos.

El proceso de clasificación de datos no es un proceso sencillo ya que


requiere atención a los detalles y un control adecuado. Existen distintos
métodos de clasificación de datos disponibles, así como diferentes criterios
en la disposición de los datos de un repositorio. En su mayoría, estos
métodos son utilizados para ordenar datos no estructurados, los mismos que
componen la mayor parte de la información en una organización. Las
grandes cantidades de datos no estructurados significa grandes retos para
quien quiere clasificar.

Guía y proceso de Clasificación de Datos

Idealmente, cualquier proceso de clasificación de datos debería tomar en


cuenta los siguientes puntos:

1. Definición del propósito: ¿Por qué quiere clasificar los datos? No


solo es vital comprender la importancia y objetivo de categorizar la
información si no también es necesario definir cómo identificará áreas,
usuarios y documentos de riesgo dentro de la organización. Los
objetivos por los cuales se decide clasificar la información pueden ser
diversos; quizá el proceso de clasificación facilitará el cumplimiento
con la normativa del país, quizá ayudará a optimizar la estrategia y el
uso de herramientas de ciberseguridad o incluso quizá, puede ayudar
como punto de partida para desarrollar planes de contingencia. Sea
cual fuere la razón que impulsa la clasificación es importante
responder las siguientes preguntas antes de plantearse un proyecto
de clasificación:
¿Cuáles son los riesgos asociados a no clasificar la información?
¿Está contemplado el uso de algún mecanismo o herramienta para
proteger la información una vez clasificada?
¿Qué dice la política de seguridad de la información de la
organización?
¿Tiene un plan de formación centrado en usuarios críticos?
¿Tiene definido el ciclo de vida de la información?
2. Creación de la Metodología: Se debe definir una metodología que
permita que la clasificación de datos funcione de manera efectiva. Es
importante definir quién realizará el trabajo de analizar datos antiguos,
nuevos datos y datos modificados. ¿Serán los empleados quienes
realicen este análisis? ¿Serán ciertos jefes? ¿Será el encargado de la
seguridad de la información? ¿Será una consultora especializada?
¿Será un software con inteligencia artificial? Para poder responder
estas preguntas es muy importante calcular las horas hombres que
cada opción representa y el costo de adaptar el servicio a la
organización.
3. Definición de Categorías y Criterios de Clasificación: Si se basa
en la estructura común de clasificación de datos; es decir en base a la
ISO 27001, las categorías y criterios deben encajar y ser adaptados a
su política.
4. Definición de Resultados: ¿Qué hacemos luego de la clasificación
de datos? ¿Cómo pretendemos utilizar los resultados del proceso?
Ahora que hemos puesto todo en su lugar, ¿en quién recaerá la
responsabilidad de mantener todo en orden? ¿Qué acciones deben
derivar de este ejercicio? ¿Quién hará el seguimiento
correspondiente? La persona o equipo que sea designado tiene que
ser altamente calificado y de confianza para evitar problemas de
carácter económico, legal o reputacional.

Prevención de fuga y pérdida de datos: Una fuga de datos suele ocurrir


cuando toda la información de la organización se almacena en un mismo
lugar. Cuando no está definido el ciclo de vida que cada tipo de documento
según su nivel de confidencialidad, la organización es vulnerable. El ciclo de
vida permite saber cómo y cuando se crea un documento (confidencial,
restringido, de uso interno o público), dónde almacenarlo, qué tratamiento
darle y finalmente cuando dispensar de él.

Tipos de Clasificación de Información: Existen diferentes tipos de


clasificación y cada uno cumple una distinta función. Vale la pena
enumerarlos:

- Ordenar los archivos para la seguridad de los datos, clasificándolos


en: Confidencial, Restringido, Uso Interno o Público.
- Clasificar los datos según el acceso de los usuarios.
- Clasificar los datos en categorías por su frecuencia de uso o criticidad.

Desafíos de la Clasificación de Datos: El proceso de clasificación de datos


puede verse afectado por algunos desafíos. Cada tipo de clasificación viene
con desafíos diferentes:

 Consultoría: Realizar un proceso de clasificación utilizando una


consultora especializada es una opción. El problema de clasificar
utilizando este tipo de servicios es que usualmente el proceso
abarca solo una pequeña muestra de la organización.
 Clasificación Manual: El desafío principal de la clasificación
manual consiste en lograr que el personal cumpla con la tarea de
categorización (misma que es aburrida, tediosa y repetitiva). En
vista de la naturaleza tediosa de una clasificación manual el
personal no suele priorizar esta actividad sobre otras tareas diarias
lo cual resulta en un proceso lento.
 Clasificación a través de tecnología (inteligencia artificial):
Aquí, el desafío consiste en que la tecnología se adapte a la
realidad y vocabulario de la empresa. Es importante que la
tecnología que se decida usar no afecte el desempeño de las
estaciones de trabajo. De igual manera es necesario que la
herramienta que se escoja pueda aprender de la reclasificación de
falsos positivos.

ORGANIZACIÓN DE DATOS

A medida que las organizaciones crecen, también lo hacen sus datos y


aplicaciones empresariales. Es probable que los distintos departamentos y
equipos utilicen diversas aplicaciones empresariales, lo que genera datos
dispares. Si estos datos no se organizan correctamente, pueden afectar a
todos los aspectos de la organización, desde la comprensión del público
hasta la comunicación con los clientes y la elaboración de informes sobre el
éxito de las actividades. Así pues, la organización de los datos es necesaria
para unificar la información y ayudar a la organización a funcionar de forma
óptima.

Pero la coordinación manual de datos es una tarea engorrosa. Una tarea


que se complica aún más cuanto mayor es la organización, sobre todo si se
empieza a utilizar el big data. La respuesta está en la organización
automatizada de datos...

¿Qué es la organización de datos?


La organización de datos es una forma automatizada de reunir datos
aislados almacenados en diversas fuentes. Unir los datos de estos sistemas
dispares los prepara para los procesos, el análisis y la interpretación, lo que
puede ayudar a la organización a tomar mejores decisiones basadas en
datos.

Problemas de los datos desconectados

Sencillamente, no se sabe lo que no se ve. Por lo tanto, si los datos se


almacenan en varias ubicaciones a las que no todos los departamentos
tienen acceso, se crean puntos ciegos y vacíos en el conocimiento de la
empresa, que dan lugar a los siguientes problemas.

 Datos duplicados: La falta de visibilidad de los datos significa que


a menudo se duplican. A medida que las organizaciones crecen,
este problema también suele hacerlo. Esto puede dar lugar a
resultados sesgados en los análisis o a una mala experiencia del
cliente si tiene varios datos de contacto.
 Análisis de datos deficientes: Los datos desconectados hacen
que sea muy difícil obtener información significativa de sus datos.
Esto puede afectar tanto a la información interna como a la
externa, desde el comportamiento de los clientes hasta el
funcionamiento de los departamentos. Esto dificulta la toma de
decisiones empresariales con conocimiento de causa.
 Pérdida de tiempo y recursos: El tiempo dedicado a localizar,
formatear y verificar los datos puede suponer una pérdida de
tiempo increíble para los empleados. Este tiempo podría
emplearse mejor analizando los resultados de los datos y
utilizándolos para fundamentar su estrategia empresarial y mejorar
la experiencia del cliente.
 Mala experiencia del cliente: La comunicación con el cliente
depende en gran medida de los datos. Desde el nombre y los
datos de contacto para la comunicación básica hasta datos
importantes y sensibles como los detalles de pago, pasando por
datos más matizados sobre el comportamiento del cliente, como el
uso del producto, las compras, las reseñas, las consultas y las
quejas. Proporcionar a un cliente información irrelevante o
incorrecta porque sus datos no se han orquestado correctamente
puede ser muy perjudicial.
 Mala colaboración entre equipos: Si diferentes equipos tienen
diferentes conjuntos de datos que están viendo, es difícil colaborar
adecuadamente. La gente creerá en los datos que tiene delante, lo
que puede provocar desacuerdos si difieren. O si los datos no
están presentes, pierden el tiempo compartiéndolos de un lado a
otro, lo que dificulta la productividad.
 Falta de innovación: Una visión incompleta de la información
dificulta la toma de decisiones estratégicas que conduzcan a la
innovación. La orquestación de datos puede ayudar a las
organizaciones a ver el panorama completo, lo que puede
ayudarles a probar nuevas técnicas e innovar. Y en el competitivo
panorama empresarial actual, es probable que quienes no innoven
se queden atrás.
 Incapacidad para automatizar procesos: Si hay brechas entre
los datos, se dificulta la automatización de los procesos y los datos
no pueden pasar eficazmente por el proceso. Esto puede
obstaculizar el progreso de su empresa si busca optimizar las
operaciones comerciales. Para garantizar que sus procesos
automatizados funcionen eficazmente, los datos, las aplicaciones y
los procesos deben estar todos orquestados.
¿Cuál es el valor de los datos conectados?

Por supuesto, algunos se preguntarán, ¿por qué no unificar los datos


poniéndolos todos en un mismo lugar? Pero migrar los datos a una única
fuente es una tarea gigantesca, si no imposible. Sin embargo, la organización
de datos puede unificar los datos almacenados en sistemas separados.

La organización de datos permite que todos los datos y la información


funcionen en sus aplicaciones y sistemas exclusivos, al tiempo que ofrece las
ventajas de la visibilidad, la velocidad y la precisión en toda la organización.
En última instancia, esta organización de los datos permite mejorar el análisis
para facilitar la toma de decisiones empresariales más acertadas.

 Reduzca costos: Si sus datos están organizados, no tendrá que


dedicar tiempo y dinero a localizarlos, recopilarlos, formatearlos y
verificarlos. Esto se hace automáticamente por usted. Además, los
datos organizados significan que no tiene que gastar dinero en
sistemas adicionales.
 Aumente la eficacia: Los datos organizados eliminan cuellos de
botella como el paso de datos de un lado a otro y cualquier dato
mal gestionado, lo que ahorra tiempo y significa que los usuarios
pueden dedicarse a la tarea que tienen entre manos más
rápidamente sin preocuparse de la recopilación y preparación de
datos.
 Permitir la innovación: Los conocimientos empresariales que se
obtienen de un análisis de datos adecuado y exhaustivo pueden
revelar nuevas oportunidades de negocio y ayudar a mantener
satisfechos a los clientes.
 Optimizar las operaciones empresariales: Disponer de la
imagen completa de los datos permitirá a los usuarios
empresariales tomar mejores decisiones basadas en datos.
Cuantos más datos tenga, más importantes serán. La organización
de big data puede ayudar a que la toma de decisiones sea más
eficaz y precisa.

INTERPRETACIÓN DE DATOS

Un buen proceso de interpretación de datos es fundamental para que


éstos sean utilizables. Nos ayudará a asegurarnos de que sacamos las
conclusiones correctas y de que actuamos en función de la información.

Sea como sea, los datos están por todas partes. Hay dos grupos y
organizaciones: los que se ahogan en datos o no los utilizan adecuadamente
y los que se benefician.

¿Qué es la interpretación de datos?

La interpretación de datos es el proceso de revisar los datos y llegar a


conclusiones relevantes utilizando varios métodos analíticos. El análisis de
datos ayuda a los investigadores a categorizar, manipular y resumir los datos
para responder a preguntas críticas.

En términos empresariales, la interpretación de datos es la ejecución de


varios procesos. Este proceso analiza y revisa los datos para obtener
conclusiones y reconocer patrones y comportamientos emergentes. Estas
conclusiones te ayudarán, como gestor, a tomar una decisión informada
basada en los números y con todos los datos a tu disposición.

Importancia de la interpretación de los datos

Los datos en bruto son inútiles si no se interpretan. La interpretación de


datos es importante para las empresas y las personas. Los datos recogidos
ayudan a:
 Tomar mejores decisiones: Cualquier decisión se basa en la
información disponible en ese momento. Cuando se sabe recoger
y comprender bien los datos, se pueden tomar mejores decisiones.
Podemos elegir con confianza un camino para nuestra
organización o incluso para nuestra vida en lugar de trabajar con
suposiciones.
Lo más importante es seguir un proceso transparente para reducir
los errores y el cansancio al tomar decisiones.
 Encontrar tendencias y tomar medidas: Otro uso práctico de la
interpretación de datos es adelantarse a las tendencias antes de
que alcancen su punto álgido. Algunas personas se han ganado la
vida investigando sectores, detectando tendencias y haciendo
luego grandes apuestas sobre ellas.
Con las interpretaciones de datos adecuadas y un poco de trabajo,
podemos captar el inicio de las tendencias y utilizarlas para ayudar
a nuestro negocio o a nosotros mismos a crecer.
 Mejor asignación de recursos: La última importancia de la
interpretación de datos es la capacidad de utilizar personas,
herramientas, dinero, etc., de forma más eficiente.
Gracias a una correcta interpretación de datos podemos descubrir
que un mercado que creía que encajaba bien es en realidad malo.
Esto puede deberse a que el mercado es demasiado grande para
tus productos, a que hay demasiada competencia o a cualquier
otra cosa.
Sea como fuere, podemos mover los recursos que necesitemos
más rápido y mejor para obtener mejores resultados.

Pasos para la interpretación de datos: He aquí algunos pasos para


interpretar los datos correctamente.
 Recoger los datos: El primer paso en la interpretación de datos
es reunir todos los datos relevantes. Para ello, primero hay que
visualizarlos en una barra, un gráfico o un diagrama circular. Este
paso tiene como objetivo analizar los datos con precisión y sin
prejuicios. Ahora es el momento de recordar cómo has realizado tu
investigación.
Aquí hay dos patrones de preguntas que nos ayudarán a
comprender mejor.
¿Hubo algún fallo o cambio que se produjera durante el proceso de
recolección de datos?
¿Has guardado alguna nota de observación o indicadores?
Podemos pasar a la siguiente fase cuando tengamos todos los
datos.
 Desarrolla tus descubrimientos: Se trata de un resumen de
nuestros descubrimientos. Aquí examinamos a fondo los datos
para identificar tendencias, patrones o comportamientos. Si
estamos investigando a un grupo de personas utilizando una
muestra de población, esta es la sección en la que examinamos
los patrones de comportamiento. Podemos comparar estas
deducciones con conjuntos de datos anteriores, conjuntos de datos
similares o hipótesis generales de nuestro sector. El objetivo de
este paso es comparar estas deducciones antes de sacar
conclusiones.
 Sacar conclusiones: Una vez desarrollados los resultados de los
conjuntos de datos, podemos sacar conclusiones basadas en las
tendencias descubiertas. Nuestras conclusiones deben responder
a las preguntas que motivaron nuestra investigación. Si no
responden, pregunta por qué; puede dar lugar a investigaciones o
preguntas adicionales.
 Dar recomendaciones: El procedimiento de interpretación de los
datos llega a su fin con esta etapa. Toda conclusión de
investigación debe incluir una recomendación. Como las
recomendaciones son un resumen de tus resultados y
conclusiones, deben ser breves. Sólo hay dos opciones para las
recomendaciones; podemos recomendar un curso de acción o
sugerir investigaciones adicionales.

Ejemplos de interpretación de datos

Aquí tenemos dos ejemplos de interpretación de datos que nos ayudarán a


entenderlos mejor:

1. Ejemplo: Digamos que nuestros usuarios se dividen en cuatro grupos


de edad. Entonces una empresa puede ver a qué grupo de edad le
gusta nuestro contenido o producto. Basándose en los gráficos de
barras o en los gráficos circulares, pueden desarrollar una estrategia
de marketing para llegar a los grupos no implicados o una estrategia
de alcance para hacer crecer su base de usuarios principal.
2. Ejemplo: Otro ejemplo de análisis de datos es el uso del CRM de
contratación por parte de las empresas. Lo utilizan para encontrar
candidatos, seguir su progreso y gestionar todo su proceso de
contratación para determinar cómo pueden automatizar mejor su flujo
de trabajo.

TABULACIÓN

La tabulación de datos es el conjunto de operaciones que permiten


presentarlos agrupados y, a su vez, en forma de gráficos o tablas.
Dicho de una manera más sencilla, la tabulación de datos es una técnica
utilizada en estadísticas que nos ayuda a organizar y mostrar la información
de manera clara, ya sea en gráficos o tablas. Gracias a este proceso
podemos agrupar los datos de forma que se puedan entender mejor.

Es un paso crucial en el análisis de datos, preparando el terreno para


técnicas más avanzadas como el análisis de inferencia. Por tanto, antes de
poder analizar los datos en profundidad, necesitamos organizarlos
cuidadosamente, y eso es precisamente lo que hacemos al tabularlos.

Origen de la tabulación de datos

A principios del siglo XIX, la estadística ya estaba centrada en la


recolección y clasificación de datos. William Playfair (1759-1823) fue el
creador de los gráficos lineales, de barras o de sectores que conocemos hoy.
Así, su utilidad es más que relevante para el análisis.

Respecto a la tabulación, este proceso se dio posteriormente como forma


de síntesis de esos datos recolectados y clasificados. Su automatización se
debe a Herman Hollerith (1860-1929), que creó una máquina con tarjetas
perforadas.

Con el tiempo, este método ha mejorado de forma considerable, sobre


todo con la aparición de la informática. Por otro lado, la creación de
aplicaciones como las hojas de cálculo o la utilización de softwares
específicos han permitido manejar grandes cantidades de datos.

Proceso de la tabulación de datos


El proceso de tabulación de datos dependerá del tipo de variable que
utilicemos. Es decir, si es cualitativa, cuantitativa, discreta o continua. En el
ejemplo veremos una aplicación práctica.

Variable cualitativa: Las variables cualitativas expresan categorías, por


ejemplo, titulación cursada. La tabulación de datos de este tipo es, quizá, la
más sencilla.

La tabla tendría, por un lado, el dato numérico. Por otro lado, se incluirían las
frecuencias absolutas (recuento de cada valor) y las frecuencias relativas
(cada absoluta dividida entre el total). Se añaden dos columnas más con las
frecuencias absolutas y relativas acumuladas.

Variable cuantitativa discreta: Estamos ante variables que se pueden


sumar, por tanto, se pueden calcular promedios, desviaciones típicas y otros
estadísticos descriptivos de posición, dispersión o forma. Lo que proponemos
es utilizar las mismas columnas que en el caso anterior.

Variable cuantitativa continua: Son variables que pueden tomar infinitos


valores. En este caso, la tabulación se realiza agrupando por intervalos.
Estos deben ser los suficientes para no perder demasiada información, pero
no demasiados. Se pueden utilizar fórmulas para calcular el número
adecuado de ellos.

Ejemplo de tabulación de datos con hoja de cálculo

Veamos, para terminar, un ejemplo realizado con una hoja de cálculo.


Hemos utilizado las variables número de hijos, edad y estatura.

Como cualitativa (ordinal) tenemos el número de hijos, en este caso.


Aunque se podrían sumar, no tiene sentido, ya que son tamaños de hogar
diferentes. Podríamos usar también variables nominales, que no siguen un
orden, como el sexo.

En el caso de las cuantitativas, la discreta sería la edad en años y la


continua es la estatura en metros y centímetros. La siguiente imagen
muestra los datos y nuestra propuesta de agrupación. Calculamos las
frecuencias absolutas (fi) y relativas (hi), así como las acumuladas (Fi y Hi).

Podemos decir que solo dos casos tenían cuatro hijos, lo que supone un
10% del total. Que los hogares con menos de tres hijos son el 70% (con uno
y dos hijos). Por ejemplo, que las personas con menos de 40 años fueron el
65%, o que los que medían 1,75 fueron cuatro (20% del total).

Como vemos, la tabulación de datos es importante para analizar la


información estadística. Además, como paso posterior, se pueden utilizar
diagramas de barras, líneas o sectores para una representación visual, y
más clara, de estos.

GRAFICACIÓN
El precio de la gasolina, de los alimentos, los porcentajes de impuestos, el
número de alumnos estudiando una carrera… El día a día nos rodea de
información, de datos que varían por una u otra razón. Al representar
mediante datos los distintos aspectos de la realidad podemos cuantificar,
analizar y comprender cómo evolucionan y se relacionan distintas variables.
Todo lo que puede ser medido, cuantificado, puede representarse a través
de los datos y, por tanto, a través de un gráfico.

Los gráficos estadísticos son las distintas maneras de representar series


de datos estadísticos de diverso tipo y origen para mostrar de manera visual
cómo evoluciona una o más variables en comparación con otras. Por
ejemplo, cómo ha evolucionado el precio del carburante durante un año o el
número de espectadores que recibe un cine y sus elecciones por género
cinematográfico durante una semana.

Los gráficos estadísticos son potentes herramientas para la visualización


de datos que permiten representar de manera accesible información
compleja. Consiguen presentar la información al usuario o lector de manera
clara y precisa, facilitando la comparación y la comprensión de la evolución
de distintas variables.

Además, pueden adaptarse al nivel del público al que van dirigido,


convirtiéndolos en una vía de gran utilidad para ofrecer información clara a
cualquier persona: desde los lectores de periódicos y revistas, hasta
estudiantes, docentes, divulgadores científicos o directivos de compañías
que desean mostrar el avance de su negocio.

¿Qué tipos de gráficos estadísticos hay?

A la hora de representar gráficamente una batería de datos se puede


optar por diferentes visualizaciones, según el tipo de datos, la cantidad de
información que desee aportarse al lector o la dificultad que plantee el tema a
expresar.

Las principales representaciones para gráficos estadísticos son:

 Gráfico de barras: Se utilizan para mostrar la evolución o


comportamiento de una variable en el tiempo. Se compone en
un sistema de coordenadas de ejes cartesianos —eje X y eje Y—
en el que barras rectangulares horizontales o verticales
representan gráficamente la variable elegida. Este tipo de gráfico
es habitual para representar, por ejemplo, los ingresos de una
compañía por trimestres de actividad o la evolución del PIB de un
país bien sea anual, semestral, trimestral… Permite introducir
diversas variables y observar su evolución paralela a lo largo del
mismo período de tiempo: en uno de los ejes se establece el
tiempo y el otro se levantan las barras marcando el valor que
corresponde a la variable.

 Gráfico de tarta o diagrama de sectores: Permite visualizar las


partes de un todo a través de una circunferencia dividida en
sectores o porciones. Por ejemplo, el porcentaje de alumnos de
una clase que realizan una determinada actividad extraescolar: del
100 % de los alumnos, un 15 % juega al baloncesto, un 10 %
aprende programación, un 15 % estudia un idioma, un 40 % juega
al fútbol y el 20 % restante agrupa otras actividades.

 Gráfico de líneas o diagrama de frecuencias: Este tipo de


gráfico es similar al de barras —los datos se ordenan en base a los
ejes cartesianos— y es útil para observar la evolución de una
variable. Por ejemplo: cómo ha variado la temperatura mínima y
máxima durante una semana. En uno de los ejes tendremos la
temperatura y en otro los días de la semana. Se marcan los
valores de la temperatura mínima y se unen con una línea
mostrando la oscilación; con otro color se representa de igual
forma la temperatura máxima. De un vistazo, el lector puede ver
cómo han oscilado ambas variables en un periodo de siete días.

 Gráfico de dispersión: El punto de partida son también los ejes


cartesianos que muestran todos los valores de la variable
dependiente y de la independiente, o de dos variables para
comprobar si existe relación. El resultado suele ser una nube de
puntos que muestra una dispersión o una concentración y ayuda a
los estadistas a determinar la relación o no entre las variables.
Estas representaciones gráficas permiten combinaciones diversas,
por ejemplo, representar unas variables en barras y otras en línea,
siempre que el tipo de datos a representar lo permita.

 Pictogramas: Otra variación son los pictogramas, gráficos donde


las barras o las líneas se sustituyen por dibujos que muestran
la temática de los datos que se están expresando en los gráficos:
si se representa la variación del precio de distintas frutas, el
pictograma puede elaborarse con dibujos de esas frutas.

¿Cómo elegir el tipo adecuado de gráfico para representar datos


estadísticos?
No todos los gráficos son adecuados para todas las variables . A la
hora de elaborar gráficos estadísticos es necesario manejarse con soltura
con las baterías de datos —su recopilación, fuentes, significado, unidad de
medida, etc., pero también conocer las herramientas y soportes más
adecuados para su visualización.

Si estás interesado en dominar las técnicas de infografía y comunicación


gráfica, puedes apostar por especializarte en esta área con un máster en
Comunicación y Visualización de Datos. Un programa como este permite a
sus alumnos aprender a interpretar, comparar y presentar los datos de forma
visual, atractiva y comprensible para los lectores y usuarios, siendo un gran
aporte como elementos individuales o como recursos de apoyo a otro tipo de
materiales, desde información en medios de comunicación a libros de texto.

CONCLUSIÓN
En conclusión, la estadística inferencial es una herramienta crucial para la
toma de decisiones informadas y basadas en datos en una amplia variedad
de campos.

Al permitir la generalización precisa de una muestra a una población más


grande, la estadística inferencial puede ayudar a los investigadores a obtener
información valiosa que de otro modo sería imposible de obtener. Sin
embargo, la precisión de los resultados de la estadística inferencial depende
en gran medida de la selección de una buena muestra.

Es importante que los investigadores seleccionen una muestra


representativa y adecuada para su investigación. Al hacerlo, pueden mejorar
la validez y fiabilidad de sus resultados, lo que a su vez puede ayudar a
garantizar que las decisiones que tomen estén respaldadas por datos
precisos y confiables.

En general, la interpretación de datos es un factor esencial en la toma de


decisiones basada en datos. Debe realizarse de forma regular como parte de
un proceso de interpretación iterativo. Los inversores, los promotores y los
profesionales de ventas y adquisiciones pueden beneficiarse de la
interpretación rutinaria de los datos. Es lo que haces con esos datos lo que
determina el éxito de tu negocio.

En nuestro día a día, la Estadística se ha convertido en una ciencia


aplicada a lo cotidiano que se utiliza como método efectivo para describir y
predecir con exactitud hechos y fenómenos de índole muy diversa: políticos,
sociales, psicológicos, sanitarios, biológicos, físicos y hasta deportivos. Y es
que a medida que ha ido aumentando la complejidad en el mundo, se hace
más difícil la toma de decisiones informadas y racionales sin tener un
conocimiento objetivo lo más preciso posible de los fenómenos y las
situaciones, para lo cual es necesario contar con la orientación que nos
proporcionan herramientas de análisis científico altamente confiables como
es la estadística, que nos permitan realizar elecciones acertadas y eficientes,
ayudándonos a resolver los problemas de la vida cotidiana. De ahí que
actualmente resulte imprescindible aprender y servirse de ella como forma de
minimizar la probabilidad de cometer errores.

En este sentido, la estadística desempeña un papel crucial en diferentes


ámbitos de la vida, ya que nos proporciona herramientas para comprender y
analizar datos de manera efectiva. En una sociedad cada vez más basada en
la información, la capacidad de interpretar datos de manera adecuada se ha
vuelto esencial.

En primer lugar, la estadística nos ayuda a tomar decisiones informadas.


Cuando nos enfrentamos a múltiples opciones, contar con datos estadísticos
confiables nos permite evaluar las diferentes alternativas de manera objetiva.
Por ejemplo, al comprar un producto, podemos consultar las opiniones de
otras personas y utilizar la información recopilada para tomar una decisión
fundamentada. Del mismo modo, cuando debemos decidir sobre una ruta
para evitar el tráfico, podemos utilizar datos históricos sobre el flujo de tráfico
en diferentes momentos del día para seleccionar la opción más conveniente.
Gracias a la Estadística podremos contar con las herramientas necesarias
para analizar y comparar diferentes opciones, aumentando así nuestras
posibilidades de tomar decisiones acertadas.

También podría gustarte