MEDIDAS ESTADÍSTICAS
Para
empezar a explicar este tema, voy a ejemplificar cómo se describen los números
de un conjunto dado y como las medidas de tendencia central, de dispersión y
las medidas de posición no centrales son de ayuda para el análisis estadístico
que se desea hacer.
v Clasificación de las Medidas Estadísticas
MEDIDAS DE
TENDENCIA CENTRAL
Conocidas
también como medidas de posición, permiten
determinar la posición de un valor respecto a u conjunto de datos, el mismo que
es representativo.
Si
corresponde a una población se llaman parámetros
y si pertenecen a una muestra se llama estadígrafos.
Supóngase que un determinado alumno obtiene 35 puntos en una
prueba de matemática. Este puntaje, por sí mismo tiene muy poco significado a
menos que podamos conocer el total de puntos que obtiene una persona promedio
al participar en esa prueba, saber cuál es la calificación menor y mayor que se
obtiene, y cuán variadas son esas calificaciones.
En otras palabras, para que una calificación tenga significado hay
que contar con elementos de referencia generalmente relacionados con ciertos
criterios estadísticos.
PROPÓSITOS DE LAS
MEDIDAS Milton Guillín,(2014)
- Mostrar
en qué lugar se ubica la persona promedio o típica del grupo.
- Sirve
como un método para comparar o interpretar cualquier puntaje en relación con el
puntaje central o típico.
- Sirve
como un método para comparar el puntaje obtenido por una misma persona en dos
diferentes ocasiones.
- Sirve
como un método para comparar los resultados medios obtenidos por dos o más
grupos.
MEDIA ARITMÉTICA PARA DATOS Milton
Guillín,(2014)
Se
calcula sumando todos los productos de marca clase con la
frecuencia absoluta respectiva y su resultado dividirlo por el número total de
datos:
MEDIA ARITMÉTICA
La
media aritmética mide el centro de gravedad de una distribución de datos. Pero
no representa el punto medio; sino el puto de equilibrio de la figura.
Si
los datos están agrupados en una distribución de frecuencias (variable discreta
o continua), se utiliza las siguientes fórmulas:
MEDIANA
La
mediana es aquel valor que no es superado ni supera a más de la mitad de las
observaciones del conjunto. Se encuentra situada en el punto medio o centro de
un conjunto de datos dispuestos en forma ordenada. La mediana se utiliza cuando
existen valores extremos (muy grandes o muy pequeños)
Se utiliza la
frecuencia absoluta acumulada. Siendo Nj la frecuencia acumulada menor que
supera a n/2, es decir:
Y en donde se consideran dos posibilidades:
Es
el valor que ocupa el lugar central de todos los datos cuando éstos están
ordenados de menor a mayor. La mediana se representa por Me. La
mediana se puede hallar sólo para variables cuantitativas.
- Cálculo de la mediana para datos
agrupados
La
mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta
la mitad de la suma de las frecuencias absolutas.
Es
decir tenemos que buscar el intervalo en el que se encuentre. N / 2
Luego calculamos según la siguiente fórmula:
Li-1 es el límite inferior de la clase donde se encuentra
la mediana.
N / 2
es la semisuma de las frecuencias absolutas.
Fi-1 es la frecuencia acumulada anterior a la clase
mediana.
fi es la frecuencia absoluta del intervalo mediano.
ti es la amplitud de los intervalos.
MODA (MD)
Si
la variable es de tipo discreto la moda o modo será al valor de la variable
(Yi) que tenga la mayor frecuencia absoluta ( ). En los datos de la tabla 1 el
valor de la moda es 3 ya que este valor de variable corresponde a la mayor
frecuencia absoluta =16.
Más adelante se presenta un ejemplo integrado para promedio, mediana, varianza y desviación estándar en datos agrupados con intervalos.
Más adelante se presenta un ejemplo integrado para promedio, mediana, varianza y desviación estándar en datos agrupados con intervalos.
Es
el valor más frecuente, o sea, el valor que tiene la propiedad de poseer una
frecuencia mayor (absoluta o relativa). La moda puede existir o no, incluso
puede haber más de una moda.
Si
los datos están agrupados y son el tipo discreto, entonces yi será la moda si nj es
la mayor frecuencia.
Md
= el valor más frecuente.
Es
el valor que representa la mayor frecuencia absoluta. En tablas de
frecuencias con datos agrupados, hablaremos de intervalo modal.
La
moda se representa por Mo.
Li Extremo inferior del intervalo modal (intervalo
que tiene mayor frecuencia absoluta).
fi Frecuencia absoluta del intervalo modal.
fi-1 Frecuencia absoluta del intervalo anterior al modal.
fi+1 Frecuencia absoluta del intervalo
posterior al modal.
t
Amplitud de los intervalos.
MEDIA GEOMÉTRICA (MG)
Es
el valor de la raíz de orden n del
producto de la n observaciones. Se justifica su uso cuando la distribución toma
una presentación asimétrica, y se desea transformarla en una aproximadamente
simétrica ya que se reduce la influencia de los valores mayores y destaca la de
los menores.
MEDIA ARMÓNICA (M-1)
Es el estadígrafo cuyo valor es el
recíproco o inverso del promedio aritmético de los recíprocos o inversos de los
valores observados.
MEDIA CUADRÁTICA (M2)
Se
define como la raíz cuadrada de la media de los cuadrados de la variable. Es
aplicable tanto para datos agrupados como para no agrupados. Su uso es poco
frecuente.
MEDIA CÚBICA (M3)
Pertenece a los
estadígrafos de posición, siendo una medida poco conocida
CENTRO RECORRIDO (CR)
Se
define como la media aritmética de los valores extremos de la variable. En una
distribución cualquiera se suma los extremos y se divide para dos.
Ø MEDIDAS DE
DISPERSIÓN O VARIABILIDAD
El grado en que los datos numéricos
tienden a extenderse alrededor de un valor medio se llama variación o
dispersión de los datos. Se utilizan distintas medidas de dispersión o
variación, estas son:
RANGO
Medida de variabilidad
más simple, estable para muestras pequeñas, no así para muestras grandes. Es
muy utilizado en el control de la calidad. Depende de los datos extremos.
VARIANZA
La
varianza de las observaciones X1, X2,…,
Xn es el promedio del cuadrado de las distancias entre cada observación
y la media del conjunto de observaciones, se la llama también como desviación
cuadrática media. En general, cuando más dispersas sean las observaciones,
mayores serán las desviaciones respecto a la media, por lo tanto, el valor
numérico de la varianza.
DESVIACIÓN TÍPICA O ESTÁNDAR (s)
La
desviación típica de u conjunto de valores X1, X2,…, Xn se define como la raíz
cuadrada positiva de la varianza. La Varianza está expresada como unidades al cuadrado de la
variable que se estudia. Mientras que la desviación
COEFICIENTE DE VARIACIÓN (CV)
El
coeficiente de variación de un conjunto de valores X1, X2,…, Xn se define como
el cociente de la desviación típica y la media de dicho conjunto. Es una medida
relativa que resulta de utilidad al comparar la cantidad de variación en grupos
de datos que tengan la misma varianza, peor medias aritméticas diferentes.
DESVIACIÓN MEDIA (DA)
Es
igual a la media de los valores absolutos, o módulos de las desviaciones
respecto a la media aritmética (Ma). Se aplica cuando la distribución tiene
ramas largas, es decir, cuando los valores extremos son frecuentes.
DESVIACIÓN MEDIANA (DE)
Es
la media de los valores absolutos o módulos de las desviaciones respecto a a
mediana (Me)
COEFICIENTE DE ASIMETRÍA DE PEARSON
El
coeficiente de asimetría de Pearson mide a desviación respecto a la simetría
expresando la diferencia entre la media y la mediana en relación con la
desviación estándar del grupo de medidas.
MEDIDAS DE
POSICIÓN NO CENTRALES
Los cuartiles, quintiles, deciles y
percentiles, al igual que la mediana, divide una serie en partes iguales. La
mediana divide a la serie e dos partes iguales, los cuartiles en cuatro partes,
los quintiles en cinco, los deciles en diez partes y los percentiles en cien
partes iguales.
CUARTILES (Q)
Son
3 valores que distribuyen la serie de datos, ordenada de forma creciente o
decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra
el 25% de los resultados
Divide los datos en cuatro partes
iguales, y son tres cuartiles:
Q1, Q2, Q3; es decir: el 25%, 50% y
75%.
Siendo Q2 = Me = D5
QUINTIL (q)
Un quintil es
la quinta parte de una población estadística ordenada
de menor a mayor en alguna característica de esta.
GENTILES O PERCENTILES (P)
Un percentil representa el 1%, se
calculan 99 percentiles, donde casa percentil se representa por C1, C2,… C99.
Dividen los datos en 100 partes iguales. Se encuentran en forma extensa para
desarrollar e interpretar tablas de crecimiento físico y mediciones de destreza
e inteligencia.
Son
99 valores que distribuyen la serie de datos, ordenada de forma creciente o
decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el
1% de los resultados.
El proceso de cálculo es similar al
de los cuartiles y deciles.
DECILES (D)
Los
calores se dividen los datos en 10 partes iguales y se representan por: D1,
D2,… D9 Son variaciones de amplitud del
10% cuyos valores deseados son el primero al noveno.
Son 9 valores que distribuyen la serie de
datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en
los que cada uno de ellos concentra el 10% de los resultados.
El
proceso de cálculo es similar al de los cuartiles.
REPRESENTACIÓN
GRÁFICA DE LAS DISTRIBUCIONES Bernheim,(2000)
Aunque una tabla estadística encierra toda la información disponible, para
realizar una síntesis visual de los datos es recomendable pasarla a forma
gráfica. El principio de la representación de los caracteres es la
proporcionalidad de las áreas con las frecuencias absolutas. Se pueden utilizar
diagramas de sectores, o de rectángulos (denominado histograma).También
se pueden representar las frecuencias acumuladas, dando lugar a la denominada
curva de distribución, denotada por F(x).
Ejemplos en videos:


















