sábado, 14 de mayo de 2016

MEDIDAS ESTADÍSTICAS CON DATOS AGRUPADOS

MEDIDAS ESTADÍSTICAS

Para empezar a explicar este tema, voy a ejemplificar cómo se describen los números de un conjunto dado y como las medidas de tendencia central, de dispersión y las medidas de posición no centrales son de ayuda para el análisis estadístico que se desea hacer.

v Clasificación de las Medidas Estadísticas




 MEDIDAS DE TENDENCIA CENTRAL

Conocidas también como medidas de posición, permiten determinar la posición de un valor respecto a u conjunto de datos, el mismo que es representativo.
Si corresponde a una población se llaman parámetros y si pertenecen a una muestra se llama estadígrafos.
Supóngase que un determinado alumno obtiene 35 puntos en una prueba de matemática. Este puntaje, por sí mismo tiene muy poco significado a menos que podamos conocer el total de puntos que obtiene una persona promedio al participar en esa prueba, saber cuál es la calificación menor y mayor que se obtiene, y cuán variadas son esas calificaciones.
En otras palabras, para que una calificación tenga significado hay que contar con elementos de referencia generalmente relacionados con ciertos criterios estadísticos.

    PROPÓSITOS DE LAS MEDIDAS Milton Guillín,(2014)

-      Mostrar en qué lugar se ubica la persona promedio o típica del grupo.
-      Sirve como un método para comparar o interpretar cualquier puntaje en relación con el puntaje central o típico.
-      Sirve como un método para comparar el puntaje obtenido por una misma persona en dos diferentes ocasiones.
-      Sirve como un método para comparar los resultados medios obtenidos por dos o más grupos.

    MEDIA ARITMÉTICA PARA DATOS  Milton Guillín,(2014)

Se calcula sumando todos los productos de marca clase con la frecuencia absoluta respectiva y su resultado dividirlo por el número total de datos:

   MEDIA ARITMÉTICA  

La media aritmética mide el centro de gravedad de una distribución de datos. Pero no representa el punto medio; sino el puto de equilibrio de la figura.
Si los datos están agrupados en una distribución de frecuencias (variable discreta o continua), se utiliza las siguientes fórmulas:


    MEDIANA

La mediana es aquel valor que no es superado ni supera a más de la mitad de las observaciones del conjunto. Se encuentra situada en el punto medio o centro de un conjunto de datos dispuestos en forma ordenada. La mediana se utiliza cuando existen valores extremos (muy grandes o muy pequeños)
Se utiliza la frecuencia absoluta acumulada. Siendo Nj la frecuencia acumulada menor que supera a n/2, es decir:
Y en donde se consideran dos posibilidades:

Es el valor que ocupa el lugar central de todos los datos cuando éstos están ordenados de menor a mayor. La mediana se representa por Me. La mediana se puede hallar sólo para variables cuantitativas.
-      Cálculo de la mediana para datos agrupados
La mediana se encuentra en el intervalo donde la frecuencia acumulada llega hasta la mitad de la suma de las frecuencias absolutas. 
Es decir tenemos que buscar el intervalo en el que se encuentre. N / 2
Luego calculamos según la siguiente fórmula:



Li-1  es el límite inferior de la clase donde se encuentra la mediana.
N / 2  es la semisuma de las frecuencias absolutas.
Fi-1  es la frecuencia acumulada anterior a la clase mediana.
fi  es la frecuencia absoluta del intervalo mediano.
ti  es la amplitud de los intervalos.

   MODA (MD) 

Si la variable es de tipo discreto la moda o modo será al valor de la variable (Yi) que tenga la mayor frecuencia absoluta ( ). En los datos de la tabla 1 el valor de la moda es 3 ya que este valor de variable corresponde a la mayor frecuencia absoluta =16.

Más adelante se presenta un ejemplo integrado para promedio, mediana, varianza y desviación estándar en datos agrupados con intervalos. 
Es el valor más frecuente, o sea, el valor que tiene la propiedad de poseer una frecuencia mayor (absoluta o relativa). La moda puede existir o no, incluso puede haber más de una moda.
Si los datos están agrupados y son el tipo discreto, entonces yi será la moda si nj es la mayor frecuencia.
Md = el valor más frecuente.
Es el valor que representa la mayor frecuencia absoluta. En tablas de frecuencias con datos agrupados, hablaremos de intervalo modal. 
La moda se representa por  Mo.
Li Extremo inferior del intervalo modal  (intervalo que tiene mayor frecuencia absoluta).
fi  Frecuencia absoluta del intervalo modal.
fi-1  Frecuencia absoluta del intervalo anterior al modal.
fi+1  Frecuencia absoluta del intervalo posterior al modal.
t  Amplitud de los intervalos.

  MEDIA GEOMÉTRICA (MG) 

Es el valor de la raíz de orden n del producto de la  n observaciones. Se justifica su uso cuando la distribución toma una presentación asimétrica, y se desea transformarla en una aproximadamente simétrica ya que se reduce la influencia de los valores mayores y destaca la de los menores. 

    MEDIA ARMÓNICA (M-1)

Es el estadígrafo cuyo valor es el recíproco o inverso del promedio aritmético de los recíprocos o inversos de los valores observados.

    MEDIA CUADRÁTICA (M2)

Se define como la raíz cuadrada de la media de los cuadrados de la variable. Es aplicable tanto para datos agrupados como para no agrupados. Su uso es poco frecuente.

    MEDIA CÚBICA (M3)

Pertenece a los estadígrafos de posición, siendo una medida poco conocida

    CENTRO RECORRIDO (CR)

Se define como la media aritmética de los valores extremos de la variable. En una distribución cualquiera se suma los extremos y se divide para dos. 

Ø MEDIDAS DE DISPERSIÓN O VARIABILIDAD

El grado en que los datos numéricos tienden a extenderse alrededor de un valor medio se llama variación o dispersión de los datos. Se utilizan distintas medidas de dispersión o variación, estas son:

    RANGO

Medida de variabilidad más simple, estable para muestras pequeñas, no así para muestras grandes. Es muy utilizado en el control de la calidad. Depende de los datos extremos.

    VARIANZA 

La varianza de las observaciones X1, X2,…,  Xn es el promedio del cuadrado de las distancias entre cada observación y la media del conjunto de observaciones, se la llama también como desviación cuadrática media. En general, cuando más dispersas sean las observaciones, mayores serán las desviaciones respecto a la media, por lo tanto, el valor numérico de la varianza.

    DESVIACIÓN TÍPICA O ESTÁNDAR (s)

La desviación típica de u conjunto de valores X1, X2,…, Xn se define como la raíz cuadrada positiva de la varianza. La Varianza  está expresada como unidades al cuadrado de la variable que se estudia. Mientras que la desviación 


    COEFICIENTE DE VARIACIÓN (CV)

El coeficiente de variación de un conjunto de valores X1, X2,…, Xn se define como el cociente de la desviación típica y la media de dicho conjunto. Es una medida relativa que resulta de utilidad al comparar la cantidad de variación en grupos de datos que tengan la misma varianza, peor medias aritméticas diferentes.

    DESVIACIÓN MEDIA (DA)

Es igual a la media de los valores absolutos, o módulos de las desviaciones respecto a la media aritmética (Ma). Se aplica cuando la distribución tiene ramas largas, es decir, cuando los valores extremos son frecuentes.

    DESVIACIÓN MEDIANA (DE)

Es la media de los valores absolutos o módulos de las desviaciones respecto a a mediana (Me)

    COEFICIENTE DE ASIMETRÍA DE PEARSON

El coeficiente de asimetría de Pearson mide a desviación respecto a la simetría expresando la diferencia entre la media y la mediana en relación con la desviación estándar del grupo de medidas. 

 MEDIDAS DE POSICIÓN NO CENTRALES

Los cuartiles, quintiles, deciles y percentiles, al igual que la mediana, divide una serie en partes iguales. La mediana divide a la serie e dos partes iguales, los cuartiles en cuatro partes, los quintiles en cinco, los deciles en diez partes y los percentiles en cien partes iguales.

   CUARTILES (Q)

Son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados
Divide los datos en cuatro partes iguales, y son tres cuartiles:
Q1, Q2, Q3; es decir: el 25%, 50% y 75%.
Siendo Q2 = Me = D5


    QUINTIL (q)

Un quintil es la quinta parte de una población estadística ordenada de menor a mayor en alguna característica de esta.

    GENTILES O PERCENTILES (P)

Un percentil representa el 1%, se calculan 99 percentiles, donde casa percentil se representa por C1, C2,… C99. Dividen los datos en 100 partes iguales. Se encuentran en forma extensa para desarrollar e interpretar tablas de crecimiento físico y mediciones de destreza e inteligencia.
Son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.
El proceso de cálculo es similar al de los cuartiles y deciles.

    DECILES (D)

Los calores se dividen los datos en 10 partes iguales y se representan por: D1, D2,…  D9 Son variaciones de amplitud del 10% cuyos valores deseados son el primero al noveno.
Son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados.
El proceso de cálculo es similar al de los cuartiles.

    REPRESENTACIÓN GRÁFICA DE LAS DISTRIBUCIONES Bernheim,(2000)

   Aunque una tabla estadística encierra toda la información disponible, para realizar una síntesis visual de los datos es recomendable pasarla a forma gráfica. El principio de la representación de los caracteres es la proporcionalidad de las áreas con las frecuencias absolutas. Se pueden utilizar diagramas de sectores, o de rectángulos (denominado histograma).También se pueden representar las frecuencias acumuladas, dando lugar a la denominada curva de distribución, denotada por F(x).
Ejemplos en videos:




No hay comentarios.:

Publicar un comentario