viernes, 22 de abril de 2011

GRÁFICA PARA DATOS CUANTITATIVOS: HISTOGRAMAS, POLÍGONOS DE FRECUENCIA Y OJIVAS

Cuando la naturaleza de la variable sea continua, entonces la representación gráfica más adecuada es el histograma o también conocido como histograma de frecuencias. Este tipo de gráficos podría utilizarse también en los casos de variables discretas con valores agrupados, aunque no resulta aconsejable hacer uso de los histogramas para variables discretas por los problemas que conlleva asimilar una variable discreta a otra de tipo continuo. A diferencia del gráfico de barras no hay separación entre los rectángulos formados por las clases adyacentes.
Un histograma se realiza también haciendo uso de un sistema cartesiano, donde sobre el eje de abscisas se llevan los valores de la variable. Pero ahora ya no se trata de valores puntuales, sino de intervalos, y sobre éstos se levantan rectángulos, que tienen por base la amplitud del intervalo y por altura su frecuencia. El área de esos rectángulos deberá ser siempre proporcional a la frecuencia, de manera que cuando la amplitud de los intervalos no sea constante, entonces la altura de los rectángulos no será la frecuencia sino lo que se conoce como densidad de frecuencia.

Polígono de frecuencia
Es un diagrama de líneas que representa los puntos medios y las respectivas frecuencias de clase. En una representación gráfica cerrada de una distribución de frecuencia. Es otra forma de graficar valores de una distribución de frecuencia de clase. No existe ninguna razón estadística para seleccionar los polígonos de frecuencia en vez de los histogramas, o viceversa, los histogramas, simplemente representan una manera de graficar y los polígonos de frecuencia otra; la diferencia radica en que una barra vertical rectangular representa una clase y su frecuencia en el histograma y un punto cumple la misma función en el polígono de frecuencia.
Características de los polígonos de frecuencias
No muestran frecuencias acumuladas. Se prefiere para el tratamiento de datos cuantitativos. El punto con mayor altura representa la mayor frecuencia. Suelen utilizarse para representar tablas tipo B. El área bajo la curva representa el 100% de los datos. El polígono de frecuencia está diseñado para mantener la misma área de las columnas. Analicemos una porción de nuestro gráfico para probar esta afirmación: Observe que cada línea corta una porción de la columna, pero a su vez, agrega una porción adicional. Ambas porciones son iguales (triangulo rectángulos iguales), manteniendo el área global en el gráfico. Ejemplo: Las temperaturas en un día de otoño de una ciudad han sufrido las siguientes variaciones:

Aquí un breve vídeo de como hacer un gráfico tipo polígono de frecuencias 


gracias ala colaboración de  
por el vídeo que en realidad esta muy explicado 

QUE SON LOS HISTOGRAMAS.
En estadística, un histograma es una representación gráfica de una variable en forma de barras, donde la superficie de cada barra es proporcional a la frecuencia de los valores representados. En el eje vertical se representan las frecuencias, y en el eje horizontal los valores de las variables, normalmente señalando las marcas de clase, es decir, la mitad del intervalo en el que están agrupados los datos.
En términos matemáticos, puede ser definida como una función inyectiva (o mapeo) que acumula (cuenta) las observaciones que pertenecen a cada subintervalo de una partición. El histograma, como es tradicionalmente entendido, no es más que la representación gráfica de dicha función.
Se utiliza cuando se estudia una variable continua, como franjas de edades o altura de la muestra, y, por comodidad, sus valores se agrupan en clases, es decir, valores continuos. En los casos en los que los datos son cualitativos (no-numéricos), como sexto grado de acuerdo o nivel de estudios, es preferible un diagrama de sectores.
Los histogramas son más frecuentes en ciencias sociales, humanas y económicas que en ciencias naturales y exactas. Y permite la comparación de los resultados de un proceso.
¿Cómo crear un histograma en Excel?
La creación de un Histograma en Excel puede ser una tarea muy sencilla, si es que conocemos ampliamente las herramientas que nos proporciona Excel. Sin embargo, sé que no todos tenemos el tiempo necesario para conocer las herramientas que nos proporciona para crear histogramas.
Es por eso que les dejo un excelente video donde se muestra como crear un histograma en excel utilizando tablas dinámicas.


GRACIAS POR LA COLABORACIÓN DE  
BUENO ME DESPIDO CON UN CORDIAL SALUDO HASTA LA PROXIMA



GRÁFICAS DE LÍNEAS DE SERIES DE TIEMPO

Toda institución, ya sea la familia, la empresa o el gobierno, necesita realizar planes para el futuro si desea sobrevivir o progresar. La planificación racional exige prever los sucesos del futuro que probablemente vayan a ocurrir. La previsión se suele basar en lo ocurrido en el pasado. La técnica estadística utilizada para hacer inferencias sobre el futuro teniendo en cuenta lo ocurrido en el pasado es el ANÁLISIS DE SERIES TEMPORALES.

SERIES TEMPORALES: Tratamos de hacer predicciones sobre esa magnitud, teniendo en cuenta sus características históricas o del pasado.
Se define una serie temporal (también denominada histórica, cronológica o de tiempo) como un conjunto de datos, correspondientes a un fenómeno económico, ordenados en el tiempo.
Por lo tanto, partiendo de lo anterior, se puede decir que los gráficos de series de tiempo reúnen el conjunto de datos de las observaciones ocurridas en un determinado período de tiempo, por lo que se permite observar más fácilmente el comportamiento de las variables en el tiempo ( si ascienden o descienden). La gráfica es un diagrama en el que el eje vertical (eje de las ordenas) denota el valor de la variable estudiada y el eje horizontal (eje de las abscisas) se observa el tiempo.

Bueno mis amigos lectores me disculpo por tener que poner puros enlaces en la información ya que algunas de las formulas no se pueden notar asi que por eso utilizare este medio para poder darle un enlace con la información adecuada pero seguimos con el tema.
Ejemplo: 

jueves, 21 de abril de 2011

DIAGRAMAS DE CAJA

Utilizando un diagrama de tallo y hojas, podemos comparar, mediante estos diagramas, dos distribuciones. Supongamos una segunda distribución
35 38 32 28 30 29 27 19 48 40 39 24 24 34 26 41 29 48 28 22
De ella podemos elaborar sus diagramas de Tallos y Hojas y compararla con la anterior.
Un diagrama de caja es un gráfico, basado en cuartiles, mediante el cual se visualiza un conjunto de datos. Está compuesto por un rectángulo, la "caja", y dos brazos, los "bigotes".
Es un gráfico que suministra información sobre los valores mínimo y máximo, los cuartiles Q1, Q2 o mediana y Q3, y sobre la existencia de valores atípicos y la simetría de la distribución.
EJEMPLO DISTRIBUCIÓN DE EDADES
Utilizamos la ya usada distribución de frecuencias (en tallos y hojas), que representan la edad de un colectivo de 20 personas.
   36  25  37  24  39  20  36  45  31  31

   39  24  29  23  41  40  33  24  34  40

ORDENAR LOS DATOS
Para calcular los parámetros estadístico, lo primero es ordenar la distribución
 20  23  24  24  24  25  29  31  31  33  34  36  36  37  39  39  40  40  41  45
CALCULO DE CUARTILES
Q1, el cuartil Primero es el valor mayor que el 25% de los valores de la distribución. Como N = 20 resulta que N/4 = 5; el primer cuartil es la media aritmética de dicho valor y el siguiente:
Q1=(24 + 25) / 2 = 24,5
Q2, el Segundo Cuartil es, evidentemente, la mediana de la distribución, es el valor de la variable que ocupa el lugar central en un conjunto de datos ordenados. Como N/2 =10 ; la mediana es la media aritmética de dicho valor y el siguiente:
me= Q2 = (33 + 34)/ 2 =33,5
Q3 , el Tercer Cuartil, es el valor que sobrepasa al 75% de los valores de la distribución. En nuestro caso, como 3N / 4 = 15, resulta
Q2=(39 + 39) / 2 = 39
DIBUJAR LA CAJA Y LOS BIGOTES
El bigote de la izquierda representa al colectivo de edades ( Xmín, Q1



El bigote de la derecha viene dado 
Xmáx)por (Q3,

.A QUI UN ENLACE EN EXCEL 
http://depositfiles.com/files/atwgh3r37
http://www.mediafire.com/?zftex8z84ws8x8n
http://www.fileserve.com/file/b4ymzy5
https://rapidshare.com/files/458595998/diagrama_de_caja.xls

MEDIA ARITMÉTICA O PROMEDIO PARA DATOS AGRUPADOS Y NO AGRUPADOS

Para tal fin, desde luego, no se usará el valor más elevado ni el valor más pequeño como único representante, ya que solo representan los extremos más bien que valores típicos. Entonces sería más adecuado buscar un valor central. Las medidas que describen un valor típico en un grupo de observaciones suelen llamarse medidas de tendencia central. Es importante tener en cuenta que estas medidas se aplican a grupos más bien que a individuos. Un promedio es una característica de grupo, no individual. Las medidas de tendencia central corresponden a valores que generalmente se ubican en la parte central de un conjunto de datos.
Entre las medidas de tendencia central tenemos:
Media, Mediana, Moda, Cuartiles, Deciles, Percentiles.
La medida de tendencia central más usada es la media aritmética, usualmente abreviada como media.
La media aritmética de un conjunto de n valores es el resultado de la suma de todos ellos dividido entre n.
La media para datos no agrupados
Para datos crudos, es decir datos no agrupados, la media es la suma de todos los valores dividida entre el número total de valores. Para encontrar la media de una muestra se usa la siguiente fórmula:

Media aritmética de datos agrupados definición:
     Valor obtenido al agrupar n valores iguales, cada uno por separado, considerando su frecuencia; a menudo en forma de tabla...

  Fórmula:

Media aritmética de datos agrupados :
Media aritmética = ΣfX/Σf
dónde
              X = La puntuación individual
              f = Frecuencia

La media aritmética = 1+2+3+1+2+3+2/7 = 14/7 = 2
En este caso hay dos 1, tres 2 y dos 3. El número de veces que cada número aparece es su frecuencia. Formando así la tabla de abajo.


X ValueFrequency(f)ΣfX
121 * 2 = 2
232 * 3 = 6
323 * 2 = 6


  Paso 1: Encontrar Σf.
            Σf = 7

  Paso 2: Ahora, Encontrar ΣfX.
            ΣfX = ((1*2)+(2*3)+(3*2)) = 14

  Paso 3: Ahora, Suplente en la fórmula anterior, dado
            Media aritmética = ΣfX/Σf = 14/7 = 2

El ejemplo de arriba le llevará a calcular la media aritmética de datos agrupados de forma manual. 



MEDIANA PARA DATOS AGRUPADOS Y NO AGRUPADOS

La mediana para datos no agrupados
Cuando una serie de datos contiene uno o dos valores muy grandes o muy pequeños, la media aritmética no es representativa. El valor central en tales problemas puede ser mejor descrito usando una medida de tendencia central llamada mediana.
La mediana (Me) es el punto medio de los valores de una serie de datos después de haber sido ordenados de acuerdo a su magnitud. Hay tantos valores antes que la mediana como posteriores en el arreglo de datos.
Ejemplo:
El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la línea de producción son (en ml.): 85.4, 85.3, 84.9, 85.4, y 84.0. ¿Cuál es la mediana de las observaciones muestreadas?
85.4
85.4
85.3Me
84.9
84.0
AQUÍ UN ENLACE PARA DESCARGAR UNOS EJEMPLOS MAS

La mediana para datos agrupados
Cuando los datos se encuentran agrupados en una distribución de frecuencia no conocemos los datos originales, por lo tanto es necesario estimar la mediana mediante los siguientes pasos:
La mediana para datos agrupados:
Si se tiene una distribución de frecuencias, la mediana es igualmente ese valor que tiene 50% de las observaciones por debajo y 50 % por encima. Geométricamente, la mediana es el valor de X sobre el eje de las abscisas correspondiente a la ordenada que divide un histograma en dos partes de igual área.
Para hallar el valor de la mediana, en el caso de datos agrupados debe encontrarse primero la clase mediana, la que se define como la clase más baja para la cual la frecuencia acumulada excede N/2 (siendo N=Σfi ). Encontrada esta clase, la siguiente formula servirá para hallar el valor de la mediana
N/2 – faa
= LRi + ------------- ( i )
fi
donde:
L = límite Real inferior.
N = frecuencia total.
faa = frecuencia acumulada anterior
fi = frecuencia absoluta de la clase mediana
i = amplitud.
Propiedades de la mediana
- Hay solo una mediana en una serie de datos.
- No es afectada por los valores extremos ( altos o bajos )
- Puede ser calculada en distribuciones con escala relativa,
de intervalos, y ordinal.

AQUÍ UN ENLACE PARA EJEMPLOS SOBRE MEDIANA DATOS AGRUPADOS



LA MODA

La moda para datos no agrupados
La moda (Mo) es la medida de tendencia central especialmente útil para describir mediciones de tipo ordinal y nominal.
La moda es el valor de la observación que aparece más frecuentemente.
Ejemplo:
El contenido de cinco botellas de perfume seleccionadas de forma aleatoria de la línea de producción son (en ml): 85.4, 85.3, 84.9, 85.4, y 84.0. ¿Cuál es la moda de las observaciones muestreadas?
Mo = 85.4

Ejemplo: moda para datos no agrupados

Los siguientes datos provienen del resultado de entrevistar a 30 personas sobre la marca de gaseosa que más consume a la semana:


Marca 1
Marca 2
Marca 1
Marca 1
Marca 1
Marca 3
Marca 1
Marca 3
Marca 1
Marca 2
Marca 1
Marca 1
Marca 2
Marca 1
Marca 3
Marca 3
Marca 2
Marca 1
Marca 1
Marca 1
Marca 1
Marca 3
Marca 1
Marca 2
Marca 3
Marca 1
Marca 3
Marca 3
Marca 2
Marca 3


SOLUCIÓN:
#1.- Determinar las frecuencias de cada valor de la variable.
La marca 1 se repite 15 veces
La marca 2 se repite 6 veces
La marca 3 se repite 9 veces


#2.- la moda representa el valor que más se repite. En este caso es la marca 1.

La moda para datos agrupados
Para datos agrupados en una distribución de frecuencia, la moda puede ser estimada por la marca de clase del intervalo que contenga la frecuencia de clase más grande. Si hay dos intervalos continuos con frecuencia máxima la moda será la media aritmética de las dos marcas de clase. Si hay dos o más intervalos no contiguos con frecuencia de clase máxima habrá dos o más modas que serás las marcas de clase de dichos intervalos.
La moda es el valor de la variable que mas veces se repite, y en consecuencia, en una distribución de frecuencia, es el valor de la variable que viene afectada por la máxima frecuencia de la distribución.

Ejemplo: moda para datos agrupados

Calcular la moda a partir de la siguiente tabla de frecuencia:


Ni
Lm
Ls
f
Mc
1
[ 4
6 )
2
5
2
[ 6
8 )
4
7
3
[ 8
10 )
4
9
4
[ 10
12 )
5
11
5
[ 12
14 ]
5
13
Total
20


SOLUCIÓN
Las marcas de clase que más frecuencias tienen son 11 y 13, por tanto decimos que es un caso donde aparecen dos modas (bimodal).







miércoles, 20 de abril de 2011

LA MEDIA GEOMÉTRICA

La media geométrica (MG), de un conjunto de  números positivos se define como la  n- del producto de los  números. Por tanto, la fórmula para la media geométrica es dada por



Si los datos están agrupados en intervalos, la expresión de la media geométrica, es la misma, pero utilizando la marca de clase (Xi).
El empleo más frecuente de la media geométrica es el de promediar variables tales como porcentajes, tasas, números índices. etc., es decir, en los casos en los que se supone que la variable presenta variaciones acumulativas.
Ventajas e inconvenientes:
En su cálculo intervienen todos los valores de la distribución. Los valores extremos tienen menor influencia que en la media aritmética. Es única. Su cálculo es más complicado que el de la media aritmética.
Además, cuando la variable toma al menos un xi = 0 entonces G se anula, y si la variable toma valores negativos se pueden presentar una gama de casos particulares en los que tampoco queda determinada debido al problema de las raíces de índice par de números negativos.

Ejemplo
Supongase que las utilidades obtenidas por una compañía constructora en cuatro proyectos fueron de 3, 2, 4 y 6%, respectivamente. ¿ Cúal es la media geométrica de las ganancias?.
En este ejemplo  y asi la media geométrica es determinada por


y así la media geométrica de las utilidades es el 3.46%.
La media aritmética de los valores anteriores es 3.75%. Aunque el valor 6% no es muy grande, hace que la media aritmética se incline hacia valores elevados. La media geométrica no se ve tan afectada por valores extremos.


Se trata de un promedio que, para su cálculo, al igual que la media aritmética, hace uso de toda la información de la variable. Sin embargo es menos sensible a los valores extremos de lo que lo es la media aritmética. Frente a estas ventajas o virtudes, este nuevo promedio tiene algunas limitaciones. Entre ellas destacaremos:
a) es menos intuitivo que la media aritmética;
b) su cálculo no es tan inmediato;
c) en ocasiones no queda determinada.
Si algún valor de la variable es nulo, entonces G se anula. Si la variable toma valores negativos este promedio da problemas. La media geométrica se utiliza especialmente para promediar porcentajes, tasas, números índices, etc., y siempre que la variable presente variaciones acumulativas.
Ejemplo Las tasas de crecimiento de la economía de un país durante diez años son las que aparecen en la tabla siguiente:
tasa (X)en %                   AÑOS ni
       1                                    2   
       2                                    2
       3                                    3
       4                                    2
       5                                    1
obtener la tasa anual de crecimiento
para esta variable y dada su naturaleza, el promedio mas adecuado es la media geométrica.










EJERCICIO:

Se ha calculado que, durante el primer año de uso, cierta máquina sufre una depreciación del 16% respecto a su valor de costo, y que, durante el segundo año, la depreciación es del 9% del valor que tenía al comenzar dicho segundo año. Encuéntrese un tanto por ciento promedio de depreciación anual.