viernes, 22 de abril de 2011

ESCALAS DE MEDICIÓN: NOMINAL, ORDINAL, DE INTERVALO Y DE RAZÓN

Para realizar un correcto análisis de los datos es fundamental conocer de antemano el tipo de medida de la variable, ya que para cada una de ellas se utilizan diferentes estadísticos. La clasificación más convencional de las escalas de medida se divide en cuatro grupos denominados Nominal, Ordinal, Intervalo y Razón.

Nominal

Son variables numéricas cuyos valores representan una categoría distintiva que no implican un orden específico o identifican un grupo de pertenencia Este tipo de variables sólo nos permite establecer relaciones de igualdad/desigualdad entre los elementos de la variable. La asignación de los valores se realiza en forma aleatoria por lo que NO cuenta con un orden lógico. Un ejemplo de este tipo de variables es el Género ya que nosotros podemos asignarles un valor a los (A) hombres y otro diferente a las mujeres (B) y por más machistas o feministas que seamos no podríamos establecer que uno es mayor que el otro. O Bien se clasificará a una muestra de personas de acuerdo a la religión que profesan: (1) Cristianos, (2) Judíos, (3) Musulmanes, (4) Otros y (5) Sin creencia alguna.
                                                                  A                 B

Ordinal

Son variables numéricas cuyos valores representan una categoría o identifican un grupo de pertenencia contando con un orden lógico. Este tipo de variables
nos permite establecer relaciones de igualdad/desigualdad y a su vez, podemos identificar si una categoría es mayor o menor que otra. La medición ordinal permite ordenar los eventos en función de mayor o menor posesión de un atributo o característica. Un ejemplo de variable ordinal es el nivel de educación, ya que se puede establecer que una persona con título de Postgrado tiene un nivel de educación superior al de una persona con título de bachiller. En las variables ordinales no se puede determinar la distancia entre sus categorías, ya que no es cuantificable o medible.













Intervalo
Son variables numéricas cuyos valores representan magnitudes y la distancia entre los números de su escala es igual. Con este tipo de variables podemos realizar comparaciones de igualdad/desigualdad, establecer un orden dentro de sus valores y medir la distancia existente entre cada valor de la escala, sobre todo es aplicable a las variables continuas debido a que la multiplicación y la división no son realizables. Un ejemplo de este tipo de variables es la temperatura, ya que podemos decir que la distancia entre 10 y 12 grados es la misma que la existente entre 15 y 17 grados. Lo que no podemos establecer es que una temperatura de 10 grados equivale a la mitad de una temperatura de 20 grados.
Razón
Las variables de razón poseen las mismas características de las variables de intervalo, con la diferencia que cuentan con un cero absoluto; es decir, el valor cero (0) representa la ausencia total de medida, por lo que se puede realizar cualquier operación Aritmética (Suma, Resta, Multiplicación y División) y Lógica (Comparación y ordenamiento). Este tipo de variables permiten el nivel más alto de medición, además que determinan la distancia exacta entre los intervalos de una categoría Las variables altura, peso, distancia o el salario, son algunos ejemplos de este tipo de escala de medida. Debido a la similitud existente entre las escalas de intervalo y de razón, el Stadistic Program Social System (SPSS) las ha reunido en un nuevo tipo de medida exclusivo del programa, al cual denomina Escala. Las variables de escala son para SPSS todas aquellas variables cuyos valores representan magnitudes, ya sea que cuenten con un cero (0) absoluto o no. Teniendo esto en cuenta discutiremos a continuación los diferentes procedimientos estadísticos que se pueden utilizar de acuerdo al tipo de medida de cada variable.

Tabla de frecuencia para variables discretas y continuas






TABLAS DE FRECUENCIA PARA VARIABLES DISCRETAS Y CONTINUAS

El principal objetivo de la estadística descriptiva es sintetizar conjuntos de datos mediante tablas o gráficos resumen, con el fin de poder identificar el comportamiento característico de un fenómeno y facilitar su análisis exhaustivo.
Frecuencia
Es el número de veces que se repite, es decir que aparece, el mismo dato estadístico en un conjunto de observaciones de una investigación determinada; la frecuencia se designa como: fi
Distribución de frecuencia: Es una disposición tabular de datos estadísticos ordenados ascendente o descendentemente con la frecuencia (fi) de cada dato.

Ejemplo:
Los datos representan los años de servicio de 60 empleados de la empresa Mcperro.
10 9 3 5 4 5 6 7 8 9 10 8 4 8 6 3 8 10
7 10 8 3 5 7 8 6 10 9 7 8 5 3 8 7 8 10
8 10 8 7 7 9 8 7 6 5 7 8 8 9 8 10 7 6
7 8 6 7 6 10
Procedimiento: Ordenar los datos de menor a mayor, elaborar cuadro de distribución de frecuencia.
Ordena de mayor a menor, usaremos diagrama de tallo y hoja.
hagan el ejercicio de arriba así como lo muestra el vídeo si se puede hacer mejor ordenándolos ya que seria fácil identificar los números que se repiten 

Clasificación de las series estadísticas: 1. Series temporales o cronológicas; estas se definen como una masa o conjunto de datos, producto de la observación de un fenómeno individual o colectivo, cuantificable en sucesivos instantes o periodos de tiempo, esto nos permite conocer el comportamiento o tendencia de las variables en el tiempo.


Es importante resaltar que cuando se trata de series temporales o cronológicas, se debe especificar el instante o el periodo de tiempo a los que se refiere los caracteres en estudio. Nos referimos a instantes de tiempo, por el hecho de que la observación se hace en un momento específico de tiempo. Ejemplo: Plantaciones forestales ejecutadas a nivel nacional, al 31 de diciembre de cada año entre 1997 – 2001. 2. Series atemporales; cuando las observaciones de un fenómeno se hacen referidas al mismo instante o intervalo de tiempo, nos encontramos ante
una serie atemporal. Aquí el tiempo no va incluido a cada observación, puesto que es el mismo tiempo para todas ellas. Este tipo de observación proporciona una "visión instantánea" de los fenómenos o caracteres de los componentes del colectivo en estudio. Ejemplo: Las notas de las participantes en la materia de Estadística I en el periodo académico que terminó en septiembre del 2001. 3. Series de frecuencia; cuando realizamos un estudio de cada uno de los elementos que componen la población o muestra bajo análisis, observamos que en general, hay un número de veces en que aparece repetido un mismo valor de una variable, o bien repeticiones de la misma modalidad de un atributo. Este número de repeticiones de un resultado, recibe el nombre de frecuencia absoluta o simplemente frecuencia. El procedimiento mediante el cual se realiza el conteo, para así determinar el número de veces que cada dato se repite, recibe el nombre de tabulación.
Los cuadros estadísticos están compuestos por las siguientes partes:
1. Título
2. Encabezado
3. Concepto o columnas
4. Cuerpo
5. Nota de encabezado
6. Nota de pie
7. Fuente de datos

INTERVALO DE CLASE Y LÍMITES DE CLASE

Rango
El rango de clase, conocido también como amplitud de clase o recorrido de clase, es el límite dentro de los cuales están comprendidos los valores de la serie de datos, en otras palabras, es el número de diferentes valores que toma la variable en un estudio de investigación dada. Es la diferencia entre el valor máximo de una variable y el valor mínimo que ésta toma en una investigación cualquiera. El rango de una distribución de frecuencia se designa con la letra R.
UM normalmente es igual a 1, y se obtiene al obtener la diferencia entre 2 ó más datos consecutivos de la serie de valores, sin embargo pueden ser menor a la unidad.


Para calcular el rango se utiliza la siguiente fórmula:
R = XM - Xm + UM


Dónde:
R = Rango
XM = Dato mayor
Xm = Dato menor
UM = Unidad de Medida, que por lo general es la unidad.
Con los siguientes datos, que corresponden a los años de servicio de 60 empleados de la empresa “X”, calcule el rango de la distribución de la frecuencia:

R = XM - Xm + UM


Anchura o intervalo de clase
Son las divisiones o categorías en las cuales se agrupa un conjunto de datos ordenados con características comunes. En otras palabras, son fraccionamientos del rango o recorrido de la serie de valores para reunir los datos que presentan valores comprendidos entre los dos límites (límite Superior de la Clase y Límite Inferior de la Clase).
Límite o frontera de clase
Las clases de una distribución de frecuencia indican las cotas o fronteras de cada clase en la distribución, las clases están formadas por dos números denominados límites aparentes (LA), ejemplo 32 – 37, el primero de estos dos (32) se llama límite inferior aparente (LIA) y el segundo (37) se le denomina límite superior aparente (LSA).
Límites reales
Los límites reales o verdaderos de una clase son aquéllos que se obtienen restándole media unidad de medida al límite aparente inferior de una clase y sumándole media unidad de medida al límite superior aparente de las diferentes clases, es decir, son valores no observables de la variable en estudio, puesto que no lo registra la unidad utilizada. Y se denominarán límite inferior real (LIR) y límite superior real (LSR).





ANCHURA DE INTERVALO DE CLASE


Tipos de intervalos de clase
Clase de igual tamaño
Este tipo de clase es el más utilizado en los cálculos estadísticos; cuando todas las clases son del mismo tamaño, los cálculos relacionados con la distribución de frecuencia son simplificados considerablemente. En términos generales, este tipo de distribución es el que se utiliza comúnmente en casi todas las investigaciones.

Clase desigual de tamaño
Los intervalos de clase son desiguales no son frecuentes en el análisis estadístico, la utilización de los mismos se debe evitar; sin embargo, en algunas
investigaciones es indispensable su utilización; tal es el caso de las investigaciones que tienen como propósito particular analizar valores que varían en un amplio recorrido de la variable. Cuando se utiliza este tipo de clase de los intervalos de clase deberían ser incrementados de una forma ordenada, de ser posible. Este tipo de clases se utiliza algunas veces para reportar datos relacionados con valuaciones de activos o ingresos personales.

CLASE             Fi
 5 – 7                 5
8 – 10               10
11 – 13             15
14 – 16             18
17 – 19             11        
20 – 22              5
Totales            64
Clase desigual

Clase abierta
Son aquellas en la que uno de sus dos los límites de clase no está definido numéricamente. Este tipo de clase se utiliza cuando las distribuciones poseen algunos datos u observaciones que son mucho mayores o mucho más pequeños que los demás y se quiere condensar en uno solo. En lo posible se debe tratar de evitar este tipo de clase ya que en estas condiciones no es posible definir el punto medio de la distribución, por lo cual se hace difícil la representación gráfica y en realizar otros cálculos con los datos que se presentan en los cuadros estadísticos. Sin embargo, existen investigaciones en donde la aplicación de las clases abiertas es conveniente, por cuanto, la
existencia de valores de la serie de datos son mucho menores o mucho mayores que el resto de la serie.


MARCA DE CLASE

Marca de clase: Es el punto medio de una clase y se obtiene sumando los
límites inferiores (LIA) y superiores de una clase (LSA) y dividiendo el resultado
entre dos. La marca de clase la denotaremos como MC.
En un estudio estadístico, valor representativo de cada intervalo. Tomamos como marca de clase el punto medio de cada intervalo y lo calculamos sumando los extremos del intervalo y dividiéndolo entre 2.

       MC= LIA+LSA/2
Donde:
M C = Marca de clase
LIA = Límite inferior aparente
LSA = Límite superior aparente
un ejemplo de marca de clase 

DISTRIBUCIÓN DE FRECUENCIA RELATIVA Y ACUMULADA PARA VARIABLES DISCRETAS Y CONTINUAS

Como vimos anteriormente, la frecuencia es el número de veces que se presenta cada valor de la variable.
Frecuencia absoluta (fa o fi): Llamaremos así al número de repeticiones que presenta una observación. Se representa por ni.
F1 + F2 + F3 +…………….……FK = N
Frecuencia relativa (fr): Es la frecuencia absoluta dividida por el número total de datos, se suele expresar en tanto por uno, siendo su valor -iésimo .
fi=ni/n
La suma de todas las frecuencias relativas, siempre debe ser igual a la unida o 100%.
Frecuencia absoluta acumulada (faa): es la suma de los distintos valores de la frecuencia absoluta tomando como referencia un individuo dado. La última frecuencia absoluta acumulada es igual al nº de casos.


N1 = n1
N2 = n1+ n2
Nn = n1 + n2 + ..... + nn-1 + nn = n
Frecuencia relativa acumulada (far), es el resultado de la suma de los distintos valores de la frecuencia relativa, el total de estos valores nos dará como resultado la unidad o el 100%.

H1 = F1/n
H2 = F2/n
Hk = Fk/n

GRÁFICA PARA DATOS CUALITATIVOS: GRÁFICA DE BARRAS Y DE PASTEL

Gráfica de barras

Este diagrama de hania de ejemplo está basado en los resultados de la Elección del Parlamento Europeo en el 2004 y en el de 1999. La tabla siguiente lista el número de asientos asignadas a cada partido. Los resultados de 1999 han sido multiplicados por 1.16933, para compensar el cambio en el número de asientos entre estos años.

GrupoAsientos (2004)Asientos (1999) a escala
EUL3949200210
EFA4256
EDD1519
ELDR6760
EPP276272
UEN2736
Otros6629
Un gráfico de barras visualizando los resultados anteriores de la elección del 2004 se vería así:
(Si todos los datos fuesen ordenados en orden descendiente este tipo de gráfico de barras sería llamado un Diagrama de Pareto.)

Este gráfico de barras muestra ambos resultados (2004 y 1999):
A qui se muestra un gráfico tipo Pastel
GRACIAS A LA COLABORACIÓN DE 
 POR EL VIDEO