domingo, 18 de mayo de 2008

DIAGRAMA DE CAJAS.

DEFINICION:
es un grafico basado en cuartiles, mediante el cual se visualiza un conjunto de datos. la informacion que busca es sobre la mediana, cuartil 1 y cuartil 3, sobre la existencia de datos atipicos de la distribucion.

tambien denominado "Boxand wishkers" o "Boxplot" basado en la mediana ocasionadas por los cuartiles que perturban la media.

presentacion visual que describe al mismo tiempo varias caracteristicas importantes de un conjunto de datos, tales como el centro, la dispercion el aleamiento de la asimetria e identificacion de valores extremos.


CONCEPTO:
El diagrama de cajas es como una presentacion usual que describe al mismop tiempo vatias caracteristicas importantes de un conjunto de datos.
tale como el centro ya la dispercionç, el alejamiento de la asimetria y la identificacion de valores extremos.
(puntos atipicos ), es decir, valores que se alejan de una manera poco usual del resto de los datos.
y por ultimo la informacion que busca es sobre la media, el Q1 y Q3 sobre la existencia de los datos atipicos de la distribucion.

CARACTERISTICAS DEL DIAGRAMA DE CAJAS.

CONCEPTO:
  • puede dibujarse de forma vertical y horizontal.
  • en lo extremos del rectangulo se localizan los cuartiles.
  • la mediana se representa por una linea que divide en dos partes iguales ala distribuciuon.
  • puede dibujarse en forma horizontal o vertical.
  • la mediana puede coinsidir con los cuartiles.

Digrama de Cajas Simple - Diagrama de Cajas para dos variables

RELACION DEL DIAGRAMA Y LA CURVA:

CONCEPTO:

relacion que existe entre la curva y un diagrama de cajas.

En las curvas nos muestran que en ambas colas se concentran los datos mas dispersos o atipicos. y las curvas muestran la media de una distribucion.

VALORES ESTANDARIZADOS

DEFINICION:
Como sabemos la curva de frecuencias tiene forma de campana en cuyo centro se ubican tres medidas de tendencia central (medis, moda y mediana) en particular el promedio o media aritmetica es la medida que representa un inverso muestral mientra a los datos de este valor se encuentran valores mas altos y mas bajos aproximadamente la mitad para cada lado y se dispersan segun la desviacion estyandar .

CONCEPTO:
es un valor estadistico de la curva normal de frecuencias. para poder realizar esta operacion necesitamos las medidas de tendencia central y la desviacion estandar.
tambien es la distacia que se encuentra por encima o por debajo de la media , medida en unidades de la desviacion estandar.
y para obtener un valor estandarizado que es (z) restamos la media con la variable y lo dividimos con la desviacion estandar y asi obtenemos el valor de (z).

martes, 13 de mayo de 2008

AREA BAJO LA CURVA


En el estudio de la regularidad estadística con variables categóricas con más de dos variables o bien con variables numéricas con muchos valores (y se establecen clases o intervalos), la suma de las frecuencias relativas o proporciones siempre es uno (el 100%). Si arbitrariamente unimos varias categorías en una nueva clase, la frecuencia relativa o proporción para ella es la suma de las proporciones de las clases originales que se sumaron. Por ejemplo para las cuatro categorías de evolución de niños con neurodermatitis, se puede considerar la unión de las dos mejorías, y llamarla "alguna mejoría", entonces la frecuencia relativa de alguna mejoría es la suma de las de mejoría y mejoría marcada.

CARACTERISTICAS DE LA DISTRIBUCION NORMAL

1. Forma
Es una campana simétrica con respecto a su centro
La curva tiene un solo pico; por tanto, es unimodal.
La media de una población distribuida normalmente cae en el centro de su curva normal.
Debido a la simetría de la distribución normal de probabilidad, la mediana y la moda de la distribución se encuentran también en el centro; en consecuencia, para una curva normal, la media, la mediana y la moda tienen el mismo valor.
Los dos extremos de la distribución normal de probabilidad se extienden indefinidamente y nunca tocan el eje horizontal

2. Parámetros
Está caracterizada por dos parámetros

a).- Parámetro de localización: La media
b).- Parámetro de forma: La varianza


3. Función de densidad

Para determinar las áreas bajo la curva de función de densidad normal se requiere integrar la ecuación anterior, desafortunadamente no existe una solución exacta para la integral, por lo que su evaluación solamente puede obtenerse utilizando métodos de aproximación. Por esta razón, se aprovechó la propiedad de transformación de cualquier curva normal a la NORMAL ESTANDAR utilizando una nueva variable aleatoria Z llamada variable aleatoria normal estándar.

Si X ~ N ( µ, s2 ) entonces X puede transformarse en Z



AREAS BAJO LA CURVA NORMAL

No importa cuáles sean los valores de la para una distribución de probabilidad normal, el área total bajo la curva es 1.00, de manera que podemos pensar en áreas bajo la curva como si fueran probabilidades. Matemáticamente es verdad que:

1.Aproximadamente 68% de todos los valores de una población normalmente distribuida se encuentra dentro de desviación estándar de la media.

2. Aproximadamente 95.5 % de todos los valores de una población normalmente distribuida se encuentra dentro de desviación estándar de la media.

3. Aproximadamente 99.7 % de todos los valores de una población normalmente distribuida se encuentra dentro de desviación estándar de la media.

COMENTARIO:
el area bajo la curva es muy importante ya que nos dan a conocer muchos datos y las curvas que lleva cada uno de los ejercicios que nos presentan o que podemos ocupar para hacer supongamos cuantos alumnos hay entre la media tendriamos que calcular el dato que nos estan pidiendo de la media y tendriamos que graficar, y haci saber cuantos alumnos se encuentran entre la media.
tambien es una curva en forma de campana, y que tiene un solo pico ya que es asi es unimodal.
tambien los dos extremos de la distribucion normal de probabilidad se extienden indefinidamente y nunca tocan el eje horizontal..