lunes, 25 de abril de 2011

Distribución de probabilidad

Distribución de probabilidad




La distribución de probabilidad de una variable aleatoria es una función que asigna a cada suceso definido sobre la variable aleatoria la probabilidad de que dicho suceso ocurra. La distribución de probabilidad está definida sobre el conjunto de todos los eventos rango de valores de la variable aleatoria.

Características:

1. La probabilidad de un resultado en particular se encuentra entre 0 y 1, inclusive.

2. Los resultados son eventos mutuamente excluyentes.

3. La lista es exhaustiva. Así, la suma de las probabilidades de los diversos eventos es igual a 1.

VARIABLES ALEATORIAS

Toda distribución de probabilidad es generada por una variable (porque puede tomar diferentes valores) aleatoria x (porque el valor tomado es totalmente al azar), y puede ser de dos tipos:

Variable aleatoria discreta.

Porque solo puede tomar valores enteros y un número finito de ellos. Por ejemplo:
x→Variable que nos define el número de alumnos
aprobados en la materia de probabilidad en un grupo de 40
alumnos (1, 2 ,3…ó los 40).

Variabl e aleatoria continúa.

Porque puede tomar tanto valores enteros como fraccionarios y un número infinito de ellos dentro de un mismo intervalo. Por ejemplo:

x→Variable que nos define la concentración en gramos de plata de algunas muestras de mineral (14.8 gr, 12.1, 10.0, 42.3, 15.0, 18.4, 19.0, 21.0, 20.8, …,∞ )

Desviación estándar

La desviación estándar (σ) mide cuánto se separan los datos.

La fórmula es fácil: es la raíz cuadrada de la varianza. Así que, "¿qué es la varianza?"

Varianza

La varianza (que es el cuadrado de la desviación estándar: σ2) se define así:

Es la media de las diferencias con la media elevadas al cuadrado.

En otras palabras, sigue estos pasos:

1. Calcula la media (el promedio de los números)
2. Ahora, por cada número resta la media y eleva el resultado al cuadrado (la diferencia elevada al cuadrado).
3. Ahora calcula la media de esas diferencias al cuadrado.

Video Relativo al tema http://www.youtube.com/watch?v=4Gg0lQAN138

DISTRIBUCION DE PROBABILIDAD BINOMIAL

Es una distribución de probabilidad discreta que se presenta con mucha frecuencia.

Características:

1. Consiste en que solo hay dos posibles resultados en determinado intento de un experimento.

2. El hecho de que la variable aleatoria es el resultado de conteos.

3. La probabilidad de éxito es la misma de una prueba a otra.



DESCRIPCIÓN DE DATOS

PRESENTACIÓN Y ANÁLISIS DE DATOS.

Continuamos con el estudio de la estadística descriptiva .

Þ DIAGRAMAS DE PUNTOS.

Un diagrama de puntos agrupa los datos lo menos posible y evita la pérdida de identidad de cada observación.

Para crear un diagrama de puntos se coloca un punto que representa a cada observación y esta se coloca a lo largo de una recta numérica. En el caso de que haya observaciones idénticas o las observaciones se encuentren muy próximas los puntos se los debe apilar uno sobre otro para que se muestren de manera individual lo cual nos permite distinguir la forma de distribución, el valor en torno al cual tienden a acumularse los valores y observar el valor máximo y mínimo.

Los diagramas de puntos sirven en el caso de conjuntos pequeños.

Þ GRÁFICAS DE TALLO Y HOJAS.

Es una técnica estadística para la presentación de un conjunto de datos. Cada valor numérico se divide en dos partes: 1)El digito principal se convierte en el tallo y 2) los dígitos secundarios se convierten en las hojas. El tallo se localiza a lo largo del eje vertical y los valores de las hojas se apilan unos contra otros a lo largo del eje horizontal.

La ventaja de esta técnica sobre la distribución de frecuencias es que no se pierde la identidad de cada observación.

Þ CUARTILES.

Los cuartiles dividen a un conjunto de observaciones en cuatro partes iguales.

El primer cuartil se representa mediante Q1, es el valor debajo del cual se presenta 25% de las observaciones.

El segundo cuartil es la mediana de del conjunto, se representa con Q2 y es el valor del cuan se presenta el 50% de las observaciones.

El tercer cuartil se representa mediante Q3, es el valor debajo del cual se representa 75% de las observaciones

Y el cuarto cuartil es el final de los datos, representado con Q4.

Þ DECILES.

Los deciles dividen a un conjunto de observaciones en 10 partes iguales.

Þ PERCENTILES.

Estos dividen a un conjunto de observaciones en 100 partes iguales.

Þ LOCALIZACIÓN DE UN PERCENTIL.

Donde Lp representa la ubicación de cierto percentil que se busca.

El número de observaciones es n

Y donde P representa el percentil que se busca.

Þ DIAGRAMAS DE CAJA.

Un diagrama de caja es la representación gráfica, basada en cuartiles, que ayuda a exhibir un conjunto de datos. Para constituir un diagrama de caja solo se necesita cinco estadísticos: el valor mínimo, Q1, la mediana, Q3, y el valor máximo.

El diagrama de caja revela que clase de sesgo tiene el diagrama.

Þ SESGO.

Cada conjunto de datos tiene una característica que es la forma y existen cuatro formas:

1. Simétrica.- en un conjunto simétrico de observaciones la media y la mediana son iguales, y los valores de datos se dispersan uniformemente en torno a estos valores.

2. Con sesgo positivo.- o también llamado sesgado a la derecha cuando existe un solo pico y los valores se extienden mucho mas allá a la derecha del pico que a la izquierda de este, en este caso la media es más grande que la mediana.

3. Con sesgo negativo.- o llamado sesgado a la izquierda, en este caso solo existe un pico donde las observaciones se extienden más a la izquierda, en la dirección negativa .En este caso la media es menor que la mediana.

4. Bomidal. – esta tendrá dos o más picos.

DESCRIPCIÓN DE DATOS ESTADISTICA

DESCRIPCIÓN DE DATOS

Tabla de Frecuencias: es la Agrupación de datos cualitativos en clases mutuamente excluyentes que muestra el número de observaciones en cada clase.

Frecuencias relativas de clase.

Esta capta la relación entre la totalidad de los elementos de una clase y el número total de observaciones.

Para calcularla cada una de las frecuencias de clase se divide entre el total de observaciones.

Representación gráfica de datos Cualitativos.

Gráfica de barras.- Aquí las clases se representan en el eje horizontal y la frecuencia de clase en el eje vertical. Las frecuencias de la clase son proporcionales a las alturas de las barras.


Gráfica de pastel.-es la gráfica que muestra la parte o porcentaje que representa cada clase del total de números de frecuencia.

Construcción de distribuciones de frecuencias: datos cuantitativos.

Distribución de frecuencias.- es la agrupación de datos en clases mutuamente excluyentes, que muestra el número de observaciones que hay en cada clase.

Se llama datos en bruto o datos no agrupados a la información que esta desorganizada.

¿Cómo crear una distribución de frecuencias?

1. Defina el número de clases.

2. Determine el intervalo o ancho de clase.

3. Establezca los límites de la clase

4. Anote las veces que se repite cada intervalo.

5. Cuente el número de elementos de cada clase.

Frecuencia de clase es el número de elementos que hay en cada clase.

Distribución de frecuencias relativas.

Estas sirven para mostrar la fracción del total de observaciones que hay en cada clase.

Para convertir una frecuencia de distribuciones en una distribución relativas, cada una de las clase de frecuencia se divide entre el número total de observaciones.

Representación gráfica de una distribución de frecuencias.

Nos sirven para tener una vista más rápida de las frecuencias. Estas se describen por medio de gráficas o tablas.

Histograma:

Es la gráfica en la que las clases se señalan en el eje horizontal y las frecuencias de clase en el eje vertical. Las frecuencias de clase se representan por medio de las alturas de las barras, estás se dibujan de manera adyacente.

Polígono de frecuencias:

Muestra la forma que tiene una distribución y es similar a un histograma. Consiste en segmentos de recta que conectan los puntos formados por las intersecciones de los puntos medios de la clase y las frecuencias de la clase