viernes, 30 de mayo de 2014

Conceptos elementales de Probabilidad

Experimento aleatorio: conjunto de pruebas cuyos resultados están determinados únicamente por el azar.
Espacio muestral: conjunto de todos los resultados posibles de un experimento aleatorio
Punto muestral o suceso elemental: el resultado de una sola prueba de un experimento muestral
Suceso o evento: cualquier subconjunto de puntos muestrales
Sucesos mutuamente excluyentes: sucesos o eventos que no pueden ocurrir simultaneamente .
Sucesos complementarios: dos sucesos o eventos mutuamente excluyentes cuya unión es el espacio muestral
Sucesos independientes: sucesos o eventos que no tienen relación entre sí; la ocurrencia de uno no afecta la ocurrencia del otro
Sucesos dependientes: sucesos o eventos que sí tienen relación entre sí; la ocurrencia de uno sí afecta la ocurrencia del otro.
EJEMPLO: Se lanza un dado.
a) Encontrar el espacio muestral. Solución: S = {1, 2, 3, 4, 5, 6}
b) Enumerar los puntos muestrales. Solución: Hay seis puntos muestrales: {1},{2},{3},{4},{5} y {6}.
c) Poner dos ejemplos de eventos. Solución: evento A = {resultado es impar} = {1, 3, 5}; evento B = {resultado es mayor que 2} = {3, 4, 5, 6}
d) ¿Son mutuamente excluyentes los siguientes eventos? A = {resultado menor o igual a 4}, B = {resultado es primo}. Solución: A = {1, 2, 3, 4} y B = {2, 3, 5} sí tienen dos puntos en común, 2 y 3. Por lo tanto, no son mutuamente excluyentes.
e) ¿Cuál suceso es complementario a M = {2, 6}? Solución: {1, 3, 4, 5}.
f) ¿Son dependientes o independientes los siguientes eventos? A = {obtener un 2 un el primer lanzamiento}, B = {obtener un 4 en el segundo lanzamiento}. Solución: Son independientes, porque obtener o no un 2 en el primer lanzamiento no afecta el resultado del segundo lanzamiento. 
EJERCICIOS:
Se lanzan tres monedas y se anota el número de caras.
1) Encontrar el espacio muestral
2) Ejemplificar dos puntos muestrales
3) Ejemplificar un evento con tres puntos muestrales
4) ¿Son mutuamente excluyentes los siguientes eventos? A = {1, 2}, B = {0}
5) ¿Cuál suceso es complementario a P = {3}?
6) ¿Son dependientes o independientes los siguientes eventos?
    A = obtener un 1 en un lanzamiento, B = obtener un 3 en el siguiente lanzamiento.
Una bolsa opaca tiene tres bolas rojas y dos bolas amarillas, todas idénticas a excepción del color. Se saca una bola al azar y luego otra bola al azar, anotando el color de cada bola.
7) Encontrar el espacio muestral
8) Ejemplificar dos puntos muestrales
9) Ejemplificar un evento con dos puntos muestrales
10) ¿Son mutuamente excluyentes los siguientes eventos? A = {RA, AA}, B = {RR, RA}
11) ¿Cuál suceso es complementario a P = {RR}?
12) ¿Son dependientes o independientes los siguientes eventos?:
      A = {obtener una bola roja en primer lugar}, B = {obtener una bola amarilla en segundo lugar}.

Aplicacion de la Estadistica Elemental

1. MEDIA

Es la medida de posición central más utilizada, la más conocida y la más sencilla de calcular, debido principalmente a que sus ecuaciones se prestan para el manejo algebraico, lo cual la hace de gran utilidad. Su principal desventaja radica en su sensibilidad al cambio de uno de sus valores o a los valores extremos demasiado grandes o pequeños. La media se define como la suma de todos los valores observados, dividido por el número total de observaciones.
 
Donde (m) representa la media, (N) representa el tamaño de la población y (Xi) representa cada uno de los valores de la población. Ya que en la mayoría de los casos se trabajan con muestras de la población todas las ecuaciones que se presenten a continuación serán representativas para las muestras. La media aritmética para una muestra esta determinada como
Cuando los valores representan una población la ecuación se define como:
Ecuacion de La Media para poblaciones 
 
La estadística descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables.
Las variables pueden ser de dos tipos:
Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).
Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).
Las variables también se pueden clasificar en:
Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alunmos de una clase).
Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase).
Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:
Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3....,etc, pero, por ejemplo, nunca podrá ser 3,45).
Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80,3 km/h, 94,57 km/h...etc.

Las medidas de posición son de dos tipos:
a) Medidas de posición central: informan sobre los valores medios de la serie de datos.
b) Medidas de posición no centrales: informan de como se distribuye el resto de los valores de la serie.
a) Medidas de posición central
Las principales medidas de posición central son las siguientes:
1.- Media: es el valor medio ponderado de la serie de datos. Se pueden calcular diversos tipos de media, siendo las más utilizadas:
a) Media aritmética: se calcula multiplicando cada valor por el número de veces que se repite. La suma de todos estos productos se divide por el total de datos de la muestra:
Xm =
(X1 * n1) + (X2 * n2) + (X3 * n3) + .....+ (Xn-1 * nn-1) + (Xn * nn)
---------------------------------------------------------------------------------------
n
b) Media geométrica: se eleva cada valor al número de veces que se ha repetido. Se multiplican todo estos resultados y al producto fiinal se le calcula la raíz "n" (siendo "n" el total de datos de la muestra).
Según el tipo de datos que se analice será más apropiado utilizar la media aritmética o la media geométrica.

2.- Mediana: es el valor de la serie de datos que se sitúa justamente en el centro de la muestra (un 50% de valores son inferiores y otro 50% son superiores).
No presentan el problema de estar influido por los valores extremos, pero en cambio no utiliza en su cálculo toda la información de la serie de datos (no pondera cada valor por el número de veces que se ha repetido).
3.- Moda: es el valor que más se repite en la muestra.
1.- Media aritmética:
Xm =
(1,20*1) + (1,21*4) + (1,22 * 4) + (1,23 * 2) + ......... + (1,29 * 3) + (1,30 * 3)
--------------------------------------------------------------------------------------------------
30
Luego:
Xm =
1,253
Por lo tanto, la estatura media de este grupo de alumnos es de 1,253 cm.
2.- Media geométrica:
X =
((1,20^ 1) * (1,21^4) * (1,22^ 4) * .....* (1,29^3)* (1,30^3)) ^ (1/30)
Luego:
Xm =
1,253
En este ejemplo la media aritmética y la media geométrica coinciden, pero no tiene siempre por qué ser así.
3.- Mediana:
La mediana de esta muestra es 1,26 cm, ya que por debajo está el 50% de los valores y por arriba el otro 50%. Esto se puede ver al analizar la columna de frecuencias relativas acumuladas.
En este ejemplo, como el valor 1,26 se repite en 3 ocasiones, la media se situaría exactamente entre el primer y el segundo valor de este grupo, ya que entre estos dos valores se encuentra la división entre el 50% inferior y el 50% superior.
4.- Moda:
Hay 3 valores que se repiten en 4 ocasiones: el 1,21, el 1,22 y el 1,28, por lo tanto esta seria cuenta con 3 modas.
Medidas de posición no centrales
Las medidas de posición no centrales permiten conocer otros puntos característicos de la distribución que no son los valores centrales. Entre otros indicadores, se suelen utilizar una serie de valores que dividen la muestra en tramos iguales:
Cuartiles: son 3 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cuatro tramos iguales, en los que cada uno de ellos concentra el 25% de los resultados.
Deciles: son 9 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en diez tramos iguales, en los que cada uno de ellos concentra el 10% de los resultados.
Percentiles: son 99 valores que distribuyen la serie de datos, ordenada de forma creciente o decreciente, en cien tramos iguales, en los que cada uno de ellos concentra el 1% de los resultados.
Existen diversas medidas de dispersión, entre las más utilizadas podemos destacar las siguientes:
1.- Rango: mide la amplitud de los valores de la muestra y se calcula por diferencia entre el valor más elevado y el valor más bajo.
2.- Varianza: Mide la distancia existente entre los valores de la serie y la media. Se calcula como sumatorio de las difrencias al cuadrado entre cada valor y la media, multiplicadas por el número de veces que se ha repetido cada valor. El sumatorio obtenido se divide por el tamaño de la muestra.
La varianza siempre será mayor que cero. Mientras más se aproxima a cero, más concentrados están los valores de la serie alrededor de la media. Por el contrario, mientras mayor sea la varianza, más dispersos están.
3.- Desviación típica: Se calcula como raíz cuadrada de la varianza.
4.- Coeficiente de varización de Pearson: se calcula como cociente entre la desviación típica y la media.
PROBLEMAS :
1º  Un consultor de dirección ha encontrado que la cantidad de tiempo que invierten diariamente los ejecutivos en realizar tareas que con la misma eficacia podrían realizar sus subordinados se ajusta convenientemente a una distribución normal. Ha comprobado, además, que el 10 % de los ejecutivos invierten en esas tareas más de 3’5 horas, y que el 17’62 % invierten menos de 1’6 horas.
(a) ¿Qué proporción de ejecutivos invierten entre 2 y 3 horas en esas tareas?
(b) Si se tomaran 10 ejecutivos al azar, ¿cuál es la probabilidad de que a lo sumo uno de ellos emplee más de 3’26 horas en estas labores?




2º A una ventanilla de una oficina de la Agencia Tributaria llegan aproximadamente 7  personas por hora. Generalmente, si acuden a la ventanilla más de 5 personas en una hora, se forma cola.
(a) ¿Cuál es la probabilidad de que se forme cola en una ventanilla en una hora determinada?
(b) Si en la oficina considerada hay 10 ventanillas, ¿cuál es la probabilidad de que en una hora se forme cola en más de 7 ventanillas?
(c) Si la Agencia Tributaria posee 210 oficinas (con 10 ventanillas cada una) en todo el país, ¿cuál es la probabilidad de que en una determinada hora haya al menos 1500 ventanillas con cola?





3º Un proveedor de cerraduras de puertas blindadas envía las piezas en lotes de 100 cerraduras a las fábricas que se dedican a la producción y comercialización de tales puertas. Como consecuencia de fallos en el proceso de fabricación, el proveedor se encontró con una serie de cerraduras defectuosas; pero, para evitar las pérdidas que se producirían si retira estas  piezas, decidió introducir 5 cerraduras defectuosas en cada uno de los lotes con la esperanza de que pasaran desapercibidas por los controles de calidad que realizan sus clientes, que consisten en seleccionar dos cerraduras al azar de un lote, de manera que, si ninguna presenta defectos, el lote será aceptado por la fábrica, y en caso contrario, será devuelto al proveedor.
(a) ¿Cuál es la probabilidad de que en el control de calidad de un lote se encuentre al menos una cerradura defectuosa?
(b) Si 51 clientes del proveedor han recibido un lote de cerraduras, ¿cuál es la probabilidad de que devuelvan el lote recibido menos de 4 clientes?