domingo, 2 de marzo de 2014

PROBABILIDAD Y ESTADÍSTICA

PROBABILIDAD
Es un valor definido entre 0 y 1 incluidos estos valores que describe la posibilidad de ocurrencia de un evento.
La probabilidad de que ocurra un evento, siendo ésta una medida de la posibilidad de que un suceso ocurra favorablemente, se determina principalmente de dos formas: empíricamente (de manera experimental) o teóricamente (de forma matemática).
ESTADISTICA
es la parte de las Matemáticas que se encarga del estudio de una determinada característica en una población, recogiendo los datos, organizándolos en tablas, representándolos gráficamente y analizándolos para sacar conclusiones de dicha población.


 
 
 







En estos links se encuentran tutoríales de apoyo a los conceptos y desarrollo de cada materia.


UBICATE
ANTECEDENTES HISTORICOS
 
  • A mediados del siglo XVIII, nació la palabra estadística, que en ese entonces significaba el estudio delos arreglos políticos, pero la proporción creciente de los datos numéricos en las descripciones dio a la nueva palabra el carácter cuantitativo que ahora se asocia en ella.
  • La estadística implica procesos repetitivos

  •  POR EJEMPLO.
    Al lanzar un dado 100 veces se tiene el resultado de la presión sanguínea de 50 soldados, se suministra una prueba verbal de aptitud a 247 estudiantes, etc.
    Sera correcta alrededor del 95 % de las veces que en la teoría de la Probabilidad.
    Articulo 2 – Probabilidad & Estadística I.
    Edición. Prentice – Hall., Inc. USA.




























     En sus orígenes históricos, la Estadística estuvo ligada a cuestiones de Estado (recuentos, censos, etc.) y de ahí proviene su nombre. Hoy en día está presente en todos los ámbitos humanos, tanto individuales como colectivos.
           La Estadística surge ante la necesidad de poder tratar y comprender conjuntos numerosos de datos. Los estudios estadísticos, en la actualidad, impregnan numerosos ámbitos: sanidad, mundo empresarial, medios de comunicación, etc.
     
    TIPOS DE VARIABLE
    • CUALITATIVAS
    • CUANTITATIVAS DISCRETAS-CONTINUAS

    Variables cualitativas: son aquellas que estan definidas por una caracteristica no numerica,solo estudia caracteristicas del fenomeno.
    Variables cuantitativas: se describen en forma numerica de la caracteristica que se estudia.
    Variables discretas:son las que asumen ciertos valores despues de haber realizado un conteo
    Variables continuas: surgen de un proceso de medicion y pueden asumir cualquier valor en un rango especifico

    CENSO Y MUESTREO
     
    El termino censo se refiere a la obtencion de datos de cada uno de los miembros que conforman una poblacion.
    en todo estudio lo ideal seria llevar a cabo un censo,pues asi se conoceria muy bien  a la poblacion,pero cuando se tienen los recursos necesarios se recurr al muestreo.
     El muestreo es un conjunto de tecnicas empleadas para seleccionar la mejor muestra posible.

    METODOS DE MUESTREO

    El proceso de muestro comienza con la identificacion de fuentes adecuadas de estudio,como las listas de poblacion directores y mapas,entre otras son llamadas marcos.
    cabe señalar que si el marco es adecuado entonces las muestras tambien seran inadecuadas y nuestras estmaciones seran malas.
     
    Muestra no probabilistica: los elementos se eligen sin tener en cuenta su probabilidad de ocurrencia,es decir,sin tener en cuenta que suceda cierto resultado.
     Muestra probabilistica: Los elementos que la componen se eligen deacuerdo con las probabilidades de ocurrencia.

    MUESTREO ALEATORIO SIMPLE
    es la tecnica de muestro mas elemental,la muestra obtenida resulta de una seleccion hecha de tal manera que cada elemento de la poblacion tiene la misma oportunidad. (probabilidad)

    MUESTREO ALEATORIO SISTEMATICO

    En este muestreo se parte de una población de unidades numeradas en algún orden. Para seleccionar una muestra de unidades (siendo ) tomamos al azar una unidad entre las primeras unidades, y de ahí en adelante tomamos cada -ésima unidad. recibe el nombre de intervalo de selección.

    MUESTREO ALEATORIO ESTRATIFICADO
    Se utiliza cuando la poblacion esta dividida en grupos (estratos),comparten ciertas caracteristicas,asi se garantiza que cada miembro de la poblacion este formado uno solo,despues se toma una muestra de cada estrato y hacen comparaciones entre ellas.
    en una escuela por ejemplo: se divide en estratos seccion-grado-grupo

    MUESTRO POR CONGLOMERADO

    Consiste en dividir una poblacion en grupos usando cierto tipo de limite,por ejemplo geografico. se selecciona por conglomerados al azar y se recolecta una muestra eligiendo en forma aleatoria ekementos de cada uno de ellos
     por ejemplo
    gente en general
    delegaciones
    estados de la republica mexicana
     

    Distribución de frecuencias






    Es una ordenación tabulada de los datos recopilados en una investigación o estudio, de acuerdo a la clase o intervalo a que pertenece y con el número de veces o frecuencias que se repite. Una distribución de frecuencias se represente por medio de tablas de frecuencia y gráficas.



    Clases de frecuencias

    • Frecuencia absoluta.


    • La frecuencia absoluta de una variable estadística, es el número de veces que aparece en la muestra dicho valor de la variable, la representaremos por fi
    • Frecuencia relativa.




    • Es una medida útil para poder comparar. La frecuencia relativa es el cociente entre la frecuencia absoluta y el tamaño de la muestra. Generalmente se expresa en porcentaje. Se denota por fr
      Donde n = Tamaño de la muestra fi = frecuencia absoluta
    • Frecuencia Absoluta Acumulada.
    • Para poder calcular este tipo de frecuencias hay que tener en cuenta que la variable estadística ha de ser cuantitativa. La frecuencia absoluta acumulada de un valor de la variable, es el número de veces que ha aparecido en la muestra un valor menor o igual que el de la variable y lo representaremos por Fi.
    • Frecuencia Relativa Acumulada.


    • Al igual que en el caso anterior la frecuencia relativa acumulada es la frecuencia absoluta acumulada dividido por el tamaño de la muestra, y la denotaremos por Fr

      Ejemplo
      Tomamos para ello los datos relativos a las notas de una prueba de matemáticas.



      Rango de las notas( Intervalos)
      Número de notas (Frecuencia Absoluta)Frecuencia Absoluta AcumuladaFrecuencia Relativa (%)Frecuencia Relativa Acumulada (%)

      fiFifrFr
      1 - 2161616/50 = 32%32%
      2 - 32016 + 20 = 3620/50 = 40%32% + 40% = 72%
      3 - 4936 + 9 = 459/50 = 18%72% + 18% = 90%
      4 - 5545 + 5 = 505/50 = 10%90% + 10% = 100%
      Total50
      100%

    Pasos para elaborar una distribución de frecuencias

    1. Ordenar los datos u observaciones, desde el menor hasta el mayor o viceversa

    2. Se determina el rango o amplitud de la serie de datos, que es la diferencia entre el valor mayor y el valor menor.

      Rango o Amplitud = C = Xmax. – Xmin.

    3. Se determina el número de intervalos o clases (K) que se utilizan para agrupar los datos.

    4. En general se recomienda tener, hasta donde sea posible, tener entre 5 y 20 intervalos o clases. Sin embargo, si no se tiene seguridad del número de intervalos a utilizar, se puede aplicar la regla de Sturges, con la cual se obtiene una aproximación aceptable sobre el número de intervalos necesarios para agruparlos.

      Número de Intervalos = K = 1 + 3.322 log. n

    5. Una vez escogido el número de intervalos se determina la amplitud de cada clase o intervalo (C). Esta amplitud es igual al rango de los datos dividida en el número de intervalos. El primer intervalo debe contener el menor valor de los datos y el último intervalo debe contener el mayor valor de los datos.


    6. Se calcula la marca de clase (Xi), que es el valor medio o promedio de cada intervalo. el cual sirve para facilitar el cálculo de algunas medidas de posición y de dispersión.

    EjemploSe determinaron las ventas en millones de pesos durante el mes de junio, en 34 almacenes de la ciudad de Bogotá, obteniéndose los siguientes datos:
    AlmacénVentas*



    Almacén
    Ventas*AlmacénVentas*AlmacénVentas*AlmacénVentas*
    110.6811.61516.52212.3298.6
    212.5914.91615.0239.7308.5
    311.11012.51710.32412.03110.1
    49.21112.51812.42511.83212.4
    511.51212.3199.12612.73311.1
    69.91312.2207.82711.43410.2
    711.91410.82111.3289.3

    * Ventas en millones de pesos.

    Aplicando la fórmula de Sturges para el cálculo del número de intervalos en que se dividen las observaciones obtenemos:
    k = 1 + 3,322 log 34 = 1 + 3,322 • 1,53148 = 6,08757 Es decir, una sugerencia de 6 intervalos. Como el mayor valor es x(max) = 16.5 y el menor
    x(min) = 7.8, la amplitud sugerida es:
    Parece, por tanto, razonable tomar como amplitud 1,5, obteniendo como intervalos en los que clasificar los datos
    [7'5 - 9), [9 - 10'5), [10'5 - 12), [12 - 13'5), [13'5 - 15), [15 - 16'5]
    Los datos agrupados en los intervalos obtenidos, proporcionan la siguiente tabla de distribución de frecuencia.
    No de intervalosIntervalosfiFifrFrXi
    17'5 - 9'0338.8%8.8%8.25
    29'0 - 10'581123.6%32.4%9.75
    310'5 – 12'102129.4%61.8%11.25
    412' - 13'5103129.4%91.2%12.75
    513'5 – 15'1322.9%94.1%14.25
    615' - 16'52345.9%100%15.75
    Representación gráfica
    Los gráficos que representan de manera adecuada una distribución de frecuencias son:
    • Histograma de frecuencia
    • Está formado por un conjunto de rectángulos, cada uno levantado para cada intervalo, de tal manera que la base será igual a la amplitud C y la altura está dado, ya sea por la frecuencia absoluta o por la relativa. En el ejemplo de las ventas, (tabla anterior) tenemos:
    • Polígono de frecuencia
    • Con la misma información que fue utilizada para elaborar el histograma de frecuencia se puede dibujar el polígono de frecuencia. Se establece los puntos medios del intervalo, denominados marca de clase, que se colocan en el eje horizontal o abscisa. Para cada valor de la variable corresponderá un valor de la frecuencia señalándose en el plano cartesiano por un punto; luego de establecidos todos los puntos, se unen mediante líneas rectas, las que en conjunto forman el polígono. El polígono de frecuencia para el ejemplo anterior es:


      • Ojiva
      • Es el gráfico de las frecuencias acumuladas. Para el trazado de esta grafica, en primer lugar, se ubican los puntos en el plano cartesiano. Dichos puntos se determinan teniendo en cuenta la marca de clase (eje x) y las frecuencias absolutas o relativas acumuladas (eje y) tal como se presenta a continuación:




         

    Medida de tendencia central
     








     


    al describir grupos de observaciones, con frecuencia es conveniente resumir la información con un solo número. Este número que, para tal fin, suele situarse hacia el centro de la distribución de datos se denomina medida o parámetro de tendencia central o de centralización.
    Media:
    La media es el promedio de todos tus datos.
    Mediana:
    Es el valor central entre tus datos ordenados.
    Moda:
    Es el valor que se repite con mayor frecuencia a veces este valor puede repetirse.
    Medida de dispersión:
    Se llaman medidas de dispersión aquellas que permiten retratar la distancia de los valores de la variable a un cierto valor central, o que permiten identificar la concentración de los datos en un cierto sector del recorrido de la variable. Se trata de coeficiente para variables cuantitativas.
    El desvío estándar
    Es posible identificar conjuntos de datos que a pesar de ser muy distintos en términos de valores absolutos, poseen la misma media. Una medida diferencial para identificar esos conjuntos de datos es la concentración o dispersión alrededor de la media.
    Desvío estándar para datos sin agrupar
    Una manera que aparece como muy natural para construir una medida de dispersión sería promediar las desviaciones de la media.





    Rango
    En estadística descriptiva se denomina rango estadístico (R) o recorrido estadístico al intervalo de menor tamaño que contiene a los datos; es calculable mediante la resta del
    Valor mínimo al valor máximo; por ello, comparte unidades con los datos. Permite obtener una idea de la dispersión de los datos.
    Por ejemplo, para una serie de datos de carácter cuantitativo como es la estatura tal y como:
    X1 = 185, x2 = 165, x3 = 170, x4 = 182, x5 = 155
    Es posible ordenar los datos como sigue:
    x(1) = 155,x(2) = 165,x(3) = 170,x(4) = 182,x(5) = 185.


    VARIANZA
    Es la medida de dispersion mas importante,tiene como base al promedio aritmetico de las desviaciones para calcular la varianza de la poblacion.

    poblacional
    varianza
    muestralvarianza
      SESGO




    Describe la distribucion de datos ya que indica hacia donde tienden a concentrarse.


















     









    ejemplo>:

    poblacional



    PROBABILIDAD Y TEORIA DE CONJUNTOS
    El termino probabilidad se usa en la vida diaria para indicar cuan posible es que se presenta u ocurra un evento en el futuro.
    conocer algo o mucho del futuro nos ayuda a tomar decisiones es por ello la importancia de estudiar la probabilidad y como medirla asimismocomo emplearla en diferentes inferencias.

    TEORIA DE CONJUNTOS
    Para lograr un desarrollo ordinado de la teoria de la probabilidad se requiere conocer los conceptos basicos de la teoria de conjuntos. desde el punto de vista matematico un conjunto es la coleccion especifica descrita con claridad y los miembros del conjunto son los elementos que la componen
    decripcion de los conjuntos:
    -enumeracion
    -comprension
    -diagramas de veen


    • Forma Enumerativa, por Extension ó Forma Tabular:
    La representacion enumerativa de un conjunto consiste en escribir uno a uno los elementos que conforman un conjunto dado.

    Ejemplo:
    A = { a, e, i, o, u }
    B = { 0, 2, 4, 6, 8 }
    C = { c,o , n, j, u, t, s } En un conjunto determinado por extensión no se repite un mismo elemento.


    • Por Comprension ó Forma Descriptiva:
    Esta forma consiste en determinar la caracteristica comun entre los elementos que posee un conjunto.

    Ejemplo:
    A = { x/x es una vocal }
    B = { x/x es un número par menor que 10 }
    C = { x/x es una letra de la palabra conjuntos }


    UNIVERSO O CONJUNTO UNIVERSAL

    El conjunto que contiene a todos los elementos a los que se hace referencia recibe el nombre de conjunto Universal, este conjunto depende del problema que se estudia, se denota con la letra U y algunas veces con la letra S (espacio muestral).

    Por ejemplo si solo queremos referirnos a los 5 primeros números naturales el conjunto queda:

    U={ 1, 2, 3, 4, 5 }


    SUBCONJUNTO

    Sean los conjuntos A={ 0, 1, 2, 3, 5, 8 } y B={ 1, 2, 5 }

    En este caso decimos que B esta contenido en A, o que B es subconjunto de A. En general si A y B son dos conjuntos cualesquiera, decimos que B es un subconjunto de A si todo elemento de B lo es de A también.

    Por lo tanto si B es un subconjunto de A se escribe B Ì A. Si B no es subconjunto de A se indicará con una diagonal Ë .

    Note que Î se utiliza solo para elementos de un conjunto y Ì solo para conjuntos.


     
    CONJUNTO VACIO

    Un conjunto que no tiene elementos es llamado conjunto vacío ó conjunto nulo lo que denotamos por el símbolo Æ .



    Por ejemplo:

    Sean A={ 2, 4, 6 } y B={ 1, 3, 5, 7 } encontrar A Ç B.

    A Ç B= { }

    El resultado de A Ç B= { } muestra que no hay elementos entre las llaves, si este es el caso se le llamará conjunto vacío ó nulo y se puede representar como:

    A Ç B=Æ
    DIFERENCIA DE CONJUNTOS
    Se llama diferencia entre un conjunto A y otro conjunto B al conjunto formado por todos los elementos de A que no pertenece a B.
    A-B={x/x ϵ A ^ x Ɇ B}
    que se lee: A diferencia con B es el conjunto de las x tal que x pertenece al conjunto A y x no pertenece al conjunto B.
    Representacion gráfica:
    A={a,b,c,d,e,f} y
    B={a,e,c,m,r,s}
    A-B={b,d,f}



    INTERSECCION DE CONJUNTOS
    Se llama intersección de dos conjuntos R y S al conjunto formado por los elementos que pertenecen simultaneamente a R y S.
    R Ƞ S={x/x ϵ R ^ x ϵ S}
    que se lee: R intersección S es el conjunto formado por los elementos x tal que x pertenece a R y x pertenece a S.
    Representacion gráfica:
    R={m,n,r,s,t} S={m,q,n,p} R Ƞ S={m,n}



    UNIÓN DE MAS DE DOS CONJUNTOS
    Dados:
    A={2,3,4,5} B={4,5,6,7} C={7,8,9,3}
    A U B U C={2,3,4,5,6,7,8,9}
    A U B U C={x/x ϵ A v x ϵ B v x ϵ ʗ}
    Que se lee: A unión B unión C es igual al conjunto de las x tal x pertenece al conjunto A o x pertenece al conjunto B o x pertenece al conjunto C.
    Representacion Gráfica:








    TECNICAS DE CONTEO
     
     
    Las tecnicas de conteo sirven para determinar los casos posibles de un conjunto en donde no es posible o tan sencillo enumerar los elementos de un conjunto.



    Notación Factorial.Para todo número natural n, se llama n factorial o factorial de n, al producto de todos los naturales desde 1 hasta n.
    Que de un modo resumido, se puede expresar como:
    Se define 0! = 1, para que la relación n! = n × (n − 1)! sea también válida para n = 1. Esta relación permite definir los factoriales por recursividad.

    Por ejemplo, 5! = 5·4·3·2·1 = 120

    Por definición el factorial de 0 es 1: 0!=1

    Permutaciones.La permutación es aplicada para encontrar el número posible de arreglos donde hay solo u grupo de objetos. Como ilustración analizaremos el siguiente problema: Tres componentes electrónicos - un transistor, un capacitor, y un diodo - serán ensamblados en una tablilla de una televisión. Los componentes pueden ser ensamblados en cualquier orden. ¿De cuantas diferentes maneras pueden ser ensamblados los tres componentes?

    Las diferentes maneras de ensamblar los componentes son llamadas permutaciones, y son las siguientes:
    T D C D T C C D T
    T C D D C T C T D

    Permutación: Todos los arreglos de r objetos seleccionados de n objetos posibles
    La fórmula empleada para contar el número total de diferentes permutaciones es:
    n P r = n!_____
    (n – r )!
    Donde:
    nPr es el número de permutaciones posibles
    n es el número total de objetos
    r es el número de objetos utilizados en un mismo momento
    n P r = ___n! = 3! = 3 x 2 = 6
    (n – r )! ( 3 – 3 )! 1
    Ejemplo:
    Suponga que hay ocho tipos de computadoras pero solo tres espacios disponibles para exhibirlas en la tienda de computadoras. ¿De cuantas maneras diferentes pueden ser arregladas las 8 máquinas en los tres espacios disponibles?
    n P r = n! = 8! = 8! = 336
    (n – r )! ( 8 – 3 )! 5! En el análisis anterior los arreglos no presentan repeticiones, es decir, no hay dos espacios disponibles con el mismo tipo de computadora.

     
    Principio multiplicativo
    Se relacionan con la determinación de la ocurrencia de conjunta de dos o más eventos. Es decir la intersección entre los conjuntos de los posibles valores de A y los valores de B, esto quiere decir que la probabilidad de que ocurran conjuntamente los eventos A y B es:P(A y B) = P(A B) = P(A)P(B) si A y B

    Son independientes
    P(A y B) = P(A B) = P(A)P(B|A) si A y B

    Son dependientes
    P(A y B) = P(A B) = P(B)P(A|B) si A y B

    Son dependientes
    Si se desea realizar una actividad que consta de r pasos, en donde el primer paso de la actividad a realizar puede ser llevado a cabo de N1maneras o formas, el segundo paso de N2 maneras o formas y el r-ésimo paso de Nr maneras o formas, entonces esta actividad puede ser llevada a efecto de;

    N 1x N 2x..........x N r maneras o formas

    El principio multiplicativo implica que cada uno de los pasos de la actividad deben ser llevados a efecto, uno tras otro.

    Ejemplos:


    1)Una persona desea construir su casa, para lo cual considera que puede construir los cimientos de su casa de cualquiera de dos maneras (concreto o block de cemento),mientras que las paredes las puede hacer de adobe, adobón o ladrillo, el techo puede ser de concreto o lámina galvanizada y por último los acabados los puede realizar de una sola manera ¿cuántas maneras tiene esta persona de construir su casa?

    Solución:
    Considerando que r = 4 pasos

    N1= maneras de hacer cimientos = 2
    N2= maneras de construir paredes = 3
    N3= maneras de hacer techos = 2
    N4= maneras de hacer acabados = 1

    N1x N2x N3x N4= 2 x 3 x 2 x 1 = 12 maneras de construir la casa