CONCEPTOS BÁSICOS

     

    Democracia: es una superstición muy difundida, un abuso de la estadística. (Jorge Luís Borges)

    Definición

    La estadística es la ciencia que estudia conjuntos de datos numéricos obtenidos de la realidad. Estos datos son recopilados, clasificados, presentados, analizados e interpretados. De ellos se obtienen conclusiones de importancia social o científica.

     

    Población: Se denomina población al universo a estudiar.

    Muestra: Se denomina muestra al subconjunto de ese universo  y  del cual se recopilarán los datos. Es necesario que esa muestra sea debidamente representativa.

    Por ejemplo, se quiere saber el número de hijos por matrimonio de un pequeño poblado. Para este propósito, se elige una muestra representativa de  50  matrimonios de ella. Se obtienen los siguientes datos:

    2 , 2 , 4 , 1 , 3 , 5 , 3 , 2 , 1 , 6 , 3 , 4 , 1 , 2 , 0 , 2 , 3 , 1 , 7 , 4 , 2 , 3 , 0 , 5 , 1 , 4 , 3 , 2 , 4 , 1 , 5 , 2 , 1 , 2 , 4 , 0 , 3 , 3 , 2 , 6 , 1 , 5 , 4 , 2 , 0 , 3 , 2 , 4 , 3 , 1 .

     

    El número total de datos se representa con la letra  n.  En este ejemplo  n = 50.

      

    Frecuencia  absoluta ( fi )

    La frecuencia absoluta es el número de veces que aparece un valor  ( xi )  en los datos obtenidos.

    En nuestro ejemplo, la frecuencia absoluta indica el número de familias que tienen esa cantidad de hijos:

     

    Tabla:

     

    x i

    f i

    0

    4

    1

    9

    2

    12

    3

    10

    4

    8

    5

    4

    6

    2

    7

    1

     

    Gráficos:

                       

     

                       

     

                               

     

    Frecuencia  absoluta  acumulada ( F i )

    La frecuencia absoluta acumulada indica cuantos elementos de la lista de datos son menores o iguales a un valor dado. Es la suma de las frecuencias absolutas desde la primera fila hasta la fila elegida.

    Por ejemplo, sabemos que hay  25  matrimonios de la muestra que tienen 2 o más hijos.

     

    Tabla:

    x i

    f i

    F i

    0

    4

    4

    1

    9

    13

    2

    12

    25

    3

    10

    35

    4

    8

    43

    5

    4

    47

    6

    2

    49

    7

    1

    50

    Gráficos:

    Frecuencia  relativa ( h i )

    La frecuencia relativa es el cociente entre la frecuencia absoluta  ( fi )  y  el número total de datos ( n ).

    En nuestro ejemplo:

     

    Tabla:

    x i

    f i

    F i

    h i

    0

    4

    4

    0,08

    1

    9

    13

    0,18

    2

    12

    25

    0,24

    3

    10

    35

    0,20

    4

    8

    43

    0,16

    5

    4

    47

    0,08

    6

    2

    49

    0,04

    7

    1

    50

    0,02

    Gráficos:

    Frecuencia  relativa  acumulada ( Hi )

    La frecuencia relativa acumulada es el cociente entre la frecuencia absoluta acumulada  ( F i )  y el número total de datos  ( n ).

    En nuestro ejemplo:

     

    Tabla:

    x i

    f i

    F i

    h i

    H i

    0

    4

    4

    0,08

    0,08

    1

    9

    13

    0,18

    0,26

    2

    12

    25

    0,24

    0,50

    3

    10

    35

    0,20

    0,70

    4

    8

    43

    0,16

    0,86

    5

    4

    47

    0,08

    0,94

    6

    2

    49

    0,04

    0,98

    7

    1

    50

    0,02

    1,00

    Gráficos:

    Frecuencia  porcentual ( fi% )

    La frecuencia porcentual es la frecuencia relativa  ( hi )  expresada en forma porcentual. En otras palabras, es la frecuencia relativa  ( hi )  multiplicada por  100.

    En nuestro ejemplo:

     

    Tabla:

    x i

    f i

    F i

    h i

    H i

    f i %

    0

    4

    4

    0,08

    0,08

    8 %

    1

    9

    13

    0,18

    0,26

    18 %

    2

    12

    25

    0,24

    0,50

    24 %

    3

    10

    35

    0,20

    0,70

    20 %

    4

    8

    43

    0,16

    0,86

    16 %

    5

    4

    47

    0,08

    0,94

    8 %

    6

    2

    49

    0,04

    0,98

    4 %

    7

    1

    50

    0,02

    1,00

    2 %

    Gráficos:

    Frecuencia  porcentual  acumulada ( Fi% )

    La frecuencia porcentual acumulada es la frecuencia relativa acumulada  ( Hi )  multiplicada por  100.

    En nuestro ejemplo:

     

    Tabla:

    x i

    f i

    F i

    h i

    H i

    f i %

    F i %

    0

    4

    4

    0,08

    0,08

    8 %

    8 %

    1

    9

    13

    0,18

    0,26

    18 %

    26 %

    2

    12

    25

    0,24

    0,50

    24 %

    50 %

    3

    10

    35

    0,20

    0,70

    20 %

    70 %

    4

    8

    43

    0,16

    0,86

    16 %

    86 %

    5

    4

    47

    0,08

    0,94

    8 %

    94 %

    6

    2

    49

    0,04

    0,98

    4 %

    98 %

    7

    1

    50

    0,02

    1,00

    2 %

    100 %

    Gráficos:

    Media  aritmética ( M )

    La media aritmética es el promedio aritmético de los valores numéricos obtenidos.

    En nuestro ejemplo:

     

    Mediana ( Me )

    Al ordenar de mayor a menor (o al revés) los valores numéricos, la mediana es el valor central, si el número de ellos es impar, o el promedio aritmético de los valores centrales, si el número de datos es par.

    En nuestro ejemplo, los valores centrales son  2  y  3 . Por lo tanto la mediana es  2,5.

     

    Moda ( Mo )

    La moda es el valor numérico de mayor frecuencia absoluta  ( fi ).  A veces hay más de un valor numérico que satisface lo anterior.

    En nuestro ejemplo, la moda es  2.

     

    Distribución de los datos en intervalos

    A veces es más conveniente agrupar los datos en intervalos, por ejemplo los sueldos, en miles de pesos, de 100 trabajadores de un colegio están distribuidos de la siguiente forma:

     

    Intervalo

    Marca de clase  ( x i )

    Frecuencia absoluta  ( f i )

    100 – 199

    150

    10

    200 – 299

    250

    18

    300 – 399

    350

    24

    400 – 499

    450

    20

    500 – 599

    550

    14

    600 – 699

    650

    8

    700 – 799

    750

    6

     

    Observación:  A falta de alguna causa especial, se toma como marca de clase al promedio aritmético de los valores extremos de cada intervalo, aproximadamente.

    De esa manera es posible construir la tabla y gráfico, como en el ejemplo anterior.

     

    Tabla:

    x i

    f i

    F i

    h i

    H i

    f i %

    F i %

    150

    10

    10

    0,10

    0,10

    10 %

    10 %

    250

    18

    28

    0,18

    0,28

    18 %

    28 %

    350

    24

    52

    0,24

    0,52

    24 %

    52 %

    450

    20

    72

    0,20

    0,72

    20 %

    72 %

    550

    14

    86

    0,14

    0,86

    14 %

    86 %

    650

    8

    94

    0,08

    0,94

    8 %

    94 %

    750

    6

    100

    0,06

    1,00

    6 %

    100 %

    Gráfico:

    La media aritmética se calcula igual que en el ejemplo anterior:

     

    volver arriba

    anterioriniciosiguiente