CONCEPTOS BÁSICOS
Definición
La estadística es la ciencia que estudia
conjuntos de datos numéricos obtenidos de la realidad. Estos
datos son recopilados, clasificados, presentados, analizados e
interpretados. De ellos se obtienen conclusiones de importancia
social o científica.
Población: Se denomina población al universo a estudiar.
Muestra: Se denomina muestra al subconjunto de ese universo y del cual se recopilarán los datos. Es necesario que esa muestra sea debidamente representativa.
Por ejemplo, se quiere saber el número de hijos por matrimonio de un pequeño poblado. Para este propósito, se elige una muestra representativa de 50 matrimonios de ella. Se obtienen los siguientes datos:
2 , 2 , 4 , 1 , 3 , 5 , 3 , 2 , 1 , 6 , 3 , 4 , 1 , 2 , 0 , 2 , 3 , 1 , 7 , 4 , 2 , 3 , 0 , 5 , 1 , 4 , 3 , 2 , 4 , 1 , 5 , 2 , 1 , 2 , 4 , 0 , 3 , 3 , 2 , 6 , 1 , 5 , 4 , 2 , 0 , 3 , 2 , 4 , 3 , 1 .
El número total de datos se representa con la letra n. En este ejemplo n = 50.
Frecuencia absoluta ( fi )
La frecuencia absoluta es el número de veces que aparece un valor ( xi ) en los datos obtenidos.
En nuestro ejemplo, la frecuencia absoluta indica el número de familias que tienen esa cantidad de hijos:
Tabla:

|
x i |
f i |
|
0 |
4 |
|
1 |
9 |
|
2 |
12 |
|
3 |
10 |
|
4 |
8 |
|
5 |
4 |
|
6 |
2 |
|
7 |
1 |
Gráficos:



Frecuencia absoluta acumulada ( F i )
La frecuencia absoluta acumulada indica cuantos elementos de la lista de datos son menores o iguales a un valor dado. Es la suma de las frecuencias absolutas desde la primera fila hasta la fila elegida.
Por ejemplo, sabemos que hay 25 matrimonios de la muestra que tienen 2 o más hijos.
Tabla:
|
x i |
f i |
F i |
|
0 |
4 |
4 |
|
1 |
9 |
13 |
|
2 |
12 |
25 |
|
3 |
10 |
35 |
|
4 |
8 |
43 |
|
5 |
4 |
47 |
|
6 |
2 |
49 |
|
7 |
1 |
50 |
Gráficos:


Frecuencia relativa ( h i )
La frecuencia relativa es el cociente entre la frecuencia absoluta ( fi ) y el número total de datos ( n ).
En nuestro ejemplo:
Tabla:
|
x i |
f i |
F i |
h i |
|
0 |
4 |
4 |
0,08 |
|
1 |
9 |
13 |
0,18 |
|
2 |
12 |
25 |
0,24 |
|
3 |
10 |
35 |
0,20 |
|
4 |
8 |
43 |
0,16 |
|
5 |
4 |
47 |
0,08 |
|
6 |
2 |
49 |
0,04 |
|
7 |
1 |
50 |
0,02 |
Gráficos:


Frecuencia relativa acumulada ( Hi )
La frecuencia relativa acumulada es el cociente entre la frecuencia absoluta acumulada ( F i ) y el número total de datos ( n ).
En nuestro ejemplo:
Tabla:
|
x i |
f i |
F i |
h i |
H i |
|
0 |
4 |
4 |
0,08 |
0,08 |
|
1 |
9 |
13 |
0,18 |
0,26 |
|
2 |
12 |
25 |
0,24 |
0,50 |
|
3 |
10 |
35 |
0,20 |
0,70 |
|
4 |
8 |
43 |
0,16 |
0,86 |
|
5 |
4 |
47 |
0,08 |
0,94 |
|
6 |
2 |
49 |
0,04 |
0,98 |
|
7 |
1 |
50 |
0,02 |
1,00 |
Gráficos:


Frecuencia porcentual ( fi% )
La frecuencia porcentual es la frecuencia relativa ( hi ) expresada en forma porcentual. En otras palabras, es la frecuencia relativa ( hi ) multiplicada por 100.
En nuestro ejemplo:
Tabla:
|
x i |
f i |
F i |
h i |
H i |
f i % |
|
0 |
4 |
4 |
0,08 |
0,08 |
8 % |
|
1 |
9 |
13 |
0,18 |
0,26 |
18 % |
|
2 |
12 |
25 |
0,24 |
0,50 |
24 % |
|
3 |
10 |
35 |
0,20 |
0,70 |
20 % |
|
4 |
8 |
43 |
0,16 |
0,86 |
16 % |
|
5 |
4 |
47 |
0,08 |
0,94 |
8 % |
|
6 |
2 |
49 |
0,04 |
0,98 |
4 % |
|
7 |
1 |
50 |
0,02 |
1,00 |
2 % |
Gráficos:


Frecuencia porcentual acumulada ( Fi% )
La frecuencia porcentual acumulada es la frecuencia relativa acumulada ( Hi ) multiplicada por 100.
En nuestro ejemplo:
Tabla:
|
x i |
f i |
F i |
h i |
H i |
f i % |
F i % |
|
0 |
4 |
4 |
0,08 |
0,08 |
8 % |
8 % |
|
1 |
9 |
13 |
0,18 |
0,26 |
18 % |
26 % |
|
2 |
12 |
25 |
0,24 |
0,50 |
24 % |
50 % |
|
3 |
10 |
35 |
0,20 |
0,70 |
20 % |
70 % |
|
4 |
8 |
43 |
0,16 |
0,86 |
16 % |
86 % |
|
5 |
4 |
47 |
0,08 |
0,94 |
8 % |
94 % |
|
6 |
2 |
49 |
0,04 |
0,98 |
4 % |
98 % |
|
7 |
1 |
50 |
0,02 |
1,00 |
2 % |
100 % |
Gráficos:


Media aritmética ( M )
La media aritmética es el promedio aritmético de los valores numéricos obtenidos.

En nuestro ejemplo:

Mediana ( Me )
Al ordenar de mayor a menor (o al revés) los valores numéricos, la mediana es el valor central, si el número de ellos es impar, o el promedio aritmético de los valores centrales, si el número de datos es par.
En nuestro ejemplo, los valores centrales son 2 y 3 . Por lo tanto la mediana es 2,5.
Moda ( Mo )
La moda es el valor numérico de mayor frecuencia absoluta ( fi ). A veces hay más de un valor numérico que satisface lo anterior.
En nuestro ejemplo, la moda es 2.
Distribución de los datos en intervalos
A veces es más conveniente agrupar los datos en intervalos, por ejemplo los sueldos, en miles de pesos, de 100 trabajadores de un colegio están distribuidos de la siguiente forma:
|
Intervalo |
Marca de clase ( x i ) |
Frecuencia absoluta ( f i ) |
|
100 – 199 |
150 |
10 |
|
200 – 299 |
250 |
18 |
|
300 – 399 |
350 |
24 |
|
400 – 499 |
450 |
20 |
|
500 – 599 |
550 |
14 |
|
600 – 699 |
650 |
8 |
|
700 – 799 |
750 |
6 |
Observación: A falta de alguna causa especial, se toma como marca de clase al promedio aritmético de los valores extremos de cada intervalo, aproximadamente.
De esa manera es posible construir la tabla y gráfico, como en el ejemplo anterior.
Tabla:
|
x i |
f i |
F i |
h i |
H i |
f i % |
F i % |
|
150 |
10 |
10 |
0,10 |
0,10 |
10 % |
10 % |
|
250 |
18 |
28 |
0,18 |
0,28 |
18 % |
28 % |
|
350 |
24 |
52 |
0,24 |
0,52 |
24 % |
52 % |
|
450 |
20 |
72 |
0,20 |
0,72 |
20 % |
72 % |
|
550 |
14 |
86 |
0,14 |
0,86 |
14 % |
86 % |
|
650 |
8 |
94 |
0,08 |
0,94 |
8 % |
94 % |
|
750 |
6 |
100 |
0,06 |
1,00 |
6 % |
100 % |
Gráfico:

La media aritmética se calcula igual que en el ejemplo anterior:
