L’indagine statistica ci permette di ottenere dati e quindi, in primo luogo, ci
consente di calcolarne la frequenza,
cioè il numero di volte con cui il dato è presente.
Il calcolo della frequenza dipende dal tipo di dato.
Una suddivisione dei dati statistici è quella tra dati discreti e continui. Intendiamo per dati discreti quelli che sono in numero
finito ed espresso da numeri naturali. Ad esempio un’indagine che ci
restituisca il numero dei visitatori settimanali di una mostra di pittura ci dà
dei dati discreti, che possiamo rappresentare direttamente in tabella o con un
istogramma.
GIORNI
|
FREQUENZA
|
lunedì
|
15
|
martedì
|
32
|
mercoledì
|
25
|
giovedì
|
20
|
venerdì
|
35
|
sabato
|
40
|
domenica
|
55
|
Tabella 1
Intendiamo invece per dati continui quelli espressi da
numeri reali e che appartengono ad un intervallo.
Ad esempio, un’indagine sulle altezze di un gruppo di
giocatori di calcio ci ha dato i seguenti risultati, espressi in metri.
1,79 – 1,81 – 1,81 – 1,82 – 1,83 – 1,76 – 1,79 – 1,77 – 1,81
– 1,80 – 1,82 – 1,85 – 2,00 – 1,82 – 1,83 – 1,74 – 1,76 – 1,77 – 1,77 – 1,78 –
1,71 – 1,70 – 2,02 – 1,87 – 1,71
E’ generalmente difficile trovare giocatori con la stessa
altezza, alcuni dati sono presenti una sola volta e quindi avrebbe poco senso
parlare di frequenza.
Prendiamo il valore minimo di 1,70 m ed il valore massimo di
2,02 m.
Calcoliamo la differenza (2,02 – 1,70) = 0,32 m trovando
così l’ampiezza del raggruppamento.
Ora dobbiamo suddividere questa ampiezza in un numero di
intervalli (o classi) uguali: ad esempio in 4 classi di 8 cm ciascuna. Avremo:
I intervallo da 1,70 m a 1,78 m
II intervallo da 1,78 m a 1,86 m
III intervallo da 1,86 m a 1,94 m
IV intervallo da 1,94 m a 2,02 m
Se un dato coincide con il valore di separazione di due
classi, viene posto nella classe superiore. Se un giocatore è alto 1,86 m verrà
considerato appartenente alla terza classe.
Adesso possiamo contare i giocatori per ogni classe
individuata ed otterremo la distribuzione di frequenza. Il simbolo ÷ sta ad indicare “da
…. a ….”
CLASSI DI ALTEZZA
|
FREQUENZA
|
1,70 ÷ 1,78
|
9
|
1,78 ÷ 1,86
|
13
|
1,86 ÷ 1,94
|
1
|
1,94 ÷ 2,02
|
2
|
Tabella 2
Altri elementi di analisi che possiamo ricavare dai dati
statistici sono la moda, la mediana, la media, lo scarto quadratico medio.
MODA
La moda è il dato statistico o la classe di dati che è
presente con maggiore frequenza.
Ad esempio, nella tabella 1, la moda è la domenica.
Nella tabella 2 la moda è la classe 1,78 ÷ 1,86.
A cosa può servire la moda?
Se un’azienda ha intenzione di immettere un capo di abbigliamento
sul mercato destinato ad una clientela femminile, può essere utile un’indagine
per verificare quali taglie siano maggiormente richieste e regolare di
conseguenza la produzione e la distribuzione.
MEDIANA
La mediana è il dato che occupa la posizione centrale in una
distribuzione di dati disposti in ordine crescente o decrescente.
Consideriamo, ad esempio, le medaglie d’oro vinte da alcuni
Stati ai campionati europei di nuoto di Berlino 2014.
Russia
|
9
|
Germania
|
6
|
Italia
|
8
|
Spagna
|
3
|
Svezia
|
3
|
Francia
|
5
|
Danimarca
|
6
|
Gran Bretagna
|
11
|
Ungheria
|
5
|
Ordiniamo i dati in modo crescente:
3 – 3 – 5 – 5 – 6
– 6 – 8 – 9 – 11
I dati sono presenti in numero dispari (9) quindi c’è una
sola posizione centrale: la mediana è 6
perché è il dato che occupa il posto centrale.
Consideriamo ora le medaglie d’argento vinte da alcuni Stati
sempre ai campionati europei di nuoto di Berlino 2014.
Gran Bretagna
|
8
|
Russia
|
7
|
Italia
|
3
|
Germania
|
8
|
Danimarca
|
1
|
Ungheria
|
6
|
Francia
|
4
|
Svezia
|
6
|
Spagna
|
5
|
Olanda
|
5
|
Ordiniamo i dati in modo decrescente:
8 – 8 - 7 – 6 – 6
- 5 – 5 – 4 – 3 – 1
Questa volta il numero dei dati è pari (10), quindi abbiamo
due dati centrali: la mediana è la somma di questi due dati divisa per due, nel
nostro caso la mediana è 5,5.
Se invece consideriamo dati che presentano ognuno una loro
frequenza, dobbiamo ordinarli ripetendo ogni dato il numero di volte indicato
dalla frequenza.
Ad esempio, consideriamo i voti raggiunti da una classe
durante una verifica.
VOTI
|
FREQUENZA
|
4
|
1
|
5
|
2
|
6
|
7
|
7
|
5
|
8
|
5
|
9
|
2
|
10
|
1
|
4 – 5 – 5 – 6 – 6 – 6 – 6 – 6 – 6 – 6 – 7 – 7 – 7 – 7 – 7 – 8 – 8 – 8 – 8 –
8 – 9 – 9 – 10
La mediana è 7
MEDIA
La media aritmetica è il valore che si ottiene sommando
tutti i dati e dividendo il totale per il numero dei dati.
Consideriamo le altezze dei giocatori già indicate in
precedenza e calcoliamo la media, che si indica con
= (1,79 + 1,81 + 1,81 + 1,82
+ 1,83 + 1,76
+ 1,79
+ 1,77 + 1,81 + 1,80 + 1,82
+ 1,85
+ 2,00
+ 1,82 + 1,83
+ 1,74 + 1,76
+ 1,77 + 1,77
+ 1,78
+ 1,71 + 1,70 + 2,02 + 1,87 + 1,71)
/ 25 = 1,81 (valore arrotondato ai centesimi)
Questo valore medio, preso di per sé, ci indica poco e non
ci dà un’idea della frequenza dei dati dispersi attorno al valore medio. Può
essere più utile allora considerare lo scarto,
cioè la differenza tra un qualsiasi dato
x e la media, che ci dà un’idea della distanza del
dato dalla media.
Ad esempio lo scarto del dato 1,79 è 1,79 – 1,81 = - 0,02
Lo scarto del dato 1,85 è 1,85 – 1,81 = 0,04
Considerando gli scarti di tutti i dati possiamo ottenere lo
scarto quadratico medio, cioè un indice
della dispersione dei dati. Come procedere?
Calcoliamo gli scarti di tutti i dati, eleviamoli al
quadrato e sommiamoli tra loro, otterremo una somma che dovremo dividere per il
numero dei dati. Estraendo poi la radice quadrata troveremo lo scarto
quadratico medio che si indica con il simbolo μ.
Otteniamo che μ = 0,07 (valore arrotondato ai centesimi) e
possiamo notare che essendo lo scarto quadratico piuttosto piccolo, piccola
sarà anche la dispersione dei dati attorno alla media, che quindi è
significativa.
ESERCIZI
·
Ai 50 ragazzi di un club sportivo è stato
chiesto qual era lo sport preferito; i risultati sono riportati in tabella.
Completa la tabella con la percentuale di frequenza. Calcola poi la moda e la
mediana
SPORT
|
Frequenza
|
%
|
Nuoto
|
20
|
|
Calcio
|
12
|
|
Ciclismo
|
6
|
|
Sci
|
3
|
|
Basket
|
3
|
|
Tennis
|
6
|
·
Al teatro Margherita è stata registrata la presenza di
spettatori nel mese di aprile. Ecco i
dati:
600 610 630 450 470 490 520 550 580 640
730 860 950 930 660 690 670 690 700 720
830 780 770 760 910 750 800 840 810 890
Raggruppa i dati nelle cinque classi della tabella,
calcolane la distribuzione di frequenza e le percentuali (arrotondate alle
unità)
CLASSI DI PRESENZE
|
FREQUENZA
|
%
|
450 ÷ 550
|
4
|
13
|
550 ÷ 650
|
||
650 ÷ 750
|
||
750 ÷ 850
|
||
850 ÷ 950
|
Qual è la moda tra le classi di presenze?
Calcola la media (arrotondata alle unità) tra i valori:
·
Ad una classe di 24 alunni è stata assegnata una
prova di verifica. La tabella riporta i voti conseguiti. Completala calcolando
la percentuale (arrotonda alle unità). Calcola la moda, la mediana e la media
(arrotondata ai decimi)
N° alunni
|
Voto
|
%
|
1
|
4
|
4
|
3
|
5
|
|
4
|
6
|
|
5
|
7
|
|
6
|
8
|
|
3
|
9
|
|
2
|
10
|
MODA:
MEDIANA:
La media è =