Pagine

17 novembre 2015

Moda, mediana, media e scarto quadratico medio

L’indagine statistica ci permette di ottenere dati e quindi, in primo luogo, ci consente di calcolarne la frequenza, cioè il numero di volte con cui il dato è presente.
Il calcolo della frequenza dipende dal tipo di dato.
Una suddivisione dei dati statistici è quella tra dati discreti e continui. Intendiamo per dati discreti quelli che sono in numero finito ed espresso da numeri naturali. Ad esempio un’indagine che ci restituisca il numero dei visitatori settimanali di una mostra di pittura ci dà dei dati discreti, che possiamo rappresentare direttamente in tabella o con un istogramma.

GIORNI
FREQUENZA
lunedì
15
martedì
32
mercoledì
25
giovedì
20
venerdì
35
sabato
40
domenica
55
Tabella 1


Intendiamo invece per dati continui quelli espressi da numeri reali e che appartengono ad un intervallo.
Ad esempio, un’indagine sulle altezze di un gruppo di giocatori di calcio ci ha dato i seguenti risultati, espressi in metri.
1,79 – 1,81 – 1,81 – 1,82 – 1,83 – 1,76 – 1,79 – 1,77 – 1,81 – 1,80 – 1,82 – 1,85 – 2,00 – 1,82 – 1,83 – 1,74 – 1,76 – 1,77 – 1,77 – 1,78 – 1,71 – 1,70 – 2,02 – 1,87 – 1,71
E’ generalmente difficile trovare giocatori con la stessa altezza, alcuni dati sono presenti una sola volta e quindi avrebbe poco senso parlare di frequenza.

Prendiamo il valore minimo di 1,70 m ed il valore massimo di 2,02 m.
Calcoliamo la differenza (2,02 – 1,70) = 0,32 m trovando così l’ampiezza del raggruppamento.
Ora dobbiamo suddividere questa ampiezza in un numero di intervalli (o classi) uguali: ad esempio in 4 classi di 8 cm ciascuna. Avremo:
I intervallo da 1,70 m a 1,78 m
II intervallo da 1,78 m a 1,86 m
III intervallo da 1,86 m a 1,94 m
IV intervallo da 1,94 m a 2,02 m
Se un dato coincide con il valore di separazione di due classi, viene posto nella classe superiore. Se un giocatore è alto 1,86 m verrà considerato appartenente alla terza classe.
Adesso possiamo contare i giocatori per ogni classe individuata ed otterremo la distribuzione di frequenza. Il simbolo  ÷ sta ad indicare “da …. a ….”
CLASSI DI ALTEZZA
FREQUENZA
1,70 ÷ 1,78
9
1,78 ÷ 1,86
13
1,86 ÷ 1,94
1
1,94 ÷ 2,02
2
Tabella 2


Altri elementi di analisi che possiamo ricavare dai dati statistici sono la moda, la mediana, la media, lo scarto quadratico medio.
MODA
La moda è il dato statistico o la classe di dati che è presente con maggiore frequenza.
Ad esempio, nella tabella 1, la moda è la domenica.
Nella tabella 2 la moda è la classe 1,78 ÷ 1,86.
A cosa può servire la moda?
Se un’azienda ha intenzione di immettere un capo di abbigliamento sul mercato destinato ad una clientela femminile, può essere utile un’indagine per verificare quali taglie siano maggiormente richieste e regolare di conseguenza la produzione e la distribuzione.

MEDIANA
La mediana è il dato che occupa la posizione centrale in una distribuzione di dati disposti in ordine crescente o decrescente.
Consideriamo, ad esempio, le medaglie d’oro vinte da alcuni Stati ai campionati europei di nuoto di Berlino 2014.
Russia
9
Germania
6
Italia
8
Spagna
3
Svezia
3
Francia
5
Danimarca
6
Gran Bretagna
11
Ungheria
5

Ordiniamo i dati in modo crescente:
3 – 3 – 5 – 5 – 6 – 6 – 8 – 9 – 11
I dati sono presenti in numero dispari (9) quindi c’è una sola posizione centrale: la mediana è 6 perché è il dato che occupa il posto centrale.

Consideriamo ora le medaglie d’argento vinte da alcuni Stati sempre ai campionati europei di nuoto di Berlino 2014.
Gran Bretagna
8
Russia
7
Italia
3
Germania
8
Danimarca
1
Ungheria
6
Francia
4
Svezia
6
Spagna
5
Olanda
5


Ordiniamo i dati in modo decrescente:
8 – 8 - 7 – 6 – 6 - 5 – 5 – 4 – 3 – 1
Questa volta il numero dei dati è pari (10), quindi abbiamo due dati centrali: la mediana è la somma di questi due dati divisa per due, nel nostro caso la mediana è 5,5.

Se invece consideriamo dati che presentano ognuno una loro frequenza, dobbiamo ordinarli ripetendo ogni dato il numero di volte indicato dalla frequenza.
Ad esempio, consideriamo i voti raggiunti da una classe durante una verifica.
VOTI
FREQUENZA
4
1
5
2
6
7
7
5
8
5
9
2
10
1

4 – 5 – 5 – 6 – 6 – 6 – 6 – 6 – 6 – 6 – 7 – 7 – 7 – 7 – 7 – 8 – 8 – 8 – 8 – 8 – 9 – 9 – 10
La mediana è 7

MEDIA

La media aritmetica è il valore che si ottiene sommando tutti i dati e dividendo il totale per il numero dei dati.
Consideriamo le altezze dei giocatori già indicate in precedenza e calcoliamo la media, che si indica con 


= (1,79 +  1,81 + 1,81 +  1,82 + 1,83 +  1,76 +  1,79 + 1,77 +  1,81 +  1,80 +  1,82 +  1,85 +  2,00 + 1,82 +  1,83 + 1,74 +  1,76 + 1,77 +  1,77 +  1,78 +  1,71 +  1,70 +  2,02 + 1,87 +  1,71) / 25 = 1,81 (valore arrotondato ai centesimi)

Questo valore medio, preso di per sé, ci indica poco e non ci dà un’idea della frequenza dei dati dispersi attorno al valore medio. Può essere più utile allora considerare lo scarto, cioè la differenza tra un qualsiasi dato x e la media, che ci dà un’idea della distanza del dato dalla media.

Ad esempio lo scarto del dato 1,79 è 1,79 – 1,81 = - 0,02
Lo scarto del dato 1,85 è 1,85 – 1,81 = 0,04

Considerando gli scarti di tutti i dati possiamo ottenere lo scarto quadratico medio, cioè un indice della dispersione dei dati. Come procedere?
Calcoliamo gli scarti di tutti i dati, eleviamoli al quadrato e sommiamoli tra loro, otterremo una somma che dovremo dividere per il numero dei dati. Estraendo poi la radice quadrata troveremo lo scarto quadratico medio che si indica con il simbolo μ.

Otteniamo che μ = 0,07 (valore arrotondato ai centesimi) e possiamo notare che essendo lo scarto quadratico piuttosto piccolo, piccola sarà anche la dispersione dei dati attorno alla media, che quindi è significativa.

ESERCIZI

·        Ai 50 ragazzi di un club sportivo è stato chiesto qual era lo sport preferito; i risultati sono riportati in tabella. Completa la tabella con la percentuale di frequenza. Calcola poi la moda e la mediana
SPORT
Frequenza
%
Nuoto
20

Calcio
12

Ciclismo
6

Sci
3

Basket
3

Tennis
6



·        Al teatro Margherita  è stata registrata la presenza di spettatori  nel mese di aprile. Ecco i dati:

600      610      630      450      470      490      520      550      580      640
730      860      950      930      660      690      670      690      700      720                            
830      780      770      760      910      750      800      840      810      890

Raggruppa i dati nelle cinque classi della tabella, calcolane la distribuzione di frequenza e le percentuali (arrotondate alle unità)
CLASSI DI PRESENZE
FREQUENZA
%
450 ÷ 550
4
13
550 ÷ 650


650 ÷ 750


750 ÷ 850


850 ÷ 950



Qual è la moda tra le classi di presenze?
Calcola la media (arrotondata alle unità) tra i valori:

·        Ad una classe di 24 alunni è stata assegnata una prova di verifica. La tabella riporta i voti conseguiti. Completala calcolando la percentuale (arrotonda alle unità). Calcola la moda, la mediana e la media (arrotondata ai decimi)
N° alunni
Voto
%
1
4
4
3
5

4
6

5
7

6
8

3
9

2
10



MODA:
MEDIANA:

La media è =

Visualizza, scarica e stampa gli esercizi (in word, in pdf)

Visualizza, scarica e stampa le soluzioni (in word, in pdf)

08 ottobre 2015

Rappresentazione grafica di dati statistici


Consideriamo la seguente tabella della Fieg relativa alla vendita dei principali quotidiani nazionali nel 2003

Anno 2003
Avvenire
25.502.958
Corriere della Sera
239.181.387
Il Giornale
71.436.953
Il Giorno
28.641.650
Il Messaggero
87.085.316
La Repubblica
220.387.954
La Stampa
127.787.078
Libero
14.211.140
Tabella 1

I dati tabulati possono essere rappresentati graficamente in modi diversi.

Iniziamo con l’ideogramma. Possiamo arrotondare i valori alle unità di milione per facilitare la rappresentazione. Stabiliamo un simbolo da usare e un suo valore che deve essere appropriato alle quantità da rappresentare e procediamo alla rappresentazione.

Potremmo rappresentare anche usando un istogramma.


Ampliamo la tabella considerando un altro anno: abbiamo in questo caso una tabella multipla.


Anno 2003
Anno 2004
Avvenire
25.502.958
26.849.628
Corriere della Sera
239.181.387
239.665.546
Il Giornale
71.436.953
63.061.990
Il Giorno
28.641.650
21.803.180
Il Messaggero
87.085.316
84.553.520
La Repubblica
220.387.954
233.257.554
La Stampa
127.787.078
121.564.767
Libero
14.211.140
20.601.094
Tabella 3

Potremmo rappresentare anche questa tabella con un istogramma di questo tipo.


Possiamo anche trasformare i dati della tabella 1 in valori percentuali (ad esempio per Avvenire useremo questo metodo: 25.502.958 x 100 : 814.234.436 = 3,13… arrotondato a 3) e poi utilizzare un’altra rappresentazione grafica: l’areogramma.


Anno 2003
%
Avvenire
25.502.958
3
Corriere della Sera
239.181.387
29
Il Giornale
71.436.953
9
Il Giorno
28.641.650
3
Il Messaggero
87.085.316
11
La Repubblica
220.387.954
27
La Stampa
127.787.078
16
Libero
14.211.140
2
Totale
814.234.436




Per realizzare l’areogramma senza utilizzare programmi come Excel ci conviene, come abbiamo già fatto, calcolare il valore percentuale delle quantità considerate e poi rapportarlo a 360°.
Ad esempio:

La Stampa 16%

La Repubblica 27%
16 : 100 = x : 360

27 : 100 = x : 360

x = (360 x 16) : 100 = 57,60 che potremo arrotondare a 58°

x = (360 x 27) : 100 = 97,20 che potremo arrotondare a 97°


A questo punto sarà sufficiente, con l’aiuto del goniometro, individuare un angolo di 58° ed uno di 97° nel nostro angolo giro.


Consideriamo ora anche l’anno 2005 (per la chiarezza nella lettura del grafico mi limito a 5 quotidiani).


Anno 2003
Anno 2004
Anno 2005
Corriere della Sera
239.181.387
239.665.546
234.589.618
Il Messaggero
87.085.316
84.553.520
81.015.705
La Repubblica
220.387.954
233.257.554
219.169.418
La Stampa
127.787.078
121.564.767
108.850.770
Libero
14.211.140
20.601.094
24.302.104

Per poter cogliere visivamente l’andamento delle vendite, il grafico più utile è il diagramma cartesiano.


Notiamo subito una tendenza al calo delle vendite, soprattutto per La Stampa, il Corriere della Sera ed il Messaggero. Altalenante è l’andamento de La Repubblica mentre invece sono cresciute le vendite di Libero.

ESERCIZI

·        I risultati di una verifica effettuata in una classe di 26 alunni ha dato i seguenti risultati:
voto 5: 3 alunni; voto 6: 2 alunni; voto 7: 7 alunni; voto 8: 4 alunni; voto 9: 7 alunni; voto 10: 3 alunni.
Inserisci i dati in una tabella, calcola la percentuale e rappresenta con un istogramma.
·        Considera ora questa tabella multipla in cui i precedenti voti sono stati specificati per genere. Rappresenta con un istogramma.
VOTI
MASCHI
FEMMINE
5
2
1
6
2

7
3
4
8
1
3
9
3
4
10
2
1


·        Calcola le percentuali arrotondate e rappresenta con un areogramma.
Province
 Popolazione
residenti
%
AVELLINO
427.936

BENEVENTO
282.321

CASERTA
924.614

NAPOLI
3.118.149

SALERNO
1.108.509

TOTALE
5.861.529
100



·        Ecco una tabella relativa alle autovetture circolanti in Italia. I dati sono per 1000 abitanti. Realizza un diagramma cartesiano

Anno
Autovetture circolanti
1961
48
1971
209

1981
329

1991
501

2001
584

2009
606


Visualizza, scarica e stampa gli esercizi (in word, in pdf

Visualizza, scarica e stampa le soluzioni (in word, in pdf)