Uno dei concetti di base in statistica è la media, o significato aritmetico, di un insieme di numeri. La media indica un valore centrale per il set di dati. Il varianza di un set di dati misura fino a che punto gli elementi di tale set di dati sono distribuiti dalla media. I set di dati in cui i numeri sono tutti vicini alla media avranno una bassa varianza. Quelle serie in cui i numeri sono molto più alti o più bassi rispetto alla media avranno un'alta varianza.
Calcola media del set di dati
Calcola le differenze al quadrato
Il prossimo passo consiste nel calcolare la differenza tra ogni elemento nel set di dati e la media. Poiché alcuni elementi saranno superiori alla media e alcuni saranno inferiori, il calcolo della varianza utilizza il quadrato delle differenze.
Giorno 1 Vendite - Vendite medie: $ 62.000 - $ 65414,29 = (- $ 3,414,29); (-3,414.29)2 = 11,657,346.94
Giorno 2 Vendite - Vendite medie: $ 64,800- $ 65414,29 = (- $ 614,29); (-614,29)2 = 377,346.94
Giorno 3 Vendite - Vendite medie: $ 62,600 - $ 65414,29 = (- $ 2,814,29); (-2,814.29)2 = 7,920,204.08
Giorno 4 Vendite - Vendite medie: $ 69.200 - $ 65414,29 = (+ $ 3,785,71); (+3,785.71)2 = 14,331,632.65
Giorno 5 Vendite - Vendite medie: $ 66.000 - $ 65414,29 = (+ $ 585,71); (585,71)2 = 343,061.22
Giorno 6 Vendite - Vendite medie: $ 63,900 - $ 65414,29 = (- $ 1,514,29); (-1,514.29)2 = 2,293,061.22
Giorno 7 Vendite - Vendite medie: $ 69,400 - $ 65414,29 = (+ $ 3,985,71); (+3,985.71)2 = 15,885,918.37
NOTA: Le differenze al quadrato non sono misurate in dollari. Questi numeri sono utilizzati nel passaggio successivo per calcolare la varianza.
Varianza e deviazione standard
La varianza è definita come la media delle differenze al quadrato.
11,657,346.94 + 377,346.94 + 7,920,204.08 + 14,331,632.65 + 343,061.22 + 2,293,061.22 + 15,885,918.37 = 52,808,571.43
52,808,571.43/7 = 7,544,081.63
Poiché la varianza utilizza il quadrato della differenza, la radice quadrata della varianza fornirà un'indicazione più chiara dello spread effettivo. In statistica, la radice quadrata della varianza è chiamata il deviazione standard.
SQRT (7,544,081,63) = $ 2,746,65
Utilizza per Varianza e Deviazione standard
Sia la varianza che la deviazione standard sono molto utili nell'analisi statistica. La varianza misura la diffusione complessiva di un set di dati dalla media. La deviazione standard aiuta a rilevare valori anomalio elementi dell'insieme di dati che si allontanano troppo dalla media.
Nel set di dati sopra riportato, la varianza è piuttosto alta, con solo due totali di vendite giornaliere che arrivano a meno di $ 1.000 della media. Il set di dati mostra anche che due dei sette totali di vendite giornaliere sono più di una deviazione standard sopra la media, mentre altri due sono più di una deviazione standard al di sotto della media.