Come trovare le varianze residue in Excel

Sommario:

Anonim

Nell'analisi statistica, il varianza tra i membri di un set di dati mostra quanto distanti i punti dati provengono da una linea di tendenza, anche nota come a linea di regressione. Maggiore è la varianza, maggiore è la dispersione dei punti di dati. Lo studio dell'analisi della varianza mostra quali parti della varianza possono essere spiegate dalle caratteristiche dei dati e che possono essere attribuite a fattori casuali. La parte della varianza che non può essere spiegata è chiamata varianza residua.

Utilizzare fogli di calcolo Excel per calcolare la varianza residua

La formula per calcolare la varianza residua coinvolge numerosi calcoli complessi. Per i piccoli set di dati, il processo di calcolo manuale della varianza residua può essere noioso. Per i set di dati di grandi dimensioni, l'attività può essere estenuante. Utilizzando un foglio di calcolo Excel, è sufficiente inserire i punti dati e selezionare la formula corretta. Il programma gestisce i calcoli complessi e fornisce rapidamente un risultato.

Punti dati

Apri un nuovo foglio di calcolo Excel e inserisci i punti dati in due colonne. Le linee di regressione richiedono che ogni punto di dati abbia due elementi. Gli statistici tipicamente etichettano questi elementi "X" e "Y." Ad esempio, Generic Insurance Co. vuole trovare la varianza residua dell'altezza e del peso dei propri dipendenti. La variabile X rappresenta l'altezza e la variabile Y rappresenta il peso. Immettere le altezze nella Colonna A e i pesi nella Colonna B.

Trovare la media

Il significare rappresenta la media per ogni elemento nel set di dati. In questo esempio, Generic Insurance vuole trovare la media, la deviazione standard e la covarianza di 10 altezze e pesi dei dipendenti. La media delle altezze elencate nella colonna A può essere trovata inserendo la funzione "= MEDIA (A1: A10)" nella cella F1. La media dei pesi elencati nella colonna B può essere trovata inserendo la funzione "= MEDIA (B1: B10)" nella cella F3.

Trovare la deviazione standard e la covarianza

Il deviazione standard misura la distanza tra i punti dati dalla media. Il covarianza misura quanto i due elementi del punto dati cambiano insieme. La deviazione standard delle altezze viene rilevata immettendo la funzione "= STDEV (A1: A10)" nella cella F2. La deviazione standard dei pesi viene rilevata immettendo la funzione "= DEV.ST (B1: B10)" nella cella F4. La covarianza tra l'altezza e il peso si trova immettendo la funzione "= COVAR (A1: A10; B1: B10)" nella cella F5.

Trovare la linea di regressione

Il linea di regressione rappresenta una funzione lineare che segue l'andamento dei punti dati. La formula per la linea di regressione è la seguente: Y = aX + b.

L'utente può trovare i valori per "a" e "b" utilizzando i calcoli per medie, deviazioni standard e covarianza. Il valore per "b" rappresenta il punto in cui la linea di regressione intercetta l'asse Y. Il valore può essere trovato prendendo la covarianza e dividendolo per il quadrato della deviazione standard dei valori X. La formula di Excel va nella cella F6 e assomiglia a questa: = F5 / F2 ^ 2.

Il valore per "a" rappresenta la pendenza della linea di regressione. La formula di Excel va nella cella F7 e assomiglia a questa: = F3-F6 * F1.

Per vedere la formula per la linea di regressione, inserisci questa concatenazione di stringhe nella cella F8:

= CONCATENATE ("Y ="; ROUND (F6; 2); "X"; IF (SIGN (F7) = 1; "+"; "-"); ABS (ROUND (F7; 2)))

Calcola i valori Y.

Il passo successivo consiste nel calcolare i valori Y sulla linea di regressione per i valori X dati nel set di dati. La formula per trovare i valori Y va nella colonna C e assomiglia a questa:

= $ F $ 6 * A (i) + $ F $ 7

Dove A (i) è il valore per la colonna A nella riga (i). Le formule hanno questo aspetto nel foglio di calcolo:

= $ F $ 6 * A1 + $ F $ 7

= $ F $ 6 * A2 + $ F $ 7

= $ F $ 6 * A3 + $ F $ 7, e così via

Le voci nella colonna D mostrano le differenze tra i valori attesi e quelli effettivi per Y. Le formule hanno questo aspetto:

= B (i) -C (i), Dove B (i) e C (i) sono i valori nella riga (i) nelle colonne B e C, rispettivamente.

Trovare la varianza residua

Il formula per varianza residua entra nella cella F9 e assomiglia a questo:

= SOMMA.Q (D1: D10) / (COUNT (D1: D10) -2)

Dove SUMSQ (D1: D10) è la somma dei quadrati delle differenze tra i valori Y effettivi e attesi e (COUNT (D1: D10) -2) è il numero di punti dati, meno 2 per i gradi di libertà nel dati.