Gli investitori utilizzano modelli del movimento dei prezzi delle attività per prevedere dove sarà il prezzo di un investimento in un dato momento. I metodi usati per fare queste previsioni fanno parte di un campo in statistica noto come analisi di regressione. Il calcolo del varianza residua di un insieme di valori è uno strumento di analisi di regressione che misura quanto accuratamente le previsioni del modello corrispondono ai valori effettivi.
Linea di regressione
Il linea di regressione mostra come il valore dell'asset è cambiato a causa di cambiamenti in diverse variabili. Inoltre conosciuto come a linea di tendenza, la linea di regressione mostra la "tendenza" del prezzo del bene. La linea di regressione è rappresentata da un'equazione lineare:
Y = a + bX
dove "Y" è il valore dell'asset, "a" è una costante, "b" è un moltiplicatore e "X" è una variabile correlata al valore dell'asset.
Ad esempio, se il modello prevede che una casa con una camera da letto vende per $ 300.000, una casa con due camere da letto vende per $ 400.000 e una casa con tre camere da letto vende per $ 500.000, la linea di regressione sarebbe simile a:
Y = 200.000 + 100.000X
dove "Y" è il prezzo di vendita della casa e "X" è il numero di camere da letto.
Y = 200.000 + 100.000 (1) = 300.000
Y = 200.000 + 100.000 (2) = 400.000
Y = 200.000 + 100.000 (3) = 500.000
dispersione
UN grafico a dispersione mostra i punti che rappresentano le effettive correlazioni tra il valore del bene e la variabile. Il termine "scatterplot" deriva dal fatto che, quando questi punti sono tracciati su un grafico, sembrano essere "sparpagliati" in giro, piuttosto che trovarsi perfettamente sulla linea di regressione. Utilizzando l'esempio sopra, potremmo avere uno scatterplot con questi punti dati:
Punto 1: 1BR venduto per $ 288.000
Punto 2: 1BR venduto per $ 315.000
Punto 3: 2BR venduti per $ 395.000
Punto 4: 2BR venduti per $ 410.000
Punto 5: 3BR venduti per $ 492,000
Punto 6: 3BR venduti per $ 507.000
Calcolo della varianza residua
Il calcolo della varianza residua inizia con somma dei quadrati delle differenze tra il valore del bene sulla linea di regressione e ogni valore del bene corrispondente sul grafico a dispersione.
I quadrati delle differenze sono mostrati qui:
Punto 1: $ 288.000 - $ 300.000 = ($ 12.000); (-12.000)2 = 144,000,000
Punto 2: $ 315.000 - $ 300.000 = (+ $ 15.000); (15.000)2 = 225,000,000
Punto 3: $ 395.000 - $ 400.000 = (- $ 5,000); (-5.000)2 = 25,000,000
Punto 4: $ 410.000 - $ 400.000 = (+ $ 10.000); (10.000)2 = 100,000,000
Punto 5: $ 492.000 - $ 500.000 = (- $ 8.000); (-8.000)2 = 64,000,000
Punto 6: $ 507.000 - $ 500.000 = (+ $ 7.000); (7000)2 = 49,000,000
Somma dei quadrati = 607.000.000
La varianza residua si ottiene prendendo la somma dei quadrati e dividendola per (n-2), dove "n" è il numero di punti dati sul diagramma a dispersione.
RV = 607.000.000 / (6-2) = 607.000.000 / 4 = 151.750.000.
Utilizza per la varianza residua
Mentre ogni punto sullo scatterplot non si allinea perfettamente con la linea di regressione, un modello stabile avrà i punti scatterplot in una distribuzione regolare attorno alla linea di regressione. La varianza residua è anche nota come "varianza dell'errore". Un'alta varianza residua mostra che la linea di regressione nel modello originale potrebbe essere in errore. Alcune funzioni del foglio elettronico possono mostrare il processo alla base della creazione di una linea di regressione che si avvicina ai dati del grafico a dispersione.