Come calcolare la precisione dei dati

Sommario:

Anonim

La precisione dei dati è una delle considerazioni più importanti quando si eseguono analisi scientifiche o statistiche. Comunemente confuso con l'altrettanto importante concetto di accuratezza, l'analogia con le freccette articolata dall'Università delle Hawaii dimostra la relazione: i punti di dati accurati vanno mediamente ai risultati attesi, mentre i punti di dati precisi si raggruppano strettamente, anche se non sono vicini risultati attesi. Secondo il Dartmouth College, la precisione è una misura della riproducibilità di un insieme di risultati. La precisione nei set di dati è un concetto importante anche negli sforzi relativi alla tecnologia, come dimostrato da Kenneth E. Foote e Donald J. Huebner con l'Università del Texas-Austin in un'analisi dei sistemi di informazione geografica. Il calcolo della precisione è un esercizio abbastanza semplice, sebbene in qualche modo soggettivo.

Articoli di cui avrai bisogno

  • Rappresentazione grafica di un set di dati

  • Informazioni sulle unità rilevanti espresse nei dati

  • Margine di errore minimo consentito nell'esperimento

Sviluppa una rappresentazione visiva di punti dati come una trama a dispersione. Una rappresentazione visiva molto semplice comporta il tracciamento dei corrispondenti valori variabili dipendenti e indipendenti per ciascun punto di dati su un sistema di coordinate cartesiane.

Valuta i raggruppamenti di punti dati e cerca modelli. Dati precisi si manifesta in cluster di punti dati, indicando che variabili di input simili sono correlate a variabili di output simili.

Applicare informazioni sulle unità di misura utilizzate per raccogliere i dati per determinare la spaziatura media tra i punti dati. Una semplice misura del righello può essere utilizzata per determinare la distanza tra i punti sul grafico, quindi convertita utilizzando una scala arbitraria e comoda che corrisponde alle unità di misura utilizzate per generare i punti dati. Ciò consentirà di calcolare la precisione dei punti dei dati l'uno rispetto all'altro calcolando la media delle distanze.

Confrontare il margine di errore minimo consentito nell'esperimento e la precisione media dei punti di dati per determinare la precisione complessiva relativa dell'esperimento. Diversi tipi di esperimenti avranno tolleranza di errore maggiore o minore: un progetto di ingegneria richiederà probabilmente precisione fino a unità molto piccole, mentre un esperimento sociale probabilmente tollererà più varianza.

Suggerimenti

  • Cerca di valutare la probabile scala dell'unità prima di creare la rappresentazione grafica dei punti dati. Ciò renderà più semplice valutare visivamente la precisione al fine di identificare eventuali aree di precisione o imprecisione particolarmente notevoli.

    Modelli chiari di dati che si verificano su una rappresentazione visiva sono altamente indicativi di precisione e ripetibilità di un esperimento. La sperimentazione continua dovrebbe aggiungere ulteriori punti di dati in cluster precisi vicini a quelli già esistenti.

avvertimento

Non confondere l'accuratezza con precisione. Se l'obiettivo di un esperimento è di ottenere un valore di output medio di give per tutti gli input, e questo è ottenuto con valori medi compresi tra -12 e 14, è improbabile che questa sia una misura precisa, sebbene possa essere accurata. Una misurazione precisa potrebbe comportare il raggruppamento di tutti i punti di dati intorno a 17, che sarebbero inaccurati, ma precisi e quindi prevedibili.