Come determinare il tipo di distribuzione di probabilità per i dati

Sommario:

Anonim

Quando hai raccolto dati sul tuo sistema o processo, il passo successivo è determinare quale tipo di distribuzione di probabilità si ha. I tipi di distribuzioni di probabilità sono: uniforme discreta, Bernoulli, binomiale, binomiale negativo, Poisson, geometrica, uniforme continua, normale (curva a campana), esponenziale, gamma e beta distribuzioni. Restringere anche alcuni dalla lista delle possibilità rende molto più veloce determinare quale sia il valore del quadrato R più vicino.

Articoli di cui avrai bisogno

  • Software di grafica

  • Mezzi di calcolo del valore quadrato R (analisi della migliore vestibilità)

Tracciare i dati per una rappresentazione visiva del tipo di dati.

Uno dei primi passi per determinare quale distribuzione dati si ha - e quindi il tipo di equazione da usare per modellare i dati - è quello di escludere ciò che non può essere. • Se ci sono dei picchi nel set di dati, non può essere una distribuzione uniforme discreta. • Se i dati hanno più di un picco, non è Poisson o binomiale. • Se ha una curva singola, nessun picco secondario e una pendenza lenta su ciascun lato, potrebbe essere Poisson o una distribuzione gamma. Ma non può essere una distribuzione uniforme e discreta. • Se i dati sono equamente distribuiti e non hanno inclinazione verso un lato, è sicuro escludere una gamma o la distribuzione di Weibull. • Se la funzione ha una distribuzione uniforme o un picco nel mezzo dei risultati grafici, non è una distribuzione geometrica o una distribuzione esponenziale. • Se l'occorrenza di un fattore varia con una variabile ambientale, probabilmente non è una distribuzione di Poisson.

Dopo aver ristretto il tipo di distribuzione di probabilità, eseguire un'analisi quadratica R di ogni possibile tipo di distribuzione di probabilità. Quello con il valore R quadrato più alto è probabilmente corretto.

Elimina un punto dati anomalo. Quindi ricalcolare R al quadrato. Se lo stesso tipo di distribuzione di probabilità si presenta come la corrispondenza più vicina, vi è un'alta probabilità che questa sia la distribuzione di probabilità corretta da utilizzare per il set di dati.

Suggerimenti

  • Se i dati mostrano picchi multipli di dispersione ampia, è possibile che siano in corso due processi separati o che il prodotto da campionare sia misto. Ricorda i dati e poi ri-analizzare.

avvertimento

Convalidare le equazioni generate rispetto ai set di dati successivi per confermare che è ancora accurato per il set di dati. È possibile che fattori ambientali e deriva dei processi abbiano reso errate equazioni e modelli correnti.