L'uso di sigma, noto anche come deviazione standard, può essere fonte di confusione. Tuttavia, è un ottimo strumento per analizzare qualsiasi insieme di dati. L'utilizzo dei limiti di controllo di due sigma può portare benefici all'analisi eliminando i dati non necessari e attenendosi solo ai dati pertinenti disponibili. Meglio di tutto, dal momento che la teoria che sta dietro ai limiti di controllo si basa sulla deviazione standard, la matematica è molto limitata.
Deviazione standard
Le misurazioni Sigma di qualsiasi tipo si basano sulla deviazione standard di una serie di numeri. La deviazione standard è una misura della variabilità all'interno di una serie di cifre. Un set di dati con una piccola quantità di differenza tra i numeri avrà una piccola deviazione standard, mentre un set di dati con tutti i tipi di numeri diversi avrà una deviazione standard più alta. La deviazione standard di un insieme di numeri è rappresentata dal carattere greco sigma, che è il luogo da cui provengono i termini come due sigma, tre sigma e sei sigma.
Distribuzione normale
L'uso della deviazione standard dipende in gran parte da una distribuzione normale, il che significa che i numeri all'interno del set di dati sono relativamente compressi. La maggior parte dei numeri si trova abbastanza vicino alla media, con pochi valori anomali che distorcono i dati. Se la distribuzione di un set di dati non è normale, l'analisi utilizzando la deviazione standard non funziona. Tuttavia, se il set di dati rientra nella distribuzione normale, è possibile imparare molto sui dati utilizzando la deviazione standard.
Due-Sigma
La distribuzione normale mostra come i numeri cadranno in base alla deviazione standard del set di dati. Le regole della distribuzione normale impongono che il 68 percento di tutti i numeri rientri in una deviazione standard della media, nota anche come la media di tutti i numeri nel set di dati. Aggiungendo deviazioni standard all'equazione significa che sono inclusi più numeri; utilizzando la distribuzione normale, il 95 percento di tutti i dati si trova entro due deviazioni standard della media. Questo 95 percento è un intervallo di confidenza molto comune usato quando si provano ipotesi, in quanto esclude valori anomali e si attacca alla fornitura principale di dati.
Two-Sigma in Business
Mentre two-sigma fornisce un buon livello di confidenza per l'analisi, non è una buona metodologia per la produzione. Se i limiti di controllo di qualsiasi processo di produzione rientrano in due deviazioni standard della media, tale processo è in serio pericolo. In sostanza dice che su un milione di unità prodotte, oltre 300.000 saranno difettose. Questo è un modo estremamente inefficiente per produrre qualsiasi merce. Produrre a un tasso di tre sigma porterebbe il livello di difetto a 66.000; mentre questo non è affatto perfetto, è quasi il 500 percento più efficiente rispetto alla produzione a due sigma.