Definizione ed esempio di livellamento dati |
06 Serie storiche: rappresentazioni tabulari e grafiche
Sommario:
Che cos'è:
Smussamento dati è una tecnica statistica che comporta la rimozione di valori anomali da un set di dati per creare un modello più visibile.
Come funziona (Esempio):
Ad esempio, diciamo che un'università sta analizzando i suoi dati sul crimine negli ultimi 10 anni. Il numero di crimini violenti assomiglia a questo:
Come puoi vedere, la maggior parte delle volte l'università sperimenta meno di 15 crimini all'anno. Tuttavia, nel 2006 e nel 2007, ha registrato 44 anni a causa di un obbligo di segnalazione sperimentale da parte del team di sicurezza pubblica dell'università. L'esperimento di segnalazione ha cambiato la definizione di crimine violento includendo furti di qualsiasi tipo in quegli anni, il che ha creato un grande salto nel numero di crimini "violenti" nel campus. Se includiamo questi anni nella media - ovvero, se facciamo un po 'di smoothing dei dati - l'università ha registrato una media di circa 19 crimini violenti all'anno. Ma se lasciamo quegli anni fuori, possiamo vedere che una media più realistica è di 13 crimini violenti all'anno - una differenza del 32%.
Perché è importante:
Ci sono molti modi per appianare i dati, incluso l'uso di movimento medie e algoritmi. L'idea è che il livellamento dei dati rende i pattern più visibili e quindi aiuta a prevedere le variazioni dei prezzi delle azioni, le tendenze dei clienti o qualsiasi altra informazione aziendale. Tuttavia, il livellamento dei dati può trascurare le informazioni chiave o rendere meno visibili i fatti importanti; in altre parole, "arrotondare i margini" dei dati può enfatizzare eccessivamente certi dati e ignorare altri dati.