L'analisi dei dati sperimentali può evidenziare la presenza di "outlier", ovvero valori che si discostano in modo anomalo dalla distribuzione attesa. Il criterio di Chauvenet fornisce un metodo statistico oggettivo per determinare se un dato sospetto debba essere rimosso dal set di [[Richiami di statistica per elaborazione di misure|statistica]] per non inficiare la stima del valore atteso.
#### Fondamenti statistici dello scarto
In un processo di [[Concetto di misura|misura]], una serie di $n$ osservazioni rappresenta un campionamento di una popolazione teoricamente infinita. Se si assume che gli errori casuali seguano una distribuzione gaussiana, ogni valore ha una probabilità intrinseca di verificarsi. Un valore estremamente lontano dalla media ha una probabilità molto bassa; se tale probabilità è inferiore a una certa soglia critica legata alla numerosità del campione, il dato viene considerato non rappresentativo del fenomeno fisico e attribuito a un errore grossolano o a un disturbo impulsivo.
### Il Criterio di Chauvenet
Il criterio stabilisce che un dato $X_s$ può essere scartato se la probabilità di ottenere uno scarto dalla media pari o superiore a $|X_s - \mu|$ è inferiore a $1/(2n)$.
#### Procedura operativa
1. Si calcolano la media $\mu$ e lo scarto tipo $s$ dell'intero set di $n$ misure (incluso il valore sospetto).
2. Si identifica il valore sospetto $X_s$ e si calcola il suo scostamento dalla media.
3. Si determina la probabilità $P_s$ che un valore cada all'esterno dell'intervallo simmetrico centrato sulla media e passante per $X_s$:
$ P_s = 1 - \int_{\mu - |X_s - \mu|}^{\mu + |X_s - \mu|} f(x) dx $
4. Si calcola il numero atteso di valori con tale scostamento in un campione di $n$ misure. Il criterio di Chauvenet autorizza lo scarto se:
$ \frac{1}{P_s} > 2n \quad \text{ovvero} \quad n \cdot P_s < 0.5 $
Questo significa che il valore può essere eliminato se ci si aspetterebbe di trovarne meno di "mezzo" in un campione di dimensione $n$. È fondamentale sottolineare che questo criterio può essere applicato **una sola volta** per ogni set di dati, per evitare di eliminare arbitrariamente la varianza reale del fenomeno.
### Esempi ed esercizi
Immagina di misurare il peso di un oggetto per 10 volti consecutive. Ottieni valori tra 17 e 18 kg, ma un dato della misura risulta essere di 30 kg.
- Se tieni quel dato, la media delle misure salirà moltissimo, dando un'idea sbagliata del peso reale dell'oggetto
- Il criterio di Chauvenet ti chiede: "In base alla dispersione delle altre 9 misure, quante probabilità ci sono che l'oggetto pesi effettivamente 30 kg?
##### Domande di teoria
- [ ] Perché il criterio di Chauvenet non può essere applicato iterativamente sullo stesso set di dati?
- [ ] Qual è l'ipotesi fondamentale sulla distribuzione dei dati necessaria per l'applicazione del criterio?
*Consultare le risorse consigliate in fondo alla nota per soluzioni e approfondimenti.*
##### Esercizi
- [ ] Misurando con un calibro il diametro di un albero otteniamo i valori (in mm): $3.13; 3.11; 3.15; 3.16; 3.14$ e $3.22$. Calcolare media e deviazione standard e verificare se il valore $3.22$ mm può essere scartato. | Rossi
- [ ] Dato un set di 50 misure con $\sigma = 0.5$, un valore che dista $2.5\sigma$ dalla media è scartabile secondo Chauvenet?
*Consultare le risorse consigliate in fondo alla nota per soluzioni e approfondimenti.*
### Collegamenti
---
> [!info]- Risorse
> ![[!Misure meccaniche e termiche#Risorse#Bibliografia]]
> ![[!Misure meccaniche e termiche#Risorse#Approfondimenti]]
---
> [!danger] Info
> ![[!Misure meccaniche e termiche#Collegamenti]]