L'analisi statistica dei dati sperimentali permette di descrivere la variabilità intrinseca dei risultati di misura ottenuti in condizioni di ripetibilità, fornendo modelli matematici per quantificare l'incertezza e la distribuzione dei valori.
### Rappresentazione dei dati e densità di probabilità
Nella pratica metrologica, la ripetizione di una misura sotto le medesime condizioni produce spesso valori differenti a causa di [[Ingressi e disturbi negli strumenti di misura|disturbi]] aleatori. Per analizzare globalmente questi dati si utilizza la **distribuzione di ampiezza.** Definendo la quantità $Z$ come il rapporto tra la frequenza relativa di una lettura e l'ampiezza dell'intervallo $\Delta x$:
$\color {orange} Z = \frac{n/N}{\Delta x} $
dove $n$ è il numero di letture nell'intervallo, $N$ il numero totale e $\Delta x$ l'ampiezza, è possibile costruire un **istogramma.**
L'area di ogni rettangolo rappresenta la probabilità che una misura ricada in quel determinato intervallo. Per un numero di campioni tendente all'infinito e un'ampiezza d'intervallo infinitesima, l'istogramma evolve in una curva continua definita **funzione densità di probabilità** (PDF):
$\color {orange} f(x) = \lim_{\Delta x \to 0} \frac{n/N}{\Delta x} $
![[Pasted image 20260504105603.png]]
*FIGURA 1: Istogramma della densità di probabilità*
L'integrale della PDF in un intervallo $[a, b]$ fornisce la probabilità $p_{axb}$ che la misura $x$ sia compresa in tale intervallo:
$ \int_{a}^{b} f(x) dx = p_{axb} $
La **funzione di distribuzione cumulata** $F(y)$ esprime invece la probabilità che una lettura sia inferiore a un valore $y$:
$ F(y) = \int_{-\infty}^{y} f(x) dx $
#### Distribuzione Gaussiana
Molti processi di misura, influenzati da molteplici cause di [[Tolleranza e incertezza|incertezza]] indipendenti, possono essere modellati tramite la distribuzione gaussiana (o normale).
La funzione **densità di probabilità gaussiana** è definita come:
$ \color {orange} f(x) = \frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}} $
Questa funzione è caratterizzata da due parametri fondamentali:
- **Media ($\mu$):** definisce la posizione della curva lungo l'asse delle ascisse (centro di simmetria).
- **Deviazione standard ($\sigma$):** determina la dispersione dei dati e la forma della "campana"; geometricamente rappresenta la distanza tra l'asse di simmetria e i punti di flesso.
![[Pasted image 20260504105614.png]]
Dato un set di $n$ misure sperimentali $x_1, x_2, \dots, x_n$, i parametri della popolazione ($\mu, \sigma$) vengono stimati tramite le relazioni:
$\color {green} \mu = \frac{1}{n} \sum_{i=1}^{n} x_{i} \quad \sigma = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n}(x_{i}-\mu)^{2}} $
#### Livelli di confidenza
L'area sottesa alla curva gaussiana *(calcolabile tramite [[Integrale alla Riemann|integrale]])* in intervalli simmetrici rispetto alla media definisce la probabilità che un valore appartenga a quell'intervallo, definendo il cosiddetto **livello di confidenza**:
- **Intervallo $\mu \pm \sigma$:** contiene circa il $68.3\%$ dei valori.
- **Intervallo $\mu \pm 2\sigma$:** contiene circa il $95.4\%$ dei valori.
- **Intervallo $\mu \pm 3\sigma$:** contiene circa il $99.7\%$ dei valori.
![[Pasted image 20260417174817.png]]
==Aumentare il livello di confidenza richiesto implica necessariamente l'ampliamento dell'intervallo di incertezza associato al [[Concetto di misura|valore misurato]].==
### Esempi ed esercizi
Immaginiamo di dover misurare il diametro di un albero meccanico con un micrometro. Se effettuiamo 100 misure, noteremo che i valori non sono identici ma si raggruppano attorno a un valore centrale.
- La **media ($\mu$)** è il nostro "bersaglio": il valore che più probabilmente rappresenta la dimensione reale.
- La **deviazione standard ($\sigma$)** indica quanto siamo "precisi": se $\sigma$ è piccolo, le misure sono tutte molto vicine tra loro (campana stretta); se $\sigma$ è grande, le misure sono disperse (campana larga).
Se diciamo di avere una confidenza del $95\%$, stiamo affermando che se facessimo una nuova misura, avremmo 95 probabilità su 100 che questa cada nell'intervallo $\pm 2\sigma$ dalla media.
##### Domande di teoria
- [ ] Qual è il significato fisico e geometrico del parametro $\sigma$ in una distribuzione normale?
- [ ] Perché l'area totale sottesa a una PDF deve essere sempre unitaria?
##### Esercizi
- [ ] Calcolare media e deviazione standard di un campionario per il seguente set di misure di temperatura ($^\circ C$): $[20.1, 20.2, 19.9, 20.0, 20.3]$.
- [ ] Data una distribuzione gaussiana con $\mu = 10$ mm e $\sigma = 0.05$ mm, determinare l'intervallo di valori che garantisce un livello di confidenza del $99.7\%$.
### Collegamenti
---
> [!info]- Risorse
> ![[!Misure meccaniche e termiche#Risorse#Bibliografia]]
> ![[!Misure meccaniche e termiche#Risorse#Approfondimenti]]
---
> [!danger] Info
> ![[!Misure meccaniche e termiche#Collegamenti]]