Richiami di statistica per elaborazione di misure

L'analisi statistica dei dati sperimentali permette di descrivere la variabilità intrinseca dei risultati di misura ottenuti in condizioni di ripetibilità, fornendo modelli matematici per quantificare l'incertezza e la distribuzione dei valori. ### Rappresentazione dei dati e densità di probabilità Nella pratica metrologica, la ripetizione di una misura sotto le medesime condizioni produce spesso valori differenti a causa di [[Ingressi e disturbi negli strumenti di misura|disturbi]] aleatori. Per analizzare globalmente questi dati si utilizza la **distribuzione di ampiezza.** Definendo la quantità $Z$ come il rapporto tra la frequenza relativa di una lettura e l'ampiezza dell'intervallo $\Delta x$: $\color {orange} Z = \frac{n/N}{\Delta x} $ dove $n$ è il numero di letture nell'intervallo, $N$ il numero totale e $\Delta x$ l'ampiezza, è possibile costruire un **istogramma.** L'area di ogni rettangolo rappresenta la probabilità che una misura ricada in quel determinato intervallo. Per un numero di campioni tendente all'infinito e un'ampiezza d'intervallo infinitesima, l'istogramma evolve in una curva continua definita **funzione densità di probabilità** (PDF): $\color {orange} f(x) = \lim_{\Delta x \to 0} \frac{n/N}{\Delta x} $ ![[Pasted image 20260504105603.png]] *FIGURA 1: Istogramma della densità di probabilità* L'integrale della PDF in un intervallo $[a, b]$ fornisce la probabilità $p_{axb}$ che la misura $x$ sia compresa in tale intervallo: $ \int_{a}^{b} f(x) dx = p_{axb} $ La **funzione di distribuzione cumulata** $F(y)$ esprime invece la probabilità che una lettura sia inferiore a un valore $y$: $ F(y) = \int_{-\infty}^{y} f(x) dx $ #### Distribuzione Gaussiana Molti processi di misura, influenzati da molteplici cause di [[Tolleranza e incertezza|incertezza]] indipendenti, possono essere modellati tramite la distribuzione gaussiana (o normale). La funzione **densità di probabilità gaussiana** è definita come: $ \color {orange} f(x) = \frac{1}{\sigma \sqrt{2 \pi}} e^{-\frac{(x-\mu)^{2}}{2 \sigma^{2}}} $ Questa funzione è caratterizzata da due parametri fondamentali: - **Media ($\mu$):** definisce la posizione della curva lungo l'asse delle ascisse (centro di simmetria). - **Deviazione standard ($\sigma$):** determina la dispersione dei dati e la forma della "campana"; geometricamente rappresenta la distanza tra l'asse di simmetria e i punti di flesso. ![[Pasted image 20260504105614.png]] Dato un set di $n$ misure sperimentali $x_1, x_2, \dots, x_n$, i parametri della popolazione ($\mu, \sigma$) vengono stimati tramite le relazioni: $\color {green} \mu = \frac{1}{n} \sum_{i=1}^{n} x_{i} \quad \sigma = \sqrt{\frac{1}{n-1} \sum_{i=1}^{n}(x_{i}-\mu)^{2}} $ #### Livelli di confidenza L'area sottesa alla curva gaussiana *(calcolabile tramite [[Integrale alla Riemann|integrale]])* in intervalli simmetrici rispetto alla media definisce la probabilità che un valore appartenga a quell'intervallo, definendo il cosiddetto **livello di confidenza**: - **Intervallo $\mu \pm \sigma$:** contiene circa il $68.3\%$ dei valori. - **Intervallo $\mu \pm 2\sigma$:** contiene circa il $95.4\%$ dei valori. - **Intervallo $\mu \pm 3\sigma$:** contiene circa il $99.7\%$ dei valori. ![[Pasted image 20260417174817.png]] ==Aumentare il livello di confidenza richiesto implica necessariamente l'ampliamento dell'intervallo di incertezza associato al [[Concetto di misura|valore misurato]].== ### Esempi ed esercizi Immaginiamo di dover misurare il diametro di un albero meccanico con un micrometro. Se effettuiamo 100 misure, noteremo che i valori non sono identici ma si raggruppano attorno a un valore centrale. - La **media ($\mu$)** è il nostro "bersaglio": il valore che più probabilmente rappresenta la dimensione reale. - La **deviazione standard ($\sigma$)** indica quanto siamo "precisi": se $\sigma$ è piccolo, le misure sono tutte molto vicine tra loro (campana stretta); se $\sigma$ è grande, le misure sono disperse (campana larga). Se diciamo di avere una confidenza del $95\%$, stiamo affermando che se facessimo una nuova misura, avremmo 95 probabilità su 100 che questa cada nell'intervallo $\pm 2\sigma$ dalla media. ##### Domande di teoria - [ ] Qual è il significato fisico e geometrico del parametro $\sigma$ in una distribuzione normale? - [ ] Perché l'area totale sottesa a una PDF deve essere sempre unitaria? ##### Esercizi - [ ] Calcolare media e deviazione standard di un campionario per il seguente set di misure di temperatura ($^\circ C$): $[20.1, 20.2, 19.9, 20.0, 20.3]$. - [ ] Data una distribuzione gaussiana con $\mu = 10$ mm e $\sigma = 0.05$ mm, determinare l'intervallo di valori che garantisce un livello di confidenza del $99.7\%$. ### Collegamenti --- > [!info]- Risorse > ![[!Misure meccaniche e termiche#Risorse#Bibliografia]] > ![[!Misure meccaniche e termiche#Risorse#Approfondimenti]] --- > [!danger] Info > ![[!Misure meccaniche e termiche#Collegamenti]]