L'analisi digitale delle immagini consente di eseguire [[Misure di dimensioni|misure dimensionali]] in modo automatico, non a contatto e ad alta velocità. Questa metodologia è ampiamente diffusa nei sistemi di visione industriale per il controllo di processo in linea e il monitoraggio della qualità del prodotto finito.
```mermaid
graph TD
A[Analisi Immagini] --> B[Acquisizione]
A --> C[Elaborazione]
B --> D[Campo di Vista]
B --> E[Campionamento 2D]
C --> F[Binarizzazione]
C --> G[Stereo Visione]
```
### Acquisizione dell'immagine e parametri ottici
Un'immagine digitale in toni di grigio rappresenta un segnale bidimensionale di luminosità $I(x, y)$. Nel caso di immagini a colori, il segnale è composto da tre matrici distinte $I_{R}(x, y)$, $I_{G}(x, y)$ e $I_{B}(x, y)$, corrispondenti ai canali cromatici fondamentali RGB (rosso, verde, blu).
Il sistema ottico focalizza la radiazione luminosa sul sensore della telecamera (CCD o CMOS). La porzione di spazio inquadrata definisce il campo di vista $C$ (*Field of View*, FOV), calcolato tramite la relazione geometrica:
$C = l_{s} \left( \frac{d}{f} - 1 \right)$
dove:
- $f$ è la distanza focale del sistema di lenti;
- $l_{s}$ rappresenta la dimensione lineare (larghezza o lunghezza) del sensore;
- $d$ è la distanza di lavoro tra l'oggetto e la lente principale.
![[Pasted image 20260602191643.png]]
*Figura: Schema di acquisizione delle immagini con telecamera digitale.*
#### Campionamento spaziale e discretizzazione
Il sensore opera un [[Campionamento e quantizzazione|campionamento spaziale bidimensionale]] e una discretizzazione dell'intensità luminosa. L'intensità viene quantizzata su $2^b$ livelli (dove $b$ è la risoluzione in bit del convertitore), generando una matrice di $M \times N$ elementi detti **pixel.**
Un'immagine digitale può essere analizzata anche nel dominio delle frequenze spaziali. La transizione tra il dominio dello spazio bidimensionale e quello delle frequenze avviene tramite la **trasformata di Fourier discreta bidimensionale** (2D-DFT) e la sua inversa, fondamentali per l'applicazione di [[Filtri|filtri digitali]]:
$H_{j k} = \sum_{m=0}^{M-1} \sum_{n=0}^{N-1} h_{m n} e^{-i 2 \pi \left( \frac{j m}{M} + \frac{k n}{N} \right)}$
$h_{m n} = \sum_{j=0}^{M-1} \sum_{k=0}^{N-1} H_{j k} e^{+i 2 \pi \left( \frac{j m}{M} + \frac{k n}{N} \right)}$
La densità della griglia di campionamento determina la risoluzione spaziale dell'immagine e la capacità di distinguere dettagli geometrici complessi.
#### Segmentazione e misura dimensionale
Per effettuare una misura dimensionale (ad esempio, il diametro di un pistone), è necessario separare l'oggetto dallo sfondo. Questa operazione di segmentazione si basa sull'analisi dell'istogramma dei livelli di grigio, che rappresenta la distribuzione di frequenza dei pixel per ciascun livello di intensità (da $0$ per il nero a $255$ per il bianco in sistemi a 8 bit).
![[Pasted image 20260602191525.png]]
*Figura: Segmentation pipeline*
Definendo un valore di soglia ottimale (es. $50$), l'immagine viene binarizzata (ridotta a 1 bit):
- I pixel con intensità superiore alla soglia assumono valore $1$ (oggetto).
- I pixel con intensità inferiore assumono valore $0$ (sfondo).
Il conteggio del numero di pixel $n$ lungo la sezione d'interesse consente di ricavare la dimensione fisica reale tramite la relazione:
$D = n \cdot s$
dove $s$ è il fattore di scala ($\text{mm/pixel}$), determinato mediante una preventiva taratura con griglie a geometria nota. Questo fattore corregge anche eventuali [[Ingressi e disturbi negli strumenti di misura|disturbi]] geometrici indotti da aberrazioni ottiche.
### Stereo visione e ricostruzione 3D
La **ricostruzione tridimensionale** di un oggetto si ottiene mediante sistemi di stereo visione, che impiegano due o più telecamere sincronizzate per inquadrare lo stesso oggetto da prospettive differenti.
Attraverso relazioni di triangolazione geometrica tra i sistemi di riferimento delle telecamere e il sistema di riferimento nello spazio dell'immagine inquadrata, preventivamente calibrati con griglie di taratura ad alta precisione, è possibile calcolare le coordinate spaziali $(X, Y, Z)$ di punti d'interesse.
![[Pasted image 20260602191226.png]]
Applicando su un oggetto in moto dei **marker**, cioè dei punti particolari con una forma che può essere facilmente riconoscibile e seguita nei diversi fotogrammi digitali di un doppio filmato ripreso con due o più telecamere sincronizzate, è possibile misurare anche il moto tridimensionale dell'oggetto su cui sono applicati tali marker.
### Esempi ed esercizi
Immagina di voler misurare la larghezza di un foglio di carta usando una fotografia scattata dal tuo telefono. Se metti di fianco al foglio un righello, puoi contare quanti millimetri corrispondono a un singolo pixel della foto (questa è la calibrazione, che ti dà il fattore di scala $s$ in $\text{mm/pixel}$).
Per rendere la misura automatica e precisa, converti la foto in bianco e nero (binarizzazione): il foglio diventerà completamente bianco e lo sfondo del tavolo completamente nero. A questo punto, il computer non deve fare altro che contare quanti pixel bianchi ci sono in linea retta da un bordo all'altro del foglio e moltiplicare questo numero per il valore in millimetri di un singolo pixel.
##### Domande di teoria
- [ ] Spiegare come la distanza di lavoro $d$ e la lunghezza focale $f$ influenzano il campo di vista $C$ di un sistema di visione industriale.
- [ ] Descrivere il processo di binarizzazione basato sull'analisi dell'istogramma dei livelli di grigio e definire il concetto di sogliatura.
- [ ] Quali sono i parametri fondamentali da determinare durante la taratura di un sistema di stereo visione per la ricostruzione 3D?
##### Esercizi
- [ ] Un sistema di visione utilizza un sensore con larghezza $l_s = 6.4 \text{ mm}$ e un obiettivo con distanza focale $f = 12 \text{ mm}$. Se l'oggetto da misurare è posto a una distanza $d = 300 \text{ mm}$ dalla lente, calcolare il campo di vista $C$ del sistema.
- [ ] Durante la taratura di una telecamera a 8 bit, viene inquadrato un blocco campione da $50 \text{ mm}$. L'algoritmo rileva che il blocco occupa esattamente $400 \text{ pixel}$. Determinare il fattore di scala $s$ in $\text{mm/pixel}$ e calcolare la dimensione di un secondo oggetto che occupa $280 \text{ pixel}$ sotto le stesse condizioni di acquisizione.
### Collegamenti
---
> [!info]- Risorse
> ![[!Misure meccaniche e termiche#Risorse#Bibliografia]]
> ![[!Misure meccaniche e termiche#Risorse#Approfondimenti]]