Computer vision e intelligenza artificiale: innovazione o consolidamento di una tecnologia matura? Costo o opportunita?
Se stai valutando se introdurre sistemi di visione artificiale in produzione, la domanda giusta non è “siamo pronti per questa tecnologia?”. È corretto chiedersi: “quanto ci stiamo perdendo a non averla ancora? Riesco a quantificare quanto mi sta costando rinunciare a implementare sistemi di computer vision e intelligenza artificiale?”
Perché la visione artificiale è già una tecnologia matura
La visione artificiale non è di certo una novità. Le macchine “vedono” e controllano la qualità dei prodotti da oltre cinquant’anni. È una delle tecnologie fondanti dell’automazione industriale, consolidata, affidabile e presente nelle linee produttive di tutto il mondo — dall’automotive, all’alimentare, dalla farmaceutica all’elettronica. Non è una scommessa sul futuro: è uno strumento che funziona oggi, che ha già dimostrato il suo valore e che migliaia di aziende usano ogni giorno per produrre meglio, più velocemente e con meno scarti.
Cosa porta concretamente in produzione introdurre sistemi di computer vision e intelligenza artificiale?
In verità, si apre un mondo di irrinunciabili vantaggi. Qualche esempio? Robot che riescono a prendere pezzi senza il bisogno di costruire, installare e gestire posaggi, controllo qualità continuo senza cali di attenzione, senza personale dedicato operante su uno o più turni, senza variabilità umana. Misurazioni precise su ogni pezzo, non a campione. Tracciabilità automatica. Massima flessibilità e efficienza.
In questo articolo desideriamo fare chiarezza, in modo da capire cosa è la visione classica, dove entra in gioco l’AI, quali applicazioni sono già pronte per la tua linea e cosa devi sapere prima di scegliere un sistema, compresi gli aspetti che i “venditori di tutto e niente” raramente ti dicono.
Una tecnologia che precede l’intelligenza artificiale
Esiste un equivoco diffuso, purtroppo anche tra i professionisti del settore, che tende a sovrapporre computer vision e intelligenza artificiale come se fossero la stessa cosa. In verità non lo sono, e la distinzione non è solo accademica: ha implicazioni concrete sulle scelte tecnologiche, sui costi di implementazione e sulle competenze richieste.
Le macchine potevano “vedere” ben prima dell’arrivo dei sistemi di intelligenza artificiale idonei all’applicazione industriale. All’inizio degli anni ’70, i computer iniziarono a utilizzare algoritmi specifici per elaborare immagini e riconoscere caratteristiche di base: rilevare contorni per il posizionamento di componenti, individuare differenze di colore indicative di difetti, riconoscere raggruppamenti di pixel connessi che indicano la presenza di un foro.
Dobbiamo aspettare gli anni ’80 per vedere le prime applicazioni pratiche. Negli anni ’90 compaiono i primi frame-grabber standard: schede per collegare telecamere a un PC ed elaborarne le immagini. I sistemi di visione acquisiscono funzionalità e robustezza crescenti, abbandonando definitivamente l’aspetto sperimentale del decennio precedente, soprattutto in campo industriale.
Il punto fondamentale è questo: la visione artificiale è una delle tecnologie fondanti dell’automazione industriale. Per decenni ha contribuito a migliorare la flessibilità delle macchine, facilitare l’implementazione di robot, incrementare la qualità dei prodotti e ottimizzare manifattura e logistica. Solo negli ultimi anni ha iniziato a fondersi con l’IA, espandendo le potenzialità di due tecnologie che si amplificano vicendevolmente: computer vision e intelligenza artificiale
Visione classica: algoritmi deterministici senza AI
La visione artificiale classica si basa su operazioni che non richiedono alcun componente di intelligenza artificiale. Il cuore di questi sistemi è costituito da algoritmi deterministici e ripetibili. Le operazioni tipiche includono:
- Edge detection — rilevamento di bordi e contorni per localizzazione e misura
- Blob analysis — analisi di aree connesse per conteggio, forma e dimensione
- Pattern matching — confronto con template di riferimento per verifica presenza/assenza
- Misure geometriche — distanze, diametri, angoli, eccentricità
- Lettura codici — barcode, DataMatrix, QR, OCR
L’immagine, catturata e resa comprensibile dal calcolatore, viene elaborata con algoritmi in grado di individuare le caratteristiche rilevanti come contorni, spigoli, forme, strutture. Le stesse vengono amplificate allo scopo di eseguire i controlli per cui il sistema è stato progettato. Sulla base dei risultati, il sistema produce un output: può essere una decisione di qualità su un pezzo, la lettura di un codice da comunicare al MES, il rilevamento di quote che guidano un robot nel prelievo, o molte altre cose ancora. E tutto questo era già possibile prima dell’avvento dell’AI.
I vantaggi della visione classica rispetto agli approcci che coniugano computer vision e intelligenza artificiale sono concreti e in molti contesti ancora decisivi:
- Comportamento completamente trasparente e spiegabile
- Risultati prevedibili e verificabili a priori
- Nessun dataset di addestramento richiesto
- Ciclo di messa in servizio rapido
- Bassa latenza di elaborazione, compatibile con cadenze produttive elevate
- Facilità di certificazione in ambienti regolamentati
- Risultati certi e applicazioni facilmente replicabili
L’evoluzione verso l’AI: quando e perché
Il processo di integrazione tra computer vision e intelligenza artificiale non ha soppiantato la visione classica: l’ha affiancata per rispondere a problemi che gli algoritmi tradizionali non riuscivano a gestire in modo soddisfacente.
Sebbene la sperimentazione con reti neurali nella visione artificiale sia antecedente al 1996, è proprio a partire da quell’anno, soprattutto in Europa e in Giappone, che compaiono le prime applicazioni industriali capaci di risolvere brillantemente problemi complessi. Tuttavia, la difficoltà dell’addestramento e la non sempre omogenea qualità dei risultati hanno a lungo frenato la diffusione. I modelli prodotti dalle reti neurali, pur molto efficienti, non sono spiegabili in linguaggio simbolico umano: i risultati vanno accettati “così come sono”, da cui la definizione di black box. Di particolare interesse il lavoro di Benitez, Castro, Requena.
La svolta decisiva arriva nel 2012, quando AlexNet, una rete neurale convoluzionale, vinse in modo schiacciante la competizione ImageNet, segnando l’inizio dell’era moderna della computer vision basata sul deep learning. Il celebre “paper” è scaricabile in PDF a questo link.
Da quel momento, l’AI ha reso possibili applicazioni prima impensabili. Un sistema basato su reti neurali, ad esempio, è in grado di identificare e classificare anomalie superficiali che i metodi tradizionali non riuscivano a gestire con sufficiente affidabilità. E soprattutto cambia radicalmente il paradigma di configurazione: non è più necessario programmare il sistema con i parametri di pezzi conformi e non conformi. È sufficiente fornire immagini etichettate di pezzi buoni e pezzi scarto: la rete neurale viene addestrata e il sistema è operativo.
Computer vision e intelligenza artificiale: applicazioni nella produzione.
Il panorama attuale: controllo qualità e ispezione difetti
È l’applicazione più diffusa che vede protagonisti computer vision e intelligenza artificiale: nessuna produzione industriale può dirsi esente da difetti, e gran parte di essi è riscontrabile visivamente. I principali controlli di qualità ricadono nelle funzionalità tipiche della visione: ispezione superficiale, verifica di presenza e assenza di componenti, conteggio, verifica del colore.
La scelta tra visione classica e AI dipende dalla natura del difetto:
- Visione classica → difetti geometricamente definiti, assenza di componenti, variazioni di colore codificabili, misurazioni e conteggi
- AI / deep learning → difetti morfologicamente irregolari, superfici non uniformi, anomalie difficilmente classificabili a priori
Misurazione e verifica dimensionale
I sistemi di computer vision e intelligenza artificiale consentono misure a una o due dimensioni — diametri, lunghezze, altezze, eccentricità, linearità — fino a misure tridimensionali con calcoli di volume tramite immagini acquisite da più angolazioni. La visione è particolarmente indicata per misurare oggetti fragili o difficilmente raggiungibili con sistemi di misura a contatto.
Conteggio e localizzazione
Gli algoritmi di image processing identificano i singoli prodotti indipendentemente dalla loro posizione e ne contano il passaggio sulle linee produttive, eliminando i sistemi meccanici a contatto soggetti a usura. Si tratta di applicazioni integralmente basate su visione classica, consolidate e affidabili.
Guida robot e pick & place
Una parte significativa dei sistemi di computer vision e intelligenza artificiale è dedicata ai sistemi interfacciati a robot. Facciamo specifico riferimento ad applicazioni di carico e scarico in cui il robot deve individuare la posizione esatta di oggetti da prelevare da un nastro o da un cassone, adattandosi dinamicamente alla loro disposizione casuale.
Identificazione e tracciabilità
I sistemi di computer vision e intelligenza artificiale leggono codici a barre 1D, DataMatrix, QR Code e testi alfanumerici in OCR, inclusi i codici marcati direttamente sul componente (Direct Part Marking). Anche in questo ambito l’AI ha portato un contributo concreto: la rete neurale integrata nei moderni lettori migliora significativamente l’affidabilità di lettura su superfici difficili, angolazioni critiche o codici parzialmente degradati.
Architettura dei sistemi di computer vision e intelligenza artificiale: dall’hardware agli algoritmi
Il cuore del sistema di computer vision e intelligenza artificiale è costituito da una o più telecamere abbinate a sorgenti di luce opportunamente scelte, a cui si aggiunge l’intelligenza del sistema: gli algoritmi di elaborazione e il software di gestione. La progettazione è estremamente flessibile, poiché la scelta dei componenti è strettamente legata alle esigenze di produzione e ai requisiti di analisi.
Le principali architetture hardware disponibili sono:
- Smart camera — sistema compatto con elaborazione integrata; adatta a task semplici, spazi ridotti e budget contenuti
- PC industriale + telecamera separata — maggiore potenza elaborativa, ideale per applicazioni complesse o configurazioni multi-camera
- Sistemi embedded — soluzioni a basso consumo per installazioni distribuite su linea
I principali produttori mondiali offrono entrambe le tipologie con toolbox software che combinano strumenti di visione classica e moduli AI nello stesso ambiente di sviluppo. Lo stesso sistema può quindi integrare tool tradizionali e tool AI, scegliendo l’approccio più adatto per ciascuna problematica. Dopo il 2022 questi sistemi ibridi hanno raggiunto un livello di maturità che li rende oggi la scelta standard per la maggior parte delle applicazioni industriali.
Visione classica o sistemi di computer vision e intelligenza artificiale: come scegliere
La domanda pratica che ogni responsabile tecnico deve porsi non è “usiamo l’AI?” ma “quale approccio è più robusto per questo specifico problema?”.
In Trebi abbiamo maturato nel corso degli anni una solida esperienza nella progettazione di sistemi di visione artificiale. Da tempo integriamo in modo efficace computer vision e intelligenza artificiale in molti dei nostri progetti, ma non in tutti. Il fatto di avere una nuova tecnologia disponibile non significa però introdurla in modo indiscriminato. In altre parole l’approccio di Trebi è sempre di tipo consulenziale: progettiamo soluzioni efficienti ed efficaci, non vendiamo nulla a scatola chiusa.
Per questo possiamo permetterci di fornire alcuni consigli che, almeno in linea generale, possono essere utili per orientarsi meglio, e per spiegare in modo concreto il nostro modo di pensare, progettare e supportare il Cliente.
Scegliere la visione classica quando:
- Il difetto o la caratteristica da rilevare è ben definita e codificabile geometricamente
- La variabilità del prodotto è bassa e controllata
- È richiesta piena trasparenza e spiegabilità del processo decisionale, ad esempio in contesti certificati o regolamentati
- I tempi di ciclo sono molto rapidi e la latenza di inferenza di una rete neurale sarebbe incompatibile con la cadenza produttiva
- Non si dispone di un dataset di immagini etichettate per l’addestramento
Scegliere l’AI quando:
- La variabilità del difetto è elevata e difficilmente descrivibile con regole deterministiche
- Il prodotto presenta superfici irregolari o aspetto non uniforme
- Si vuole ridurre il tempo di configurazione e messa in servizio su nuovi prodotti
- Le caratteristiche da estrarre sono complesse e non codificabili manualmente
- E’ possibile eseguire le procedure di addestramento in modo efficace
In entrambi i casi, il vantaggio rispetto all’ispezione umana resta invariato: le macchine non si stancano, non si distraggono e mantengono la stessa precisione al primo pezzo come al milionesimo.
Quello che non ti dice chi ti vende i sistemi di visione
Chi vende sistemi di visione industriale, indipendentemente dalla coniugazione dei concetti di computer vision e intelligenza artificiale, tende a presentare demo in condizioni ottimali: illuminazione perfetta, pezzi fermi, background neutro. La realtà di una linea produttiva è radicalmente diversa, e i problemi che emergono in fase di implementazione raramente vengono anticipati durante la trattativa commerciale.
L’illuminazione è metà del sistema — forse anche di più. Una telecamera da migliaia di euro abbinata a un’illuminazione inadeguata produce risultati peggiori di una fotocamera economica ben illuminata. Vibrazioni, variazioni termiche, accumulo di polvere sulle ottiche, riflessi di superfici metalliche lucide, variazioni della luce ambiente: tutti questi fattori degradano nel tempo le prestazioni di un sistema progettato in condizioni di laboratorio. In molti casi un progetto si rivela irrealizzabile non per limiti della telecamera o del software, ma perché non si trova il modo di illuminare i pezzi correttamente.
In Trebi da anni studiamo con attenzione il problema dell’illuminazione, che se non gestito correttamente può azzoppare qualsiasi tentativo di coniugare computer vision e intelligenza artificiale. Dalla nostra esperienza possiamo sintetizzare un quadro di riferimento che pensiamo possa rappresentare un valido punto di partenza per iniziare a comprendere la complessità del problema.
Tipi di illuminazione nei sistemi di visione industriale
La scelta dell’illuminatore è una decisione tecnica a tutti gli effetti, propedeutica anche all’implementazione di qualsiasi sistema che coniughi i concetti di computer vision e intelligenza artificiale. Le principali soluzioni si differenziano per geometria, spettro e modalità di funzionamento.
Per geometria:
- Luce frontale diffusa — illumina il pezzo da angolazioni multiple, riduce ombre e riflessi; adatta per superfici opache e controlli di presenza/assenza
- Luce radente (darkfield) — fascio luminoso a basso angolo rispetto alla superficie; esalta graffi, rigature e difetti superficiali invisibili con illuminazione frontale
- Retroilluminazione (backlight) — il pezzo viene ripreso controluce; ideale per misure dimensionali precise, rilevamento fori, verifica di profili e sagome
- Illuminazione coassiale — luce proiettata lungo lo stesso asse ottico della telecamera tramite beam splitter; elimina i riflessi su superfici piane e lucide come vetro, metallo specchiato o wafer
- Luce polarizzata — filtri polarizzatori incrociati su sorgente e obiettivo sopprimono i riflessi speculari diretti, lasciando passare solo la luce che ha interagito con il materiale. Soluzione elettiva per superfici verniciate, plastiche, vetro e display; molto usata in automotive e nell’ispezione di schermi touch
Per spettro:
- Luce bianca — uso generale, buona resa cromatica
- Luce monocromatica (rosso, verde, blu, infrarosso) — ogni lunghezza d’onda interagisce diversamente con i materiali; la luce rossa penetra nei materiali traslucidi, quella blu aumenta il contrasto su superfici chiare, l’infrarosso rivela caratteristiche invisibili all’occhio umano
- Luce UV — eccita la fluorescenza di alcuni materiali; utile per rilevare tracce di colle, vernici o contaminanti organici
Per modalità di funzionamento:
- Illuminazione continua — semplice ed economica, adatta a linee lente
- Illuminazione stroboscopica — il flash sincronizzato con l’acquisizione congela il movimento del pezzo, elimina il motion blur su linee veloci e prolunga la vita degli LED; soluzione standard nelle installazioni su nastro ad alta cadenza
La scelta sbagliata dell’illuminatore è una delle cause più frequenti di sistemi che funzionano perfettamente in collaudo e falliscono in produzione. La regola pratica è semplice: prima si sceglie l’illuminazione, poi la telecamera.
Computer vision e intelligenza artificiale: spunti di riflessione.
Perchè Trebi non ha mai adottato un approccio “da venditore”, orientandosi invece alla progettazione orientata ai risultati, perseguendo in nome e per conto dei propri Clienti gli obiettivi di efficienza ed efficacia?
Perchè Trebi non ha sposato in modo esclusivo ed acritico i nuovi sistemi che coniugano computer vision e intelligenza artificiale, abbandonando la visione artificiale classica?
Potremmo semplicemente rispondere “perchè non ci nascondiamo dietro ad un dito”, ma sarebbe poco rispettoso della nostra esperienza e del valore che in realtà diamo al nostro e soprattutto al Vostro lavoro.
Ecco allora quattro puntualizzazioni che sicuramente Vi faranno rilettere, che riguardano aspetti sempre presenti, affrontati e risolti nelle nostre progettazioni.
1 – La variabilità del prodotto reale è sempre maggiore di quella attesa. I campioni presentati durante la fase di validazione appartengono spesso allo stesso lotto, con caratteristiche omogenee. In produzione arrivano pezzi con variazioni di finitura superficiale, tolleranze ai limiti, residui di lavorazione, graffi da movimentazione. Questa variabilità rende il setup lungo e complesso se non si è esperti nel gestirla.
2 – I sistemi AI richiedono dati, tempo e competenze. Un modello che integrei computer vision e intelligenza artificiale in modo affidabile richiede un numero significativo di immagini etichettate per ogni classe di difetto, incluse immagini di difetti rari che per definizione sono difficili da raccogliere. Il processo di setup può essere lungo e l’azienda che non dispone di competenze interne rischia di diventare dipendente dal fornitore per qualsiasi aggiornamento del modello.
3 – L’integrazione con i sistemi esistenti è quasi sempre più complessa del previsto. Un sistema di visione non è un’isola: deve comunicare con il PLC di linea, con il MES, con i sistemi di tracciabilità e con i database di qualità. Protocolli di comunicazione, tempi di risposta, gestione degli allarmi, archiviazione delle immagini dei pezzi scartati: ogni aspetto richiede ingegneria di integrazione che raramente è inclusa nel prezzo base.
4 – La consapevolezza di questi aspetti non deve scoraggiare l’adozione della tecnologia. I benefici derivanti dall’integrazione di computer vision e intelligenza artificiale restano reali e documentat. Essi devono orientare verso una valutazione rigorosa delle soluzioni, una fase pilota condotta in condizioni produttive reali e la scelta di un partner tecnico valutato non solo sul prezzo, ma sulla capacità di supporto nel tempo.
Conclusioni
Le implementazione di sistemi di computer vision e intelligenza artificiale nell’industria manifatturiera rappresentano una disciplina matura, con radici negli anni ’70 e applicazioni pratiche consolidate dagli anni ’80 e ‘9o. Tutto ciò ben prima che l’intelligenza artificiale diventasse accessibile alle aziende. Oggi è una delle tecnologie chiave dell’automazione industriale, con applicazioni trasversali a tutti i settori manifatturieri e di processo.
Computer vision e intelligenza artificiale: i messaggi chiave.
- La visione classica è ancora oggi la scelta corretta per luna vasta gamma di applicazioni industriali standard
- I sistemi integrati di computer vision e intelligenza artificiale hanno ampliato il perimetro applicativo, senza sostituire l’approccio tradizionale
- Le soluzioni più efficaci combinano i due approcci, scegliendo di volta in volta il più adatto al problema
- La scelta tecnologica deve partire dal problema, non dalla tecnologia o dalla convinzione astratta che combinare computer vision e intelligenza artificiale porti automaticamente vantaggi.
- Servono esperienza, capacità progettuali e realizzative consolidate per utilizzare in modo proficuo questi sistemi.
In Trebi abbiamo installato i primi sistemi di visione artificiale nel 2002, convinti fin da allora che questa tecnologia avrebbe rappresentato una direzione strategica per l’automazione industriale. Oggi installiamo quotidianamente sistemi di visione tradizionali e sistemi di computer vision e intelligenza artificiale, studiando in modo personalizzato ogni applicazione, per migliorare concretamente la produttività dei nostri Clienti.


