WHAT ARE YOU LOOKING FOR?

Popular Tags

La Computer Vision: un viaggio nel cuore dell'analisi visiva

Redazione SmartForCity Intelligenza artificiale 22 Marzo 2024

Il sempre crescente interesse, da parte di realtà governative ed industriali, nell’investire in soluzioni di Computer Vision da integrare nei propri sistemi produttivi e operativi per ottimizzarne le diverse fasi di processo è reso evidente dalla valutazione di mercato della computer vision, attestata a 15 miliardi di dollari nel 2022 e che, si prevede, raggiungerà 82,1 miliardi di dollari entro il 2032, con una crescita del 18,7% dal 2023 al 2032. Sebbene le applicazioni industriali siano fortemente richieste, l’intelligenza artificiale trova impiego e notevole seguito in differenti campi di applicazione, dall’automotive al medicale, ma anche e soprattutto nel sociale e nella sicurezza al fine di supportare e affiancare le persone nella vita di tutti i giorni.

All’interno dell’ampio campo di studio dell’intelligenza artificiale (AI), la computer vision identifica la capacità dei computer di analizzare ed estrarre informazioni significative da immagini e video. Gli algoritmi e i modelli sviluppati in questo ambito permettono ai computer di riprodurre funzioni e processi dell’apparato visivo umano. Nonostante questo tipo di algoritmi di intelligenza artificiale esistano in varie forme fin dagli anni ’60, i progressi nel Machine Learning degli ultimi 10 anni, così come i notevoli passi avanti nella memorizzazione dei dati, nelle capacità di calcolo e nei dispositivi di input di alta qualità a basso costo, hanno portato a notevoli miglioramenti nella capacità del software di esplorare questo tipo di contenuti.

Nella computer vision, le elaborazioni coinvolgono contenuti visivi come immagini, video, icone e qualsiasi altra raffigurazione grafica che sia composta da pixel. Sebbene possa sembrare un sistema semplificato per riuscire a riconoscere oggetti, persone o animali all’interno di un’immagine singola o in sequenza (video), la computer vision permette soprattutto di estrarre informazioni utili, a livelli sempre più alti di astrazione e comprensione, affinché vengano ulteriormente elaborate. Nello specifico, si tratta della capacità di estrarre dati significativi ricostruendo un contesto intorno all’immagine.

Per poter funzionare accuratamente, i sistemi di Computer Vision hanno bisogno di essere addestrati con una grande quantità di immagini che, opportunamente etichettate, andranno a costituire il dataset. I modelli di Computer Vision possono effettuare indagini più o meno approfondite su un’immagine, a seconda delle tecniche e delle reti utilizzate, delle caratteristiche immagine e del tipo di task considerato. Applicazioni software di questo tipo permettono di processare immagini o fotogrammi video analizzandone il contenuto mediante algoritmi matematici.

LE FASI DELL’ELABORAZIONE

L’intero processo, piuttosto complesso, inizia dall’acquisizione dell’immagine e il relativo preprocessing per migliorarne la qualità e si conclude con l’interpretazione dei risultati e la conseguente azione. Le due fasi principali intermedie del processo prevedono:

l’estrazione delle caratteristiche, in cui un algoritmo analizza i pixel di un’immagine per identificare le caratteristiche specifiche (valori di colore, forma, struttura) di oggetti o volti all’interno essa; e la classificazione, durante la quale vengono confrontate le caratteristiche estratte dal frame con modelli noti. Se viene superata una determinata soglia tra l’immagine/fotogramma in analisi e uno dei modelli noti, il software restituisce le corrispondenze e “ritaglia” le immagini in regioni o gruppi con proprietà simili.

I TASK EFFETTUABILI

In funzione dell’applicazione che si vuole sviluppare, si può scegliere uno o molteplici tra i possibili task a disposizione. Tra questi, i più utilizzati sono:

-l’Image Classification, ovvero l’analisi del contenuto dell’immagine e attribuzione di un’etichetta;

-l’Object Detection, in cui avviene l’identificazione di una o più entità all’interno di un’immagine; e

-la Semantic Segmentation, ovvero la suddivisione dell’immagine in sezioni.

Con l’evoluzione e il miglioramento di questi modelli, nuovi task come per esempio la Pose Estimation, la Face Recognition, l’Action Recognition e l’Emotion Recognition vengono implementati in applicazioni software, per poter essere integrati in svariate soluzioni tecnologiche ‘intelligenti’.

La computer vision, attraverso l’analisi e l’interpretazione di immagini e video, offre quindi soluzioni sempre più avanzate che spaziano dai settori industriali a quelli sociali e sanitari, promuovendo un impatto significativo sulla qualità della vita e sull’efficienza dei processi aziendali.

Fonte: Tecnopolo Bologna CNR

I contenuti redazionali di questo sito (articoli, editoriali, redazionali, video e podcast) sono soggetti ai seguenti Termini di utilizzo.
Redazione mediaGEO società cooperativa
Via Palestro, 95 00185 Roma.
P.I: 11534171001 - Tel. +39 06 64871209 Email: info@mediageo.it
www.mediageo.it

WHAT ARE YOU LOOKING FOR?

Popular Tags

La LoRa Alliance ritorna in Europa con LoRaWAN Live Munich

Il futuro delle città smart è collaborativo e basato su comunità di dati condivisi

Le top Smart Cities del mondo

TRAFFIC 2025: Bologna ospita la fiera della mobilità intelligente

Il progetto MASA: Modena Automotive Smart Area

Parclick ridefinisce la propria identità di marca con un nuovo rebranding

Moveo e il futuro delle Smart City

Smart city: un punto sull’infrastruttura

La nuova Consulta Roma Smart City Lab

Smart Governance e il suo ruolo nelle Smart City

Smart City e 5G: il matrimonio che s’ha da fare

ENVELOPE: in fase di test le nuove tecnologie e i veicoli del futuro del progetto europeo di Teoresi, Fondazione LINKS e il Comune di Torino

Come gli Open Data cambiano il modo di governare i Comuni medio-piccoli

Il gemello digitale di Perugia, un modello innovativo di governance urbana

Digital twin provides telcos with cellular coverage insight

Smart Urban Evolution: tecnologie per la penetrazione efficiente del vettore elettrico negli usi finali

Dublino lancia la mappa AR come parte della strategia del turismo intelligente

Dal BIM al CIM: il futuro delle Smart City

City Information Modeling (CIM): la rivoluzione digitale per le città intelligenti

La Computer Vision: un viaggio nel cuore dell'analisi visiva

Safer il sistema che rileva pericoli e migliora la sicurezza sui luoghi di lavoro

Safe DEMON: la soluzione per i conducenti professionali che rende le informazioni di sicurezza chiare e facilmente accessibili

La Computer Vision: un viaggio nel cuore dell'analisi visiva

Categorie

Risorse

About