Audio e video, l’annotazione automatica di A.I. Tech mediante metadata – Prima Parte

Pensate a centinaia di telecamera di sorveglianza installate in un aeroporto: qual è la probabilità che un operatore nella control room sia in grado di notare tempestivamente una persona che entra in un’area interdetta, o individuare un bagaglio abbandonato, o un comportamento sospetto di una persona?

Studi scientifici dimostrano che dopo 20 minuti di osservazione continua un normale operatore non noterà oltre il 90% di eventi rilevanti. Si consideri inoltre il caso in cui, ore o giorni dopo che sia avvenuto un evento criminoso, si renda necessario ricercare all’interno di ore di sequenze video catturate da decine di telecamere una persona vestita con colori specifici che passa attraverso una porta. L’operatore dovrebbe a questo punto visualizzare tutti i video con l’elevato rischio di non notare delle sequenze rilevanti.

La video content analysis (anche detta analisi video intelligente) costituisce un insieme di tecniche dell’Intelligenza Artificiale e della Computer Vision che consentono ad un calcolatore di analizzare un flusso video allo scopo di comprenderne il contenuto e di annotarlo automaticamente (i metadati) senza l’intervento umano. I sistemi di analisi video possono richiamare l’attenzione dell’operatore quando avviene qualche evento specifico nella scena inquadrata dalla telecamera e permettono di ridurre i tempi della ricerca offrendo all’operatore la possibilità di trovare solo quelle sequenze video che soddisfano alcuni criteri specificati dall’operatore stesso.

I metadati nella piattaforma di analisi audio e video di A.I. Tech

Quali sono i tipi di metadati estratti automaticamente dalla piattaforma di analisi audio e video di A.I. Tech? Come sono rappresentati ed inviati ai sistemi addetti alla fruizione (Video Management Systems, piattaforme di business intelligence)?

La piattaforma di A.I. Tech incorpora un motore di analisi video basato su algoritmi avanzati di object detection e tracking e di filtraggio del rumore che consente di rilevare con accuratezza diverse tipologie di eventi: conteggio persone, heat-map, superamento di linea, rilevamento di intrusioni, riconoscimento di comportamento sospetti, segnalazione di oggetti rimossi/incustoditi, rilevamento di fumo e fiamme, anche in condizioni ambientali complesse sia indoor che outdoor.

La piattaforma di A.I. Tech è ingegnerizzata in modo da utilizzare poche risorse di calcolo, consentendo di elaborare un elevato numero di flussi video contemporaneamente su server di fascia alta, o di elaborare a pieno frame rate un singolo flusso video a bordo della telecamera. Essa è disponibile sia come applicazione lato server, o come una applicazione in modalità “edge” in grado di poter essere eseguita a bordo di telecamere Axis, Hikvision e Samsung che supportano l’elaborazione embedded.

Inoltre, è anche disponibile per dispositivi di calcolo a basse prestazioni e basso consumo energetico (quali Raspberry Pi o altre piattaforme embedded basate su Linux) consentendo di decentrare (“to the edge”) l’elaborazione, anche laddove non siano disponibili telecamere che supportano l’esecuzione embedded.

L’offerta di A.I. Tech si arricchisce con la disponibilità di prodotti per l’analisi audio che consentono la rilevazione ed il riconoscimento di eventi audio (urla, rottura di vetri, esplosioni) sia in ambienti affollati che sterili, fornendo così metadati aggiuntivi a quelli già forniti dall’analisi video.

L’informazione fornita attraverso i metadati dipende dalla specifica funzione di analisi: in generale, essa include l’evento individuato dall’applicazione, con il riferimento temporale utile per associarli alla porzione rilevante del flusso video, insieme con informazioni riguardanti gli oggetti o le entità coinvolte: ad esempio, il bounding box degli oggetti, l’età stimata, il sesso e la razza della persona per eventi legati alla individuazione di volti.

Inoltre il sistema è in grado di fornire un’indicazione quantitativa del grado di confidenza della rilevazione, permettendo all’applicazione che usa i metadati di filtrare ed elaborare e/o riportare all’utente solo quelli che siano ritenuti sufficientemente affidabili.

Articolo precedente
Arteco e A.I. Tech: eccellenze italiane alla conquista del mondo
Articolo successivo
Audio e video, l’annotazione automatica di A.I. Tech mediante metadata – Seconda Parte

Post correlati

Nessun risultato trovato.

Menu