Organizzazioni industriali coinvolte

KEBULA è un Data Lab nato come spin-off dell’Università di Salerno, qualificato come start-up innovativa.
La missione di KEBULA è sbloccare il pieno potenziale dei dati per accendere il business di domani.
KEBULA aiuta i suoi clienti ad abilitare il loro viaggio nei dati e a migliorare le loro capacità di data engineering, analytics e AI.

KEBULA è un membro fondatore di MPAI (Moving Pictures and Data Coding with AI), che stabilisce nuovi standard per la codifica dei dati multimediali utilizzando l’intelligenza artificiale (AI).

Sfida tecnico-scientifica

Lo streaming video è ormai onnipresente e fondamentale per numerose applicazioni aziendali, tra cui lo streaming web, il telerilevamento e il monitoraggio satellitare.

Attualmente si sta cercando di progettare nuovi codec video in grado di ridurre il bitrate richiesto per la memorizzazione e la trasmissione di video di alta qualità.

L’uso dell’intelligenza artificiale è una direzione promettente a questo proposito. In particolare, i modelli di super-risoluzione possono consentire la trasmissione e la memorizzazione di video a bassa risoluzione, che possono poi essere scalati alla risoluzione desiderata senza una significativa perdita di qualità intrinseca ai metodi tradizionali di upscaling.

La Soluzione

I diversi modelli sono stati valutati utilizzando gli standard BD-PSNR e BD-RATE.

Tutti i modelli sono stati confrontati con il codec HEVC, regolato per le impostazioni di streaming. I modelli più grandi hanno registrato la migliore qualità di super-risoluzione: IconVSR ha ottenuto 1,127 BD-PSNR e –28,511% BD-RATE se calcolato sui 3 canali RGB. Quindi, in media, l’upscaling di video 1080p alla risoluzione 4K utilizzando IconVSR produrrebbe un PSNR superiore di 1,127 a parità di bitrate. Anche EDVR ha ottenuto risultati altrettanto buoni, con 1,101 BD-PSNR e -27,759% BD-RATE.

Tuttavia, questi modelli potevano funzionare rispettivamente solo a 0,79 e 0,73 FPS su Marconi100, rendendoli inadatti ad applicazioni in tempo reale. Al contrario, i modelli più piccoli si sono dimostrati promettenti per le applicazioni in tempo reale. Ad esempio, il modello EVSR di base può funzionare a 82,03 FPS su Marconi100.

 

Business Impact

Il progetto ha avuto diversi effetti positivi per KEBULA.

In primo luogo, KEBULA ha acquisito esperienza nell’esecuzione di training multi-nodo e multi-GPU.

In secondo luogo, KEBULA ha acquisito conoscenze ed esperienze sull’utilizzo di modelli di super-risoluzione video. La super-risoluzione sta guadagnando terreno negli ultimi anni, poiché può essere applicata a una varietà di applicazioni oltre alla compressione video. Con la disponibilità di GPU più potenti e il miglioramento dei modelli esistenti, si apriranno nuove possibilità di applicazione della super-risoluzione nel mondo reale.

Poiché KEBULA mira a coprire un’ampia gamma di pipeline di analisi e trasformazione dei dati, l’esperienza su questo tipo di modelli sarà sempre più rilevante per aprire nuove opportunità di business.

In terzo luogo, poiché il PoC è nato nell’ambito della collaborazione con MPAI per la progettazione di nuovi e migliori codec video potenziati da algoritmi di intelligenza artificiale, le conoscenze acquisite testando e valutando tutti i modelli descritti aiuteranno concretamente KEBULA a determinare i possibili percorsi per raggiungere questo obiettivo.

Benefici

  • I modelli sviluppati sono alla base del lavoro attuale e futuro di KEBULA con MPAI per gli algoritmi di compressione video.
  • Gli algoritmi di super-risoluzione implementati saranno utilizzati da KEBULA nel settore aerospaziale, dove le applicazioni hanno vincoli hardware e di potenza più severi.

Images Courtesy: Kebula