All’Ital-IA di Napoli 2024, la ricerca “Dictionary Learning for Data Compression within a Digital Twin Framework”, sviluppata grazie a EuroCC Italy

Il 29 maggio 2024, all’Ital-IA di Napoli, il convegno nazionale dedicato all’Intelligenza Artificiale e organizzato da CINI (Consorzio Interuniversitario Nazionale per l’Informatica), sarà presentata un importante ricerca, sviluppata da Laura Cavalli del Dipartimento HPC CINECA, sviluppata grazie al tirocinio “Working on the field” del programma formativo di EuroCC. 

Il paper, dal titolo “Dictionary Learning for Data Compression within a Digital Twin Framework”, presenta l’ingegnerizzazione di un workflow “DL4DT” per l’ottimizzazione del trasferimento di dati all’interno di un Digital Twin, che riduce drasticamente il tempo di comunicazione tra edge e Cloud. Il tool realizzato si basa sul metodo di compressione Dictionary Learning, che permette di addestrare algoritmi di AI con uguale accuratezza, trasferendo una quantità molto minore di dati – fino all’80% inferiore -, riducendo così i tempi di aggiornamento per il deploy di nuovi modelli da utilizzare in produzione sull’edge.

Il workflow presentato è in grado di operare in maniera efficiente su una vasta gamma di dataset, incluse immagini e serie temporali, e si adatta particolarmente bene all’implementazione su dispositivi con risorse computazionali limitate, utilizzabile sull’edge.

Il campo di applicabilità del workflow non si limita solo alla compressione di dati ma può essere anche utilizzato come tecnica di pre-elaborazione per la riduzione del rumore, aumentando la qualità del dato per il successivo training. La libreria sarà rilasciata a breve su GitHub EuroCC Italy e sarà utilizzabile in modalità Opensource dalle aziende italiane per un’ottimizzazione dei loro gemelli digitali.