È ormai innegabile che negli ultimi anni l’intelligenza artificiale (AI) abbia fatto passi da gigante, dimostrandosi in grado di influenzare e rivoluzionare diversi settori. La recente notizia dell’open-sourcing di AudioCraft da parte di Meta ne è un ulteriore, sorprendente esempio: una suite di strumenti generativi di AI per la creazione di musica e suoni a partire da semplici promemoria di testo. Un traguardo senza dubbio affascinante che apre nuove prospettive e opportunità per la sperimentazione nel campo dell’audio digitale e della composizione musicale.
AudioCraft: una sinfonia di tecnologie al servizio della creatività
La suite di strumenti AudioCraft si compone di tre elementi principali. Il primo, AudioGen, è dedicato alla generazione di effetti sonori ed ambienti sonori vari, come il latrato di un cane, il clacson di un’auto o il rumore dei passi su un pavimento di legno. Il secondo, MusicGen, è in grado di creare composizioni musicali e melodie a partire da descrizioni testuali, come “Brano pop dance con melodie accattivanti, percussioni tropicali e ritmi coinvolgenti, perfetto per la spiaggia”. Infine, EnCodec è un codec di compressione audio basato su reti neurali che permette di generare musica di qualità superiore con meno artefatti.
Una sfida nell’universo dell’intelligenza artificiale
Sebbene la generazione di modelli di AI incentrati su testi e immagini fisse abbia ricevuto molta attenzione negli ultimi tempi (basti pensare ai successi di Stable Diffusion, DALL-E e Midjourney), lo sviluppo di strumenti generativi audio è rimasto fino a poco tempo fa confinato nel settore delle ricerche più sofisticate e meno accessibili al pubblico. La sfida nel campo dell’audio generativo, infatti, risiede nella capacità di modellare segnali e pattern complessi su diverse scale. Per esempio, la musica è considerata uno dei tipi di audio più difficili da generare, dal momento che è composta da pattern locali e a lungo raggio, spaziando dall’insieme di note alla struttura musicale globale con più strumenti coinvolti.
Le potenzialità offerte da AudioCraft
Grazie all’open-sourcing di AudioCraft, Meta offre ora a ricercatori, sviluppatori e curiosi del settore l’opportunità di esplorare e sperimentare con questi strumenti generativi audio. La suite sarà accessibile a tutti sotto la Licenza MIT, permettendo una maggiore diffusione e interazione tra gli utenti interessati, con la speranza che ciò porti ad avanzamenti ulteriori nel campo. La condivisione del codice degli strumenti AudioCraft su GitHub è già un passo importante nell’apertura delle porte alla comunità di sviluppatori e ricercatori.
Eticamente più responsabili?
In tempi in cui l’utilizzo di materiali di addestramento non divulgati o potenzialmente non etici nella creazione di modelli di sintesi di immagini ha sollevato molte polemiche, è interessante notare che Meta afferma di aver addestrato MusicGen su “20.000 ore di musica di proprietà di Meta o con licenza specifica per questo scopo”. Questa scelta sembra orientata verso una direzione più etica e responsabile nel rispetto dei diritti d’autore e della proprietà intellettuale, facendo ben sperare per le future applicazioni dell’intelligenza artificiale nel campo della creatività.
Le potenzialità che si aprono grazie all’introduzione di AudioCraft nel campo dell’audio generativo sono immense: la rivoluzione creativa portata avanti dall’intelligenza artificiale ci mostra quanto sia possibile ampliare i confini dell’immaginazione e dell’espressività umana grazie agli strumenti messi a disposizione dalla tecnologia. Quale sarà il prossimo capolavoro musicale generato da un’intelligenza artificiale? Sta a noi scoprirlo, giocando e sperimentando con le infinite possibilità offerte da AudioCraft e dalle future innovazioni che ne seguiranno.
Cosa ne pensi?
Mostra l'area commenti