Stability AI, una società nota per le immagini generate dall’intelligenza artificiale, ha introdotto una nuova piattaforma chiamata Stable Audio, dedicata alla generazione di audio da testo.
In precedenza, l’audio generato da clip di 30 secondi poteva creare solo audio della stessa durata, limitando la creatività. Tuttavia, con l’ultimo aggiornamento del modello, Stability AI offre agli utenti di Stable Audio un maggiore controllo sulla durata delle composizioni musicali.
Stable Audio di Stability AI fa uso di un modello di diffusione, lo stesso utilizzato per alimentare la piattaforma di immagini più famosa dell’azienda, Stable Diffusion. Questo modello, invece di essere addestrato con immagini, è stato formato utilizzando dati audio. Gli utenti possono ora sfruttarlo per generare brani musicali o audio di sottofondo per vari progetti.
La piattaforma permette agli utenti di produrre suoni di diverse durate, offrendo la possibilità di aggiungere metadati di testo che indicano l’inizio e la fine di una canzone.
La generazione di audio da testo non è una novità nel mondo dell’intelligenza artificiale generativa, con altri importanti attori come Meta con AudioCraft e Google con MusicLM che hanno esplorato concetti simili.
Per quanto riguarda i costi, la versione gratuita di Stable Audio consente di creare fino a 45 secondi di audio per un massimo di 20 tracce al mese, ma non è consentito l’uso commerciale. Per funzionalità più avanzate, sono disponibili tre livelli di prezzo:
- Versione gratuita con restrizioni sull’uso commerciale.
- Piano Professionale a $11,99 al mese, che offre la creazione di fino a 500 tracce della durata massima di 90 secondi.
- Abbonamento Enterprise, che consente alle aziende di personalizzare l’uso e i prezzi in base alle proprie esigenze.
Come molte altre piattaforme di intelligenza artificiale generativa audio, Stable Audio di Stability AI troverà applicazioni nella creazione di musica di sottofondo per podcast, video e altri contenuti multimediali, accelerando i flussi di lavoro creativi.