Anche i podcast possono essere creati con l’Intelligenza Artificiale (IA). Meta ha recentemente implementato il suo sistema di IA Llama con una funzione open source che riesce a produrre podcast, chiamata NotebookLlama.
Questa capacità ricalca il modello IA già conosciuto di Google, NotebookLM, che riesce a generare file in formato podcast a partire da testi caricati dagli utenti.
Il funzionamento di NotebookLlama è molto metodico e prevede alcuni passaggi: dopo la trascrizione del file testuale di input, l’IA drammatizza e inserisce pause che emulano il parlato umano. Solo dopo questa costruzione simulata di un dialogo, si può concludere il processo di text-to-speech e generare il file audio finale.
Confrontando il prodotto di Meta con quello di NotebookLM di Google, basato sulla tecnologia IA di Gemini 1.5, vediamo una differenza qualitativa. La prima che risalta subito è la voce generata: Llama produce delle voci più meccaniche e robotiche, mentre Google ha una migliore simulazione della tonalità e musicalità della voce. Nonostante questo, i ricercatori Meta sono fiduciosi: sarà possibile migliorare la qualità del prodotto e del funzionamento di NotebookLlama.
GitHub, piattaforma su cui milioni di sviluppatori di software si confrontano, stanno analizzando i pregi e i difetti di questo nuovo prodotto Meta. Sicuramente la naturalezza del suono è il primo step da migliorare ma per quanto riguarda la natura contenutistica del file finale, si suggerisce una scrittura del podcast tramite l’uso di due agenti che possano offrire punti di vista diversi, anche discordanti. Questa collaborazione, che non si affida ad un solo modello di IA, potrebbe dare una spinta al modello di Meta e metterlo in reale concorrenza con Google.
Articolo di T.S.
L’articolo NotebookLlama di Meta genera podcast e fa concorrenza a Google proviene da Notiziario USPI.
Per rimanere aggiornato sulle nostre iniziative
Lascia un commento