Studiare LLM

Un LLM (Large Language Model) è un modello di intelligenza artificiale addestrato su grandi quantità di testi per comprendere e generare linguaggio naturale. Può simulare il linguaggio umano e permette di fare IA Generativa, con cui creare contenuti nuovi partendo da semplici input.
Chi vuole fare un uso generico della IA Generativa può evitare di studiare questi dettagli, così come un autista di automobile non conosce in dettaglio il funzionamento del suo motore. Ma chi vuole spingersi più avanti per ottenere risultati complessi con pochi errori deve conoscere l’LLM per sfruttarne tutte le possibilità, così come un pilota di Formula1 conosce a fondo il suo veicolo per spingerlo alle massime velocità.

Prompt per ChatGPT: Crea immagine che rappresenta quanto è importante conoscere gli LLM per scrivere prompt più efficaci, interpretare correttamente le risposte, valutare rischi e bias nei contenuti che genera.

In questo articolo vengono riportati link utili per saperne di più su questo modello complesso che, con i suoi utili risultati, ha reso possibile una larga diffusione dell’IA.

Animazioni dei modelli
Su https://bbycroft.net/llm si possono vedere animazioni dei modelli GPT-2 small, nano-gpt, GPT-2 XL e GPT-3 mentre ordinano alfabeticamente una sequenza di caratteri trasformata in numeri. Nella colonna a sinistra si può cliccare sulle frecce per procedere nel calcolo, a destra viene mostrata l’animazione per spiegare cosa viene fatto e si può posizionare il mouse su un punto per conoscere i numeri calcolati in quello specifico punto. Bisogna usarlo su un browser con WebGL2. Il codice usato per creare la simulazione grafica si trova su https://github.com/bbycroft/llm-viz

Animazioni da Financial Times
Su https://ig.ft.com/generative-ai/ una serie di animazioni in lingua inglese dal titolo “Generative AI exists because of the transformer This is how it works” da fare scorrere per mostrare la trasformazione delle parole dal prompt al testo finale e mostrare l’importante meccanismo di attenzione con cui focalizzarsi sulle parole più rilevanti.

Uno dei passaggi del transformer illustrato nel sito web.

Autore: Roberto Marmo

Data Scientist per estrazione informazione e conoscenza dai dati con algoritmi di Intelligenza Artificiale, Computer Vision, NLP. Autore dei libri "Informatica per il tradimento sentimentale, Algoritmi per l'intelligenza artificiale, Social Media Mining, La matematica di Facebook, Creare applicazioni per Facebook" e tanti altri. Appassionato di quiz tv e treno storico con locomotiva a vapore.