Un LLM (Large Language Model) è un modello di intelligenza artificiale addestrato su grandi quantità di testi per comprendere e generare linguaggio naturale. Può simulare il linguaggio umano e permette di fare IA Generativa, con cui creare contenuti nuovi partendo da semplici input.
Chi vuole fare un uso generico della IA Generativa può evitare di studiare questi dettagli, così come un autista di automobile non conosce in dettaglio il funzionamento del suo motore. Ma chi vuole spingersi più avanti per ottenere risultati complessi con pochi errori deve conoscere l’LLM per sfruttarne tutte le possibilità, così come un pilota di Formula1 conosce a fondo il suo veicolo per spingerlo alle massime velocità.

In questo articolo vengono riportati link utili per saperne di più su questo modello complesso che, con i suoi utili risultati, ha reso possibile una larga diffusione dell’IA.
Animazioni dei modelli
Su https://bbycroft.net/llm si possono vedere animazioni dei modelli GPT-2 small, nano-gpt, GPT-2 XL e GPT-3 mentre ordinano alfabeticamente una sequenza di caratteri trasformata in numeri. Nella colonna a sinistra si può cliccare sulle frecce per procedere nel calcolo, a destra viene mostrata l’animazione per spiegare cosa viene fatto e si può posizionare il mouse su un punto per conoscere i numeri calcolati in quello specifico punto. Bisogna usarlo su un browser con WebGL2. Il codice usato per creare la simulazione grafica si trova su https://github.com/bbycroft/llm-viz

Animazioni da Financial Times
Su https://ig.ft.com/generative-ai/ una serie di animazioni in lingua inglese dal titolo “Generative AI exists because of the transformer This is how it works” da fare scorrere per mostrare la trasformazione delle parole dal prompt al testo finale e mostrare l’importante meccanismo di attenzione con cui focalizzarsi sulle parole più rilevanti.
