← Torna al blog
Marco Scarselli · 2026-01-29

DANTE CONCORSISTA E L'OLIMPIADE DELLE IA: CHI SUPERA LA PROVA?

Immaginate Dante Alighieri che, smessa la tunica da poeta, si siede davanti a un simulatore per affrontare un concorso pubblico. Tra codici, commi e procedure, il Sommo si troverebbe in una "selva oscura" dove la sola memoria non basta.

Sei nuovo qui? In questo articolo usiamo gli "archetipi rinascimentali" — Dante, Leonardo — come metafore per spiegare l'IA, con Virgilio nel ruolo di guida. Se vuoi capire il framework completo, parti dalla Lezione Base: Introduzione all'Intelligenza Artificiale.

Per capire quale IA possa fargli da "Virgilio", abbiamo condotto uno stress-test su 1.600 quiz ufficiali estratti dal database di oltre 50.000 domande di 🚀 SmartQuiz.


📋 Metodologia: Perché questi modelli?

Abbiamo scelto deliberatamente i modelli gratuiti disponibili nelle chat pubbliche di Google, Anthropic, OpenAI e Mistral — quelli che un candidato può usare oggi, gratis, senza abbonamenti. A questi abbiamo aggiunto GPT-4o Mini come baseline storica di confronto.

Modello Piattaforma Accesso
Gemini 3 Flash Google AI Studio / Gemini Gratuito
Sonnet 4.5 Claude.ai Gratuito (con limiti)
Mistral Large Le Chat (Mistral) Gratuito
Mistral Small 3.2 Locale / Le Chat Gratuito / Self-hosted
GPT-5 Mini ChatGPT Gratuito
GPT-4o Mini API OpenAI Baseline (ultra-economico)

Non abbiamo testato i SOTA (State of the Art) come GPT-4.5, Claude Opus o Gemini Ultra. Perché? Volevamo rispondere a una domanda pratica: "Cosa può fare un concorsista con gli strumenti accessibili a tutti?"

Test effettuati in modalità One-Shot (una domanda, una risposta), senza RAG, senza contesto, senza rete di sicurezza. La preparazione "nuda" del modello.


🏆 Il Podio dell'Olimpiade

Modello Accuracy Note
🥇 Gemini 3 Flash 92.9% Domina 29 categorie su 32
🥈 Sonnet 4.5 90.2% Eccelle in Inglese (100%)
🥉 Mistral Large 87.2% Solido su tutto
GPT-5 Mini 82.0% Bias verso risposta 4 (74% delle scelte!)
Mistral Small 3.2 76.9% Può girare in locale
GPT-4o Mini 68.8% La vecchia guardia arranca

📊 Dove l'IA Regna e Dove Vacilla

Materia Leader Accuracy Insight
Appalti / Civile / Costituzionale Gemini 3 Flash 100% Normativa "solida", ben rappresentata nel training
Inglese Sonnet 4.5 100% Unico modello senza errori
Informatica Gemini 3 Flash 98% Tutti sopra il 90%
Sicurezza Lavoro 4 modelli pari 96% Conoscenza universale
Procedura Civile Gemini 3 Flash 86% GPT-4o Mini crolla al 34%
Penale Gemini 3 Flash 90% GPT-4o/5 Mini sotto il 55%

Il verdetto: Ricordiamoci cos'è un LLM: un "Dante" che ha letto miliardi di testi, ma non è mai uscito dalla biblioteca. Conosce le relazioni tra parole, non la sostanza delle norme.

Sulle materie "universali" (diritto civile, costituzionale, inglese) i testi di training abbondano e i modelli eccellono. Ma sulle procedure italiane — dove un comma, un termine, una notifica cambiano tutto — anche i giganti mostrano il fianco. Non perché siano "stupidi", ma perché quei dettagli sono sotto-rappresentati nel loro addestramento.

È qui che serve un "Virgilio": un sistema RAG che fornisca il contesto normativo aggiornato e certificato.


🤔 Il Paradosso: Il "Buon Senso" è Digitale

I quiz situazionali — comportamento professionale, gestione conflitti — sono i più facili per le macchine:

Perché? Gli LLM hanno "metabolizzato" miliardi di interazioni umane. È più facile per un algoritmo capire come gestire un conflitto tra colleghi (pattern universale) che ricordare il termine esatto per un ricorso in appello (dettaglio normativo italiano).


🏠 Il Sorpasso Locale: La Sovranità Digitale

Mistral Small 3.2 (24B parametri, eseguibile in locale) ha superato GPT-4o Mini di 8 punti: 76.9% vs 68.8%.

Un'IA privata — nei server del tuo Ente o nel tuo studio — oggi batte i colossi cloud di ieri. È il "Rinascimento Locale": la potenza si è democratizzata, e con essa la possibilità di proteggere i dati sensibili.


🧠 Logica: Lo Spartiacque del Ragionamento

Modello Accuracy Tempo Note
Gemini 3 Flash 90% 1.56s Il più equilibrato
GPT-5 Mini 88% 11.02s 6 non-risposte, bias verso opzione 4
Sonnet 4.5 80% 1.84s Calcolava il risultato invece di indicare l'opzione
GPT-4o Mini 50% 0.64s Il doppio del caso (25%), ma ancora insufficiente

🚀 Dietro le quinte: Come SmartQuiz trasforma Dante in Leonardo

In questo studio abbiamo testato le IA "a freddo" — Dante senza Virgilio. (Per capire la differenza tra Dante e Leonardo, consulta la lezione base.)

Ma nella realtà di SmartQuiz, il processo è diverso. Non interroghiamo un LLM generico: lo trasformiamo in un Agente dotato di strumenti, integrando:

Dante smette di essere un poeta che inventa e diventa un analista fedele che estrae fatti. Spiegazioni didatticamente utili, giuridicamente inattaccabili.


🎯 Prova il metodo

Non accontentarti di un'IA generica. Studia con un sistema che ha il suo Virgilio integrato.