LLMs e Geolocalizzazione: perché GPT-5 delude
La geolocalizzazione di immagini senza metadati è una delle sfide più affascinanti e complesse per l’OSINT. Negli ultimi anni, diversi modelli di Intelligenza Artificiale (LLM – Large Language Models) sono stati messi alla prova per capire se possono supportare o addirittura sostituire gli analisti nell’identificazione di luoghi a partire da dettagli visivi.
Il recente test condotto da Bellingcat su 25 immagini “chiuse” (cioè prive di geotag o coordinate nei metadati) ha offerto un risultato sorprendente: GPT-5 ha ottenuto performance peggiori rispetto a versioni precedenti di GPT e rispetto ad altri modelli AI concorrenti come Google AI Mode e Grok 4.
I risultati del test
L’esperimento ha messo a confronto diversi modelli: Google AI Mode, GPT-5 (Thinking e Pro), Grok 4 e altri modelli già testati in passato come GPT o4-mini-high.
I dati emersi:
- Google AI Mode si è confermato il più preciso, localizzando correttamente la maggior parte delle immagini.
- Grok 4 ha mostrato miglioramenti rispetto a Grok 3, ma con prestazioni ancora altalenanti.
- GPT-5 ha deluso: in più casi ha collocato foto nel Paese sbagliato, mentre modelli più leggeri come GPT o4-mini-high (oggi ritirato) erano riusciti a identificare correttamente persino vie cittadine specifiche.
- In un caso emblematico, un’immagine di una spiaggia olandese con ruota panoramica è stata attribuita da GPT-5 alla Francia: solo Google AI Mode ha riconosciuto il luogo come Noordwijk (Paesi Bassi).
Cosa significa per l’OSINT
Il risultato evidenzia un punto cruciale per chi lavora in ambito intelligence e investigativo: la potenza di un modello AI non coincide necessariamente con maggiore accuratezza operativa.
Per un analista OSINT, questo implica che:
- Gli output dei LLM devono essere sempre verificati e validati manualmente.
- L’uso di più strumenti in parallelo rimane la strategia più sicura.
- La scelta di modelli “più recenti” non garantisce automaticamente migliori performance analitiche.
Limiti e bias dei LLM in geolocalizzazione
Le difficoltà di GPT-5 rivelano alcune problematiche comuni:
- Bias geografico: alcuni modelli tendono a privilegiare luoghi più “noti” o fotografati, riducendo l’accuratezza per aree meno documentate.
- Trade-off velocità/accuratezza: modelli più rapidi possono sacrificare precisione nelle risposte.
- Disponibilità limitata dei modelli migliori: l’assenza di versioni come GPT o4-mini-high, che aveva dato ottimi risultati, priva la comunità open source di strumenti potenzialmente utili.
Lezioni apprese
L’esperimento di Bellingcat dimostra che, nonostante i progressi dell’AI, la geolocalizzazione OSINT resta una competenza critica che non può essere demandata interamente alle macchine.
Gli analisti devono continuare a combinare:
- occhio umano e pensiero critico,
- strumenti multipli (AI + tradizionali),
- metodologie di verifica consolidate.
La vera sfida, oggi, è saper bilanciare l’uso delle nuove tecnologie con la consapevolezza dei loro limiti, trasformando i LLM in un alleato e non in un sostituto dell’analisi OSINT.
Leggi l’ultimo numero della newsletter qui