LLMs e Geolocalizzazione: perché GPT-5 delude

La geolocalizzazione di immagini senza metadati è una delle sfide più affascinanti e complesse per l’OSINT. Negli ultimi anni, diversi modelli di Intelligenza Artificiale (LLM – Large Language Models) sono stati messi alla prova per capire se possono supportare o addirittura sostituire gli analisti nell’identificazione di luoghi a partire da dettagli visivi.

Il recente test condotto da Bellingcat su 25 immagini “chiuse” (cioè prive di geotag o coordinate nei metadati) ha offerto un risultato sorprendente: GPT-5 ha ottenuto performance peggiori rispetto a versioni precedenti di GPT e rispetto ad altri modelli AI concorrenti come Google AI Mode e Grok 4.

I risultati del test

L’esperimento ha messo a confronto diversi modelli: Google AI Mode, GPT-5 (Thinking e Pro), Grok 4 e altri modelli già testati in passato come GPT o4-mini-high.

I dati emersi:

Google AI Mode si è confermato il più preciso, localizzando correttamente la maggior parte delle immagini.
Grok 4 ha mostrato miglioramenti rispetto a Grok 3, ma con prestazioni ancora altalenanti.
GPT-5 ha deluso: in più casi ha collocato foto nel Paese sbagliato, mentre modelli più leggeri come GPT o4-mini-high (oggi ritirato) erano riusciti a identificare correttamente persino vie cittadine specifiche.
In un caso emblematico, un’immagine di una spiaggia olandese con ruota panoramica è stata attribuita da GPT-5 alla Francia: solo Google AI Mode ha riconosciuto il luogo come Noordwijk (Paesi Bassi).

Cosa significa per l’OSINT

Il risultato evidenzia un punto cruciale per chi lavora in ambito intelligence e investigativo: la potenza di un modello AI non coincide necessariamente con maggiore accuratezza operativa.

Per un analista OSINT, questo implica che:

Gli output dei LLM devono essere sempre verificati e validati manualmente.
L’uso di più strumenti in parallelo rimane la strategia più sicura.
La scelta di modelli “più recenti” non garantisce automaticamente migliori performance analitiche.

Limiti e bias dei LLM in geolocalizzazione

Le difficoltà di GPT-5 rivelano alcune problematiche comuni:

Bias geografico: alcuni modelli tendono a privilegiare luoghi più “noti” o fotografati, riducendo l’accuratezza per aree meno documentate.
Trade-off velocità/accuratezza: modelli più rapidi possono sacrificare precisione nelle risposte.
Disponibilità limitata dei modelli migliori: l’assenza di versioni come GPT o4-mini-high, che aveva dato ottimi risultati, priva la comunità open source di strumenti potenzialmente utili.

Lezioni apprese

L’esperimento di Bellingcat dimostra che, nonostante i progressi dell’AI, la geolocalizzazione OSINT resta una competenza critica che non può essere demandata interamente alle macchine.

Gli analisti devono continuare a combinare:

occhio umano e pensiero critico,
strumenti multipli (AI + tradizionali),
metodologie di verifica consolidate.

La vera sfida, oggi, è saper bilanciare l’uso delle nuove tecnologie con la consapevolezza dei loro limiti, trasformando i LLM in un alleato e non in un sostituto dell’analisi OSINT.

Leggi l’ultimo numero della newsletter qui