Osint

LLMs e Geolocalizzazione: perché GPT-5 delude

LLMs e Geolocalizzazione: perché GPT-5 delude

La geolocalizzazione di immagini senza metadati è una delle sfide più affascinanti e complesse per l’OSINT. Negli ultimi anni, diversi modelli di Intelligenza Artificiale (LLM – Large Language Models) sono stati messi alla prova per capire se possono supportare o addirittura sostituire gli analisti nell’identificazione di luoghi a partire da dettagli visivi.

Il recente test condotto da Bellingcat su 25 immagini “chiuse” (cioè prive di geotag o coordinate nei metadati) ha offerto un risultato sorprendente: GPT-5 ha ottenuto performance peggiori rispetto a versioni precedenti di GPT e rispetto ad altri modelli AI concorrenti come Google AI Mode e Grok 4.

I risultati del test

L’esperimento ha messo a confronto diversi modelli: Google AI Mode, GPT-5 (Thinking e Pro), Grok 4 e altri modelli già testati in passato come GPT o4-mini-high.

I dati emersi:

  • Google AI Mode si è confermato il più preciso, localizzando correttamente la maggior parte delle immagini.
  • Grok 4 ha mostrato miglioramenti rispetto a Grok 3, ma con prestazioni ancora altalenanti.
  • GPT-5 ha deluso: in più casi ha collocato foto nel Paese sbagliato, mentre modelli più leggeri come GPT o4-mini-high (oggi ritirato) erano riusciti a identificare correttamente persino vie cittadine specifiche.
  • In un caso emblematico, un’immagine di una spiaggia olandese con ruota panoramica è stata attribuita da GPT-5 alla Francia: solo Google AI Mode ha riconosciuto il luogo come Noordwijk (Paesi Bassi).

Cosa significa per l’OSINT

Il risultato evidenzia un punto cruciale per chi lavora in ambito intelligence e investigativo: la potenza di un modello AI non coincide necessariamente con maggiore accuratezza operativa.

Per un analista OSINT, questo implica che:

  • Gli output dei LLM devono essere sempre verificati e validati manualmente.
  • L’uso di più strumenti in parallelo rimane la strategia più sicura.
  • La scelta di modelli “più recenti” non garantisce automaticamente migliori performance analitiche.

Limiti e bias dei LLM in geolocalizzazione

Le difficoltà di GPT-5 rivelano alcune problematiche comuni:

  • Bias geografico: alcuni modelli tendono a privilegiare luoghi più “noti” o fotografati, riducendo l’accuratezza per aree meno documentate.
  • Trade-off velocità/accuratezza: modelli più rapidi possono sacrificare precisione nelle risposte.
  • Disponibilità limitata dei modelli migliori: l’assenza di versioni come GPT o4-mini-high, che aveva dato ottimi risultati, priva la comunità open source di strumenti potenzialmente utili.

Lezioni apprese

L’esperimento di Bellingcat dimostra che, nonostante i progressi dell’AI, la geolocalizzazione OSINT resta una competenza critica che non può essere demandata interamente alle macchine.

Gli analisti devono continuare a combinare:

  • occhio umano e pensiero critico,
  • strumenti multipli (AI + tradizionali),
  • metodologie di verifica consolidate.

La vera sfida, oggi, è saper bilanciare l’uso delle nuove tecnologie con la consapevolezza dei loro limiti, trasformando i LLM in un alleato e non in un sostituto dell’analisi OSINT.

Leggi l’ultimo numero della newsletter qui