Introduzione
Se tra gli obiettivi di un sito web vi è ricevere accessi, risulta strategica la sua presenza nelle Search Engine Results Pages (SERP), ovvero le pagine che i motori di ricerca mostrano in riposta alle query degli utenti.
Il complesso delle attività utili a migliorare la posizione dei contenuti web nella parte non a pagamento delle SERP viene definito ‘Search Engine Optimization (SEO)’, che in italiano significa ‘Ottimizzazione per i Motori di Ricerca’.
La SEO si compone di tre tipologie di attività che sono On-Page SEO, Off-Page SEO e SEO tecnica.
Uno degli strumenti più importanti a disposizione degli specialisti SEO in chiave tecnica è la Sitemap. In questo articolo vedremo cos’è, a cosa serve e come implementarla in modo corretto.
Che cos’è la Sitemap e a cosa serve
La sitemap, il cui nome è composto dalla combinazione delle parole ‘site’ (sito) e ‘map’ (mappa) è un file che rappresenta in modo strutturato la mappa degli URL pubblici di un sito web relativi per esempio a pagine, immagini e video.
L’introduzione della sitemap è avvenuta nel 2005 con lo scopo di indicare ai software automatici dei motori di ricerca denominati crawler, spider o anche bot — i quali procedono a una scansione (crawling) dei file pubblici presenti sul web — i contenuti più importanti di un sito, migliorando così l’efficenza del processo di scansione.
La sitemap può inoltre fornire strategiche informazioni sui contenuti come la data del loro ultimo aggiornamento, la frequenza del medesimo e la priorità di scansione.
La mappa del sito fornita dalla Sitemap è particolarmente utile per siti di grandi dimensioni con regolare pubblicazione di nuovi file o aggiornamenti frequenti e con oggetti multimediali come immagini e video, ma è sempre opportuna, seppure non indispensabile, anche per siti di piccole dimensioni.
Il file Sitemap non va confuso con il file robots.txt, il quale, altrettanto importante per la SEO ne è complementare e indica ai crawler le regole di acceso alla scansione dei contenuti, mentre la sitemap li guida verso quelli che devono essere indicizzati.
Quali sono i principali formati della Sitemap utili per la SEO
Esistono diverse tipologie di sitemap utili per la SEO, ognuna con caratteristiche, scopi e formati specifici. I formati compatibili con Google sono definiti dal protocollo Sitemap. Ecco un elenco dei principali:
- Sitemap XML – È la tipologia di sitemap più comune e diffusa. Scritta in linguaggio XML (eXtensible Markup Language), oltre a essere versatile ed estensibile risulta facilmente interpretabile dai crawler dei motori di ricerca;
- SItemap in fromato RSS, mRSS e Atom 1.0 – Questo tipo di sitemap viene generato automaticamente dai principali Content Management System (CSM), ma ha dei limiti nella comunicazione dei contenuti: non permette per esempio di comunicare informazioni sulle immagini;
- Sitemap in formato testo – E’ la Sitemap con il formato più semplice, ma è anche la più limitata, poiché consente unicamente di comunicare informazioni su pagine HTML.
Per tutte le sitemap esiste un limite di 50 MB (sitemap non compressa) o 50.000 URL.
La Sitemap in formato XML
Il formato XML consente di includere nella sitemap tutte le tipologie più importanti di contenuti indicizzabili come pagine, immagini, video e news.
I principali tag utilizzati in una sitemap in formato XML sono:
<urlset>
Tag radice che racchiude tutti i tag <url> all’interno della sitemap.
<url>
Racchiude i dettagli di un singolo URL.
<loc>
Specifica l’URL del contenuto.
<lastmod>
Indica la data dell’ultimo aggiornamento della pagina.
<changefreq>
Indica la frequenza con cui il contenuto della pagina cambia (es: daily, weekly, monthly).
<priority>
Definisce la priorità della pagina rispetto ad altre pagine del sito (valori da 0.0 a 1.0).
Di seguito un esempio di sitemap in formato XML:
<?xml version=”1.0″ encoding=“UTF-8″?>
<urlset xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<url>
<loc>https://nomesito.com/</loc>
<lastmod>2024-10-01</lastmod>
<changefreq>weekly</changefreq>
<priority>1.0</priority>
</url>
<url>
<loc>https://nomesito.com/chi-siamo</loc>
<lastmod>2024-11-25</lastmod>
<changefreq>monthly</changefreq>
<priority>0.8</priority>
</url>
</urlset>

Gestire differenti Sitemap XML verticali con un file indice
Nel caso in cui si stia creando la sitemap per un sito di una certa dimensione, può essere opportuno suddividerla creando delle versioni verticali, limitate per esempio alle sole immagini, ai video, alle notizie ecc.
Per questo scopo è possibile utilizzare una sitemap indice, la quale comunica ai crawler dei motori di ricerca dove si trovano le varie sitemap verticali.
I principali tag utilizzati in una sitemap indice in formato XML sono:
<sitemapindex>
Tag radice che racchiude tutti gli altri tag.
<sitemap>
Contiene i dettagli della sitemap verticale.
<loc>
Specifica l’URL della sitemap verticale.
<lastmod>
Indica la data dell’ultimo aggiornamento della sitemap verticale.
Ecco un esempio di sitemap indice in formato XML:
<?xml version=”1.0″ encoding=”UTF-8″?>
<sitemapindex xmlns=”http://www.sitemaps.org/schemas/sitemap/0.9″>
<sitemap>
<loc>https://www.nomesito.com/sitemap_pages.xml</loc>
<lastmod>2024-08-26</lastmod>
</sitemap>
<sitemap>
<loc>https://www.nomesito.com/sitemap_news.xml</loc>
<lastmod>2024-09-26</lastmod>
</sitemap>
<sitemap>
<loc>https://www.nomesito.com/sitemap_img.xml</loc>
<lastmod>2024-10-26</lastmod>
</sitemap>
</sitemapindex>
In che modo i motori di ricerca utilizzano le Sitemap
I motori di ricerca utilizzano le sitemap seguendo una precisa serie di fasi:
- Individuazione della sitemap – La sitemap viene individuata dai motori di ricerca attraverso il file robots.txt, oppure ricevuta grazie a Google Search Console, Bing Webmaster Tools o ad altri strumenti simili;
- Lettura della sitemap – I crawler leggono il file della sitemap che contiene gli URL;
- Analisi degli URL – gli URL nella sitemap vengono analizzati per determinarne la rilevanza e l’idoneità all’indicizzazione prendendo in considerazione i vari metadati come la data dell’ultima modifica, la frequenza di aggiornamento e la rilevanza;
- Crawling dei contenuti – I crawler seguono gli URL indicati nella sitemap per accedere ai contenuti, in modo da prendere in considerazione tutto ciò che è rilevante per l’indicizzazione;
- Indicizzazione – i contenuti idonei vengono aggiunti agli indici dei motori di ricerca, diventando potenzialmente visibili nei risultati per query pertinenti.
Quali sono i principali benefici delle Sitemap
I principali benefici che si possono ottenere con la presenza di una sitemap per il proprio sito sono i seguenti:
- Maggiore efficienza del crawling – I motori di ricerca possono concentrarsi sui file più importanti, evitando di sprecare risorse su ciò che è meno rilevante;
- Indicizzazione più completa – Le sitemap assicurano che anche i file più difficili da raggiungere vengano individuati dai motori di ricerca e presi in considerazione per essere indicizzati;
- Migliore identificazione delle priorità – Attraverso i metadati, le sitemap aiutano i motori di ricerca a capire quali contenuti sono più significativi per il proprietario del sito.
Nonostante i suddetti benefici, occorre comunque tenere in considerazione che le sitemap non costituiscono una garanzia di indicizzazione, né sostituiscono una buona struttura del sito, che è costituita soprattutto da un’alberatura ben progettata.

Come inviare una Sitemap ai due motori più importanti per la SEO: Google e Bing
Google e Bing sono di gran lunga i motori di ricerca più importanti per la SEO. Il primo è il leader del settore, con una percentuale di mercato che nel 2024 si è attestata intorno al 90%, mentre l’importanza del secondo risiede soprattutto nel fatto che il suo indice è utilizzato da ChatGPT e ChatGPT Search.
E’ possibile inviare la sitemap a Google attraverso Search Console, lo strumento gratuito della società di Mountain View che consente di monitorare e gestire la presenza dei siti nei risultati e di risolvere eventuali problemi correlati.
Nella sezione ‘Indicizzazione’ della dashboard di Search Console è a disposizione un report denominato ‘Sitemap’, in cui inserendo l’URL del file nella casella ‘Aggiungi una nuova Sitemap’ avviene l’invio a Google.
Bing Webmaster Tools è invece lo strumento gratuito di monitoraggio e gestione con cui è possibile inviare una sitemap al motore di ricerca della Microsoft.
In questo caso la sezione di Bing Webmaster Tools che consente l’invio del file è raggiungibile attraverso la sezione ‘Mappa dei siti’, in cui compare un bottone ‘Invia mappa del sito’ che attiva un popup in cui viene proposta una casella dove immettere l’URL della sitemap per l’invio.
Come comunicare la Sitemap ai motori di ricerca con il file robots.txt
Il robots.txt è un file che risiede nella directory principale di un sito e indica ai crawler dei motori di ricerca a quali parti del medesimo e a quali URL possono avere accesso per la scansione.
Oltre a inviare la sitemap utilizzando strumenti come Google Search Console e Bing Webmaster Tools è buona pratica segnalare anche la sua presenza e il suo URL ai motori di ricerca nel file robots.txt.
Di seguito un esempio di robots.txt che oltre a consentire libero accesso a tutti i crawler, include anche al suo interno l’URL della sitemap del sito:
User-agent: *
Disallow:
Sitemap: https://www.nomesito.com/sitemap.xml
La sitemap come strumento fondamentale nella strategia SEO per siti di medie e grandi dimensioni
Gli specialisti che si occupano della SEO per siti di una certa dimensione e con regolari aggiornamenti non dovrebbero sottovalutare l’importanza della presenza di una sitemap.
Come illustrato nei precedenti paragrafi, questo file — se adeguatamente implementato e aggiornato — è in grado di ottimizzare e velocizzare il processo di scansione e indicizzazione da parte dei motori di ricerca dei contenuti più importanti di un sito web.
Creare il file sitemap manualmente, per siti di grandi dimensioni può essere complesso ed esporre a errori. Per questo esistono differenti tool gratuiti o a pagamento per la generazione e l’aggiornamento automatico delle sitemap.
In conclusione la sitemap va considerata come uno strumento fondamentale nella strategia di ottimizzazione per i motori di ricerca.