Corso SEO: 🗺 sitemap.xml è la tua mappa del tesoro

2020-12-16 12:49:12

Fai sapere al tuo pubblico che hai pubblicato un nuovo articolo usando i social oppure fallo sapere direttamente ai motori di ricerca!

Foto di Gantas Vaičiulėnas da Pexels



Hai pubblicato tantissimi articoli sul tuo Blog o tantissimi prodotti sul tuo e-Commerce ma non riesci a trovare i tuoi contenuti sui motori di ricerca e su Google?
Forse hai dimenticato di comunicare ai motori di ricerca la mappa del tuo sito (La sitemap). Se non sai di cosa sto parlando, leggi tutto l'articolo e scoprirai qualcosa di molto interessante che prima non conoscevi, una vera mappa del tesoro!
Questo è il Blog della SEO in cui ogni mercoledì esce un nuovo articolo per approfondire il tema della visibilità sui motori di ricerca: segui questo blog o iscriviti alla newsletter per ricevere tutte le notizie sulla SEO.

Comunicazione M2M

Metti in connessione il tuo webserver con Google

In questo Blog abbiamo parlato più volte di sitemap, ma forse non abbiamo mai approfondito più di tanto l'argomento!

Perdonami se apro l'articolo con sigle o termini tecnici, ora ti spiego subito il loro significato e poi ti racconto perché li ho menzionati:

  • Comunicazione M2M: per comunicazione machine-to-machine si intende un ecosistema in cui le macchine parlano tra loro e si organizzano senza che ci sia intervento umano. Le macchine in questione in questo caso sono il tuo webserver e Google;
  • Il tuo webserver: il webserver è quel dispositivo che ha una connessione internet e resta in ascolto sulla rete fintanto che qualcuno non desideri visitare il tuo sito web, portale e-Commerce o canale YouTube. Quando qualcuno si connette al tuo sito web si può parlare di H2M (human to machine) comunicazione uomo-macchina,  perché tu — essere umano — ti connetti al mio webserver — la macchina. Quando un dispositivo si connette al tuo sito web o portale eCommerce siamo di fronte a una comunicazione M2M (machine to machine) perché si tratta di una macchina che interroga un'altra macchina;
  • Google: è il motore di ricerca per antonomasia, ho semplificato molto nel titolo dicendo Google, in realtà la macchina che interroga il tuo sito web è il Crawler di Google (detto anche spider).
Nota: Puoi rileggere questo articolo per approfondire l'argomento sugli spider: 🕷 cosa sono gli spider dei motori di ricerca



Gli spider sono molto bravi a scandagliare il web alla ricerca di nuovi contenuti, ma per capire che hai modificato o aggiunto contenuti al tuo portale dovrebbero ogni volta perlustrare l'intero sito web.

Proprio come farebbe un normale utente, lo spider atterra sul nostro sito web da un link esterno o digitando l'URL della home page e da lì — cliccando via via tutti i collegamenti interni — incomincia a scandagliare tutte le pagine alla ricerca di nuovi contenuti.

Quando lo spider atterra su una pagina che possiede già nel proprio indice, confronta quello che trova con i dati in suo possesso alla ricerca di eventuali modifiche. Quando lo spider scopre nuovi link interni che prima non conosceva, cerca di estrapolare le informazioni della nuova pagina web per inserirla (eventualmente) nell'indice del motore di ricerca.

Capisci che svolgere il lavoro di indicizzazione in questo modo è molto oneroso in termini di consumo di banda (i chilobyte di informazioni che devono transitare periodicamente attraverso la rete) solo per tenere controllato un sito web.

Se consideri che di siti web ce ne sono miliardi, ti rendi conto che per far sì che il tuo sito web sia su Google nella sua versione più aggiornata, bisogna che tu agevoli il lavoro dello spider il più possibile!


La mappa del sito di una volta

Come facevano i webmaster quando non c'erano le "sitemap.xml"

Un tempo gli esperti SEO erano dei "burloni", i primi esperti della SEO cercavano tutti gli stratagemmi possibili per "ingannare l'algoritmo" del motore di ricerca in modo da sfruttare le regole di indicizzazione a proprio vantaggio.

Per esempio, una pratica molto diffusa era quella di riempire le pagine web del proprio sito web con le parole chiave, scritte ovunque, con lo stesso colore dello sfondo... in questo modo gli utenti (H2M) non si accorgevano di nulla, mentre gli spider (M2M) trovavano un sacco di materiale utile per indicizzare le pagine. 

Se provi oggi ad adottare una tecnica del genere rischi che il tuo portale venga bannato dal motore di ricerca! Di sistemi come questo ve ne erano decine! Guai adottarli oggi, sarebbe un grave errore!

Invece, una pratica molto in uso all'epoca e onestamente io continuo ancora ad usarla in molte circostanze (vedi anche in fondo alla home page di questo canale), è quella di creare una pagina web chiamata mappa del sito, dove si riportano tutti i link interni — eventualmente organizzati ad albero — per definire i percorsi e le gerarchie tra le pagine.

Creare una pagina web che riassume tutti i link interni è molto utile per l'utente che atterra per la prima volta su un sito e anche per i motori di ricerca che trovano in un colpo solo tutte le pagine da visitare. 

Se è vero che questo approccio è molto utile e comodo, è anche vero che ha delle criticità. Riporto qui di seguito le problematiche più importanti:

  • ogni webmaster può decidere un nome diverso per la mappa del sito;
  • ogni webmaster può decidere una impostazione grafica o html differente per la propria sitemap!
  • il sito web potrebbe essere composto da migliaia di pagine web, difficilmente caricabili in un'unica pagina web!

Google non può sapere a priori quale sia la pagina web che riporta la mappa del sito, anche se può intuirlo dal numero di link in essa contenuti.

Inoltre per ogni pagina web (url) sarebbe importante definire anche una serie di informazioni aggiuntive (metadati) per indicare al motore di ricerca quali pagine (loc) sono più recenti e quali più datate, quali sono state modificate più di recente e quali sono di nuova pubblicazione (lastmod), qual è la frequenza di aggiornamento di ogni pagina (changefreq) e l'importanza che ha un cambiamento in una pagina del sito rispetto alle altre (priority)!

Emerge dunque l'esigenza di uno standard!


Standard sitemap

Qual è lo standard da usare per pubblicare una sitemap 

Finalmente qualcuno (vedi sitemaps.org) si è posto il problema e ha definito uno standard per definire e pubblicare la mappa del sito, detta appunto "sitemap", definendo il principale standard per le mappe dei siti: sitemap.xml.

In realtà a Google vanno bene anche altri formati: cliccando su questo link [i formati di sitemap accettati da Google] puoi farti un'idea su quali formati siano accettati da Google.

Chiaramente al primo posto c'è la sitemap in formato XML, ma vanno benissimo anche i feed atom o RSS, molto usati nei Blog; Google accetta anche dei semplici file di testo (TXT) popolati con un elenco di tutti gli URL delle pagine che compongono il tuo sito web (uno per riga) ma sconsiglio vivamente di usare questo formato; infine ovviamente — se hai creato il tuo sito usando Google Sites — verrà generata automaticamente anche una mappa del sito!


Come creare una sitemap XML

Lo standard XML è molto simile all'HTML. Si tratta di un file di testo che puoi creare o modificare con un normalissimo editor di testo (come blocco note). Utilizzando la sintassi descritta su sitemaps.org  devi elencare tutte le pagine web del tuo portale:

Dove si trova la sitemap e come si usa


Questa è una bella domanda! Chi deve creare il file? dove deve metterlo? e come fare perché Google lo riceva?

Per prima cosa vediamo i siti web DIY (Do IT Yourself) fatti da te:  se il tuo sito web è fatto di sana pianta da te o dal tuo webmaster e non hai utilizzato un CMS come Wordpress o Joomla, probabilmente devi realizzare manualmente la sitemap.

Invece i principali CMS come Wordpress o Joomla sono in grado di generare spontaneamente la sitemap del sito web, in automatico.

I file sitemap.xml (generalmente si chiamano proprio così, ma si possono chiamare anche con un nome diverso) devono essere pubblicati all'interno del proprio sito web e raggiungibili con un qualunque browser allo stesso dominio in cui si trova il sito web.

Per esempio se tu avessi un sito chiamato www.tuosito.com, dovresti fare in modo che la sitemap possa essere scaricata (ad esempio) all'indirizzo URL www.tuosito.com/sitemap.xml caricandola via ftp nella root directory o facendola creare dinamicamente dal tuo Wordpress o Joomla o da uno script PHP.

A questo punto apri la Google Search Console e usando il tuo account accedi alla sezione relativa alle sitemap di www.tuosito.com e compila il campo per l'aggiunta di una sitemap inserendo semplicemente sitemap.xml.

Da questo momento in poi Google saprà che qualsiasi modifica che farai sul tuo sito web sarà riportata sul file sitemap.xml e quindi il crawler terrà una copia di quel file nel proprio archivio in modo che — alla prossima visita — scaricherà la nuova sitemap.xml e la confronterà con quella che ha in archivio per capire se ci siano modifiche sul tuo sito web rispetto alla visita precedente.

Facile e veloce!

Se questo articolo ti è stato utile scrivimelo qui sotto nei commenti, condividilo con chi potrebbe trarre beneficio dalla lettura di questo articolo e scarica il PDF del Corso SEO Operativo BASIC per scoprire questo ed altri utili stratagemmi che ti regalano visibilità sui motori di ricerca e su Google.

Corso SEO Operativo BASIC
✨ il Corso SEO Operativo BASIC con Metodo Go.S.T. in 7 passi, per portare in prima pagina il tuo sito internet o canale YouTube in meno di 24 ore, anche se per te l'HTML è una lingua araba! Completo di PDF e Video didattici 🎬 Una guida per tutti, soprattutto per i non tecnici del web 😎🏆
by Emanuele Frisoni
6  
6