Menu

af1.it

Uno che scrive

Usare noindex per evitare pagine duplicate in WordPress

4 minuti
aggiornato il
Semplice ma efficace esempio da utilizzare per impiegare l'attributo noindex nel metatag robots in wordpress, per impedire ai motori di ricerca di indicizzare pagine praticamente duplicate, come quelle delle categorie, dei tags, degli autori, ricerche, archivi, pagine non trovate

Codice da utilizzare per impiegare noindex in wordpress

Usando con criterio il meta tag robots (noindex,follow) si evita di creare pagine duplicate e potenzialmente penalizzanti.
Con WordPress è sufficiente aggiungere del codice nel file functions.php del Child Theme.
La considerazione dei meta tag da parte dei motori di ricerca non è così importante come qualche anno fa: dipende da quali meta tag vengono utilizzati e come.

Perché usare il meta tag robots

Quando un blog che funziona con WordPress inizia ad avere tanti articoli potrebbero esserci parecchie pagine viste come duplicate dai mdr, e potenzialmente penalizzanti perché potrebbero essere considerate SPAM, un tentativo più o meno maldestro di creare a tutti i costi o quasi più pagine nel sito sebbene abbiano lo stesso contenuto.

Ovviamente quando il sito ha molte pagine il pericolo è maggiore, ma uguale anche se di pagine ne sono presenti poche, e come si dice, prevenire è meglio che curare.

Nonostante WordPress sia ottimo e abbondante, non può essere pronto così com'è per rispondere a tutte le esigenze di ognuno.

Le pagine dei tag, degli autori, delle categorie, degli archivi (2014/10/ etc.), dei risultati della ricerca, degli articoli più vecchi quando si parte dalla home page (older posts, page/2/, etc.), sia che contengano solo i titoli dei post, oppure titolo e descrizione, excerpt (un estratto), sono pagine duplicate perché il loro contenuto è presente altrove (quindi viene ripetuto negli archivi).

E tutte queste pagine sostanzialmente sono archivi che riprendono parti di contenuto delle pagine dei post.

Innanzitutto: non lasciare mai l'intero articolo presente in queste pagine.
Bastano i titoli, o se preferisci titolo e una breve descrizione.

Chiarito questo, è inutile far indicizzare ai mdr pagine che contengono contenuti già presenti nelle pagine dei post, e potenzialmente potrebbe essere penalizzante.
L'evoluzione degli algoritmi di Google è si spinge a comprendere se una pagina sia duplicata con intenzioni SPAM o se semplicemente appartiene ad un archivio: e il discorso cambia e non poco.

Tuttavia, anche se Google è parecchio evoluto, diamogli comunque una mano per fargli capire quali sono le pagine del nostro sito da indicizzare e quali no, con il codice qui sotto da inserire nel file functions.php del Child Theme.

function add_noindex() {
if( is_author() || is_date() || is_search() || is_category() || is_tag() || is_paged() ) {
    echo '<meta name="robots" content="noindex,follow" />' . "\n";
}
}
add_action( 'wp_head', 'add_noindex' );

Cosa fa il codice del meta tag robots

Il codice sopra dà queste istruzioni al CMS:

se la pagina è una di queste: autori, archivio con formato data, risultati di ricerca, categorie, tag, paging (cioè page/2/, page/3/, etc.) inserisci tra i tag <head> e </head> del codice HTML il meta tag robots che specifica noindex (non indicizzare la pagina), follow (segui però i link presenti).

Facciamo capire chiaramente a Google e agli altri mdr che queste pagine non devono essere indicizzate, semplicemente perché hanno del contenuto che è presente in quelle dei post e quindi sarebbe inutile indicizzarle, pur permettendo di seguire i link degli articoli in quanto dopo l'istruzione “noindex” viene inserita dopo la virgola quella del “follow”.

Viceversa se fosse “nofollow” darebbe istruzione ai mdr di non seguire nemmeno i link presenti, e non è quello che in questo caso serve al nostro sito.

Quando il meta tag robots non è presente, le pagine vengono potenzialmente indicizzate dai mdr, come se fosse presente in questo modo:

<meta name="robots" content="index,follow" />

Il codice sopra dà istruzione di indicizzare sia la pagina sia i link in essa presenti, è quanto accade quando non è inserita nessuna istruzione, quindi il meta tag robots ha motivo logico di essere utilizzato quando si ha necessità di non far indicizzare determinate pagine.

Personalizzare WordPress con poche semplici mosse

WordPress è un CMS completo, pronto da usare anche per chi non ne sa molto di HTML, PHP e programmazione in genere; non ha bisogno di nulla o quasi, è SEO friendly, ottimizzato per i mdr, gestisce il database, dispone di tanti temi, plugin, il tutto gratuito: non è poco.

Con qualche piccolo accorgimento è possibile rendere il sito ancora più in linea con le aspettative dei mdr, Google in particolar modo perché quando dici mdr dici Google.

Una delle tante possibilità del CMS è la semplicità di personalizzazione.

Ad ogni modifica apportata controlla sempre il codice HTML delle pagine dal browser, perché è in questo modo che i motori di ricerca vedono le pagine del sito.

Quindi se ha inserito il codice sopra, ora vai controllare come prima cosa le pagine dei post che devono essere indicizzate, quindi non deve essere presente l'istruzione “noindex,follow”.

Viceversa in tutte le pagine di archivio è opportuno che ci sia.

 

               

 

Felice Amadeo: autore di af1.it

af1.it è mantenuto dalla mia passione.
Se vuoi sostenere af1.it fai una donazione.

Se qualche articolo ti è piaciuto e vuoi fare una donazione, ti ringrazio.
Dona con PayPal