Mainly Internet business, but also life mysteries and videogames

Tag: penguin

Google, non è ora di buttare il Pagerank?

Il PageRank è uno degli algoritmi del motore di ricerca di Google, utilizzati per dare rilevanza ai risultati di ricerca. Alle origini di Google, fu il solo e unico algoritmo creato dai due fondatori (Brin e Page appunto), sufficientemente innovativo da sbaragliare in poco tempo TUTTI gli altri motori di ricerca.

SEO Backlinks Pagerank image

A causa del successo di Google, mentre gli utenti erano sempre più felici di poter usare un motore così innovativo, dall’altra gli operatori del settore si ingegnavano a cercare modi per apparire in cima ai risultati. Poichè l’elemento principale della formula del PageRank è il “link”, chi ti linka, chi tu linki e come ti linkano, gli operatori del settore vollero sperimentare QUALUNQUE sistema (lecito ed illecito) per imborgliare il sistema di Google.

LE DUE FASI DI GOOGLE, DIFFONDERE E NASCONDERE — A pochi anni dal lancio di Google, il PageRank divenne il punto di riferimento per stabilire il successo di ogni sito Web. Sistemi come Alexa passarono subito in secondo piano, benché comunque autorevoli. Oggi, ogni sito web ha associato un numero che indica quanto si è autorevoli agli occhi di Google.

LA FOLLIA, LINKIAMOCI TUTTI — In questa fase di adozione del PageRank da parte di ogni Webmaster e operatore web, Google creò ad esempio la toolbar con la quale si permetteva di vedere il PageRank dei siti. In questi anni di cecità del Web, il mondo si popolò di Siti di Directory, Siti per Scambio Link, Siti con Footer simili alle Pagine Gialle, Siti pieni di Pagine e queste Pagine piene di Link, Link nelle firme, link camuffati, link dalle immagini, link in pagine nascoste, link di link di link, tutto per aumentare il PageRank dei siti linkati.

Come una falla in una petroliera carica e fuori controllo, Google interviene e introduce una serie di modifiche agli algoritmi della rilevanza che mitigano (a dire di Google) l’importanza del PageRank. Ma il Web degli operatori non ci crede, e mentre Google progetta e manifesta sistemi di confusione di massa, i link continuano a rimanere il caposaldo della rilevanza e, imperterriti, aumentano con tecniche nuove; link nascosti, link dai blog, link dai blog post, blog di link, link nei template, link dei link dei link dei link, siti di contenuti poveri, ma di link autentici, schemi di link, link dai Social, Siti cammuffati da Social, link hackerati, link rubati, link ovunque pur di far salire il PageRank.

E non serve nemmeno che Google rallenti la pubblicazione delle informazioni sul PageRank, poichè nel frattempo invece di un blog, gli operatori fanno 10 blog, invece di 1 articolo, fanno 100 articoli tutti uguali per chi legge, magari diversi per Google, invece di pagare uno sviluppatore, pagano degli hackers russi per far modificare WordPress di altri e nasconderci dei link. Poichè ogni cosa che appare sul Web diventa una copia di una copia di una copia (sempre per nasconderci un link da qualche parte), Google progetta armi di difesa chiamate “Panda” e “Penguin” (e chissà quanti altri animali farà diventare antipatici) per vanificare le copie di un blog, gli schemi di link, le pagine inutili con solo link, le pagine belle con solo 1 link, e ogni tanto, è inevitabile, qualche sito innocente rimane colpito (dopo tutto è una guerra).

LE VITTIME DI GUERRA — I siti innocenti, vittime della guerra degli animali di Google versus il mondo degli operatori del Web, sono dapprima pochi, poi sempre di più, infine tanti e, ad ogni nuova versione dello Zoo di Google, i siti innocenti sono così infuriati che Google è costretto a relazionarsi per la prima volta direttamente al pubblico attraverso la figura di “Matt Cutts” tentando di far capire che “va tutto bene”. Ma la inconcludente tesi di Google per la quale contano altre cose e non i link non fa smettere la fuga di petrolio e il Web si inquina sempre di più, le vittime innocenti aumentano sempre di più fino a quando Matt Cutts, oggi 1 Agosto 2013 ieri 1 Agosto, rispondendo ad una domanda di un webmaster, dice “Sì, vi daremo qualcosa per capire di più sui link che vi danneggiano”, un passo di Google che ammette un problema oramai troppo grande da lasciare in secondo piano.

Ma mentre Google prende tempo sedando le lemente con promesse storiche, di soppiatto modifica le linee guida aggiungendo nuove regole sempre più restrittive sui link, come ad esempio “se fate una press release e mettete un link, il link non deve avere come obiettivo quello di modificare volutamente il PageRank”, oppure “Se vi fanno un Articolo che parla del vostro sito, e SECONDO NOI quello è fatto per modificare il PageRank, allora sarete declassati”, oppure “se fate delle interviste e vengono pubblicate con dei link che SECONDO NOI hanno lo scopo di modificare il PageRank, sarete puniti”.

 

Insomma, Google,  facevi prima a scrivere “Non fate più link perché altrimenti violate le guidelines”.

 

Anche perché, è proprio colpa di questo PageRank se i risultati di ricerca sono 3 buoni e 7 “pompati”. Non è ora di fare davvero qualcosa di “non evil” come, ad esempio, prendere il PageRank e rottamarlo?

IL FUTURO È GIÀ NEL PASSATO —  Una delle mosse più intelligenti di Google fu anni fa quella di comprarsi Urchin, rinominarlo in Google Analytics e darlo a tutti gratuitamente. In questo modo Google è diventato negli anni l’NSA del Web. Sa dove si trova un utente in ogni momento, quello che fa, come lo fa, se torna indietro da una pagina web, oppure se sta su di un sito. Grazie a questi dati, Google oggi può stabilire in base al comportamente dell’utente se un sito web è “utile” o “meno utile” . Quando si fa una ricerca e si segue un risultato, si visita un sito e se non è quello che si cerca, si torna indietro e si va al risultato successivo, Google lo sa. Può collegare questo comportamento ad un punteggio di Qualità, il quale farà scomparire dalla ricerca quell’inutile sito. Con questo metodo, non mi interessa se il sito appare perché linkato dal link del link; semplicemente è l’utente a castigarlo e la guerra potrebbe finirebbe con gran beneficio di tutti.

Sperando di non scoprire poi  di non essere in una guerra, ma in una battaglia.

Link Building e Black SEO, 3 milioni di URL, 30 Bad Bot e 3000 IP Proxy — un caso vero

In questi ultimi anni, uno dei siti che manteniamo per un cliente particolare è un sito di bookmarking. Esso permette di caricare bookmark dal proprio Browser o aggiungere Url nei preferiti e condividerle con il pubblico, trovare siti collegati e informazioni varie. Il servizio è stato sviluppato per il mercato in lingua Inglese. Fin qui nulla di speciale.

BLACK SEO, WHITE SEO, SPAM SEO — Una delle caratteristiche del sito di bookmarking è stato quello, per sua fortuna o sfortuna, di essere inserito nel corso degli anni in una marea di siti di “Submit gratuiti” operati da società di white (buone) e black (cattive) SEO. Esattamente quelle pagine che non usereste mai per un vostro sito.

Come sapete creare LINK verso il proprio sito è alla base della visibilità nei risultati di ricerca di Gogol (ndr. Google), ovvero più hai link e più sei bello. Benchè Google ne dica, se non avete link verso il vostro sito, non esistete (salvo siate nelle segretissime White List di Google come “sito indispensabile” o “brand affermato non penalizzabile”).

Un sito di bookmark è quindi perfetto per una invasione di “link” da parte dei “black” SEO. Queste società creano pagine di FREE submit (tipo questa pagina, una delle tante osservate, backlinks.auto-im.com/freepack/free.php ), promettendo in 1 click fino a 200,000 backlink. L’abilità di questi SEO è quella di trovare un sistema per inserire link nei siti di altri e tali da poter replicare l’inserimento in modo automatico e continuativo nel tempo.

Una volta che il FREE Submit è sviluppato, gli stessi SEO sviluppano anche sistemi di verifica del vostro link per evitare che sia cancellato. Questi tools si fingono utenti con tecniche più o meno legittime e come un robot vengono a vedere se il link è presente nelle pagine del sito di Bookmark. Siti come Seostats o Seotools, ad esempio, per ogni URL che inserite nel form di verifica, un fastidioso robot viene sulle pagine del bookmark a controllare la presenza del link.

Ma la cosa non si limita a servizi online. Alcuni software fatti per inserire migliaia di articoli o link in altrettanti migliaia di siti (ovviamente non hanno nessun accordo con nessun sito) semplicemente si fingono utenti e inviano i dati attraverso dei robot e ne gestiscono pure la verifica successiva e continuativa. Ad esempio, nel 2009 un (in)famoso software chiamato Autoclick Profits vendeva per 149$ il sogno di enormi guadagni con un click. Scaricando il software si accedeva ad un tool per inserire migliaia di articoli o link in migliaia di siti online (tra cui il sito di bookmark), e gli stessi link potevano automaticamente trasformarsi in URL compatibili con sistemi di affiliazione come ClickBank grazie al quale si guadagna cliccando.

 

UNA MAREA DI URL — Sta di fatto che con il passare degli anni, il sito di bookmark raccolse i seguenti dati.

Periodo Gennaio 2010- Dicembre 2011

28,186 Url Web .it — inviati in modo “non naturale”;

2,976,560 Url Web in totale inviati in modo “non naturale”;

29 “bad bots” — sistemi malevolenti per l’invio di url;

2976 “Proxy” — utilizzati per inviare i dati;

1 tentativo di SQL Injection;

1 virus.

E le attività dei SEO non sono diminuite negli ultimi 7 mesi del 2012.

Poichè il sito di bookmarking non ha scopi di link-building o “black” SEO e fintanto che le URL inserite non vìolano  regole stabilite o di SPAM, nulla è stato fatto per evitare tale attività (tranne per i bot ostili e non tollerabili).

 

UN COSTO DI GESTIONE OLTRE BUDGET — Ma qualcosa non va. Questo è un solo sito di “pagerank 3” come milioni di altri. Se una attività di black seo permette di creare 3 milioni di link (2 univoci più o meno) in 3 anni di tempo, quanto vale questa attività su larga scala? Sicuramente parecchio in quanto ad ogni cambiamento delle pagine del sito di bookmarking, i BOT e gli SPIDER si adeguavano regolarmente.

Chi ci tutela? E’ possibile che si debba pagare per lo SPAM link di migliaia di altri siti? Poichè un LINK-IN è alla base della visibilità in Google, il mondo oggi paga questa decisione e non ottiene nulla in cambio da chi ne gode.

 

ARRIVA LA GOOGLE PENGUIN UPDATE, I COSTI AUMENTANO! — Con Novembre 2011, improvvisamente il costo “tecnologico” e di “gestione” di questo problema aumenta esponenzialmente.

Poichè i possessori dei siti che venivano inseriti erano spesso IGNARI delle tecniche di black seo che a loro insaputa avevano assunto e pagato anni prima come consulenza da parte di abili “società di posizionamento”, essi iniziarono a sentirsi dire da altrettanti consulenti che “un link-in sbagliato può punire”. Ovviamente tali voci non nacquero a caso; se i link-in non possono di certo penalizzare (al massimo non contano nulla), nessuno ne ha la certezza e il mondo si preoccupa per un cambiamento “epico” nelle regole del gioco.

Nel Marzo 2012 le voci prendono fondamento e Google annuncia PENGUIN e invia “mail” ai webmaster i cui siti sono linkati da url “non spontanee”. Toh, guarda, e ora che faranno quei 2,000,000 di webmaster? Poichè non esiste una regolare iscrizione per avere inserito un link nel sito di Bookmarking, per i webmaster è altrettanto impossibile rimuoverli.

Da Marzo 2012 le richieste a bookmark si trasformarono in una nuova tipologia di richiesta: le mail chiedevano la rimozione di link che ritenevano “impropriamente” inseriti nel sito, alcuni addirittura ipotizzando un uso illegittimo del link inserito senza la loro autorizzazione! Altri, sostenuti da un improbabile Google-zorro alla tutela dei webmaster, minacciarono di denunciare il sito a Google se il link non veniva rimosso prontamente. Inoltre, poichè questi webmaster (o agenzie di siti quando i siti erano “famosi”) dovevano mandare queste mail in quantità, non facevano spesso riferimento a URL o dati precisi e minacciavano IP e URL presto penalizzate se non si cooperava e altre fantomatiche… balle da web.

“[Editato per la Privacy] This link needs to be removed with immediate effect.

Google has been in contact with us and asked us to remove this unnatural link as it will penalise both the XXXXX.co.uk website as well as your website.
Google have also asked us to inform them of any websites that are not cooperative in this request, and to provide them with the domains and IP addresses of sites that do not comply with the request.”

 

Insomma, da ingenuo sito vittima di “abusi” il sito si trovò pure “beffato” e “accusato”.

Una delle comunicazioni del cliente ad un certo punto fu “sarebbe bello dire in faccia a questi webmaster come e chi gli ha inserito il link e di smetterla di fare richieste offensive visto che è certo che hanno usato società SEO poco attente”. Da questa osservazione, nasce di fatto anche questo post: di fronte all’immensa lista di URL che abbiamo visto e alle tecniche usate non si poteva far finta di nulla.

Il “removal di bad links” è oggi una delle questioni più traumatiche dopo l’introduzione di PENGUIN di Google, un algoritmo di controllo dei link che tenta di diminuire proprio il problema di link “non naturali”.

Il punto è che il Web fa intendere che un “bad link” significa un “bad website” e pertanto il sito che ospita link finti viene minacciato di “penalizzazione” (come si vede dalla mail di quel webmaster).

Per fortuna Google è molto più arguto e un bad link è in realtà “un link non naturale” e i siti che li ospitano — ignari o no che siano — “non subiscono nessuna penalizzazione“. Se ci sono penalizzazioni, sono sempre legate a interventi extra-algoritmici o gravi violazioni di contenuto (come sempre è stato fatto da parte di Gogol).

Ad oggi il sito di bookmarking continua a fare il suo lavoro, le tecniche di protezione dallo SPAM maligno non sono concluse, ma sono state implementate tecniche molto più adatte di quelle di anni fa e non so proprio come potrebbero fare 2,000,000 di webmaster se un giorno Google dovesse davvero penalizzarli.