Google Zoeken en zoekmachinespam

In januari werd op verschillende (Engelstalige) sites druk gediscussieerd over de kwaliteit van de Google-zoekresultaten. Als je die artikelen leest, rijst de vraag of de kwaliteit van die resultaten achteruit is gegaan en of er meer en meer spam tussen staat. Volgens de evaluatiecriteria - die we de afgelopen tien jaar steeds hebben verfijnd - zijn Googles zoekresulaten beter dan ooit wat betreft relevantie, nieuwheid en volledigheid. In vijf jaar tijd is Engelstalige spam met meer dan de helft teruggebracht. En in de meeste andere talen komt het nog minder voor. In de afgelopen maanden hebben we desondanks een (heel kleine) toename gezien in spam; we zijn dan ook druk bezig om ervoor te zorgen dat de kwaliteit van de zoekresultaten gewaarborgd blijft en continu verbeterd wordt.

Webspam is de 'troep' die je ziet in zoekresultaten, wanneer sites op allerlei oneigenlijke manieren proberen te eindigen op hogere posities in die lijst - of op een andere manier de kwaliteitsrichtlijnen proberen te schenden. Zo'n tien jaar geleden was het nog zo erg dat vrij vaak spamresultaten tevoorschijn kwamen in de resultatenlijst. Google is er voor het grootste gedeelte in geslaagd dat soort 'pure webspam' te bestrijden, ook al zijn sommige spammers overgegaan tot nog gewiekstere of zelfs illegale tactieken zoals het hacken van websites.

De afgelopen maanden zijn zowel omvang als actualiteit van de webindex vergroot en verbeterd. Naast een hele hoop goede inhoud hebben we onvermijdelijk ook een aantal spamsites geïndexeerd. Om ervoor te zorgen dat pagina's met spam-achtige inhoud minder snel een hoge positie in de resultaten krijgen, gebruiken we sinds kort een nieuwe classifier op documentniveau. Deze is beter in het signaleren van spam op afzonderlijke webpagina's - zoals herhaalde spamwoorden (de woordenbrij die je wel eens ziet in automatisch gegenereerde blogreacties en die alleen zijn bedoeld om verkeer naar een site te krijgen). Ook zijn we er veel beter in geworden om gehackte sites te signaleren en houden we ons bezig met het ontwikkelen van manieren waarop gebruikers duidelijke feedback kunnen geven. Daarnaast kijken we op dit moment naar een aantal andere technieken om spam zoveel mogelijk uit de zoekresultaten te houden, onder meer naar methodes om sites te herkennen die de inhoud van andere sites kopiëren en/of weinig originele inhoud hebben.

Nu 'pure webspam' in de loop der tijd minder lijkt te zijn geworden, gaat onze aandacht tegenwoordig meer uit naar zogenaamde content farms: sites met minimale inhoud of inhoud van te lage kwaliteit. In 2010 hebben we twee grote aanpassingen in onze algoritmen doorgevoerd die specifiek waren gericht op sites van lage kwaliteit. Reacties op internet zijn zeer helder: mensen willen graag dat we nog meer actie tegen dat soort sites ondernemen.

We zijn ontzettend trots op onze zoekmachine en streven ernaar om elke zoekopdracht vlekkeloos te laten verlopen - maar we zijn niet perfect. En dat gegeven, gecombineerd met de torenhoge verwachtingen die mensen van Google hebben, zorgen ervoor dat onze onvolkomendheden de neiging hebben enigszins uitvergroot te worden. Desalniettemin: we kunnen en moeten het beter doen.

Een van de misvattingen die in de recente discussies de kop opstak, is het idee dat Google minder snel actie onderneemt tegen spaminhoud in onze index als het gaat om sites die ook Google-advertenties weergeven. Voor alle duidelijkheid, zodat er geen twijfel meer over bestaat:
  • Google onderneemt zeer zeker actie tegen sites die de kwaliteitsrichtlijnen schenden, ongeacht of ze advertenties via Google weergeven.
  • Het tonen van advertenties via Google, zorgt niet voor een betere positie in de zoekresultaten, en
  • Het kopen van advertentieruimte via Google zorgt niet voor een betere positie in de zoekresultaten.
We hebben altijd volgens deze pricipes gewerkt en benadrukken graag dat ze nog steeds gelden!

Mensen geven genoeg om Google om ons te laten weten wat ze van onze producten en diensten vinden, of wat ze graag verbeterd zouden willen zien. Wij stellen die feedback natuurlijk zeer op prijs en gecombineerd met ons eigen onderzoek levert het ons waardevolle informatie over welke zaken verbeterd zouden kunnen worden. Laat ons weten wat we beter zouden kunnen doen, dan blijven wij werken aan een beter Google.

Originele post door Matt Cutts, Hoofdprogrammeur
Gepost door Allard, het Google Team