Sinds kort heeft Google zijn zwarte lijst met zoektermen uitgebreid met begrippen die (volgens Google) geassocieerd worden met copyright-inbreuk. Dit betekent dat twijfelende gebruikers, op zoek naar informatie over een willekeurige bioscoopfilm, niet meer richting BitTorrent of Rapidshare worden geloodst wanneer zij nog aan het typen zijn. Als gebruikers zelf een van deze twee termen toevoegen aan hun zoekopdracht, krijgen ze nog wel gewoon de zoekresultaten. Nieuwsgierig als we zijn, hebben we zelf ook een aantal al dan niet discutabele termen geprobeerd. Ben je al nieuwsgierig?
Hoe werkt het?
Voor de mensen die Scroogle, Ixquick of een andere zoekmachine gebruiken, een korte uitleg: wanneer men op de hoofdpagina van Google een zoekopdracht begint te typen verschijnt na iedere toetsaanslag een nieuwe, specifiekere lijst met suggesties. Deze suggesties zijn gebaseerd op veel voorkomende zoekopdrachten, waar de tot dan toe ingevulde zoekterm onderdeel van uitmaakt. Tot voor kort betekende dit dat een gebruiker die begint met het typen van bijvoorbeeld de term “Avatar”, tussen de suggesties onder andere “Avatar bittorrent” en “Avatar rapidshare” zag staan. In het geval van Google Instant kwamen gelijk zoekresultaten naar boven.
De blacklist zorgt ervoor dat er geen suggesties of instant resultaten meer komen wanneer (delen van) bepaalde woorden worden ingetikt. Als we op Google.nl bijvoorbeeld beginnen met het typen van “Bits of Freedom” krijgen we vanaf de eerste drie letters al onze organisatie in beeld. In het lijstje met suggesties zien we echter ook BitLord en BitComet, twee programma’s die werken met het bittorrentprotocol. Gister konden we op Tweakers.net en Slashdot lezen dat onder andere het bedrijf BitTorrent, Inc. nu verontwaardigd is dat zij eruit worden gefilterd. Vanaf “bitt” weigert Google in het geheel iedere suggestie.
Hoe werkt het niet?
De lijst die Google hanteert is natuurlijk zeer arbitrair. Zo wordt na het typen van “pir” gewoon als eerste The Pirate Bay gesuggereerd. Ook “download m” geeft nog de suggestie om muziek, mp3 en movies te downloaden. Google zelf geeft over autocomplete aan: “we (…) apply a narrow set of removal policies for pornography, violence, hate speech, and terms that are frequently used to find content that infringes copyrights“. Een blacklist zoals die vorig jaar met behulp van crowdsourcing is samengesteld, laat zien dat op dat moment veel van de afgeschermde zoektermen scheldwoorden of pornografisch van aard waren.
Bij het uitproberen kwamen we vanzelfsprekend aardig wat interessante bijwerkingen, gemiste zoektermen, en randgevallen tegen. Zo vonden we dat de Nederlandse Google geen suggesties geeft voor “sex”, maar wel voor “seks”, terwijl de Engelstalige variant met geen van beide moeite heeft. Daarnaast blijft het stil als we op zoek zijn naar “how to murder” of “how to kill”, maar de letters “behea” zijn genoeg om op zowel de Nederlandstalige als Engelstalige Google te suggereren dat we misschien wel onthoofdingsfilmpjes willen zien. Ook zien we dat “white power” als suggestie afwezig is, maar dat “black power” wel oké bevonden wordt.
Zelf aan de slag
Voordat wij onze hele vrijdag besteden aan het uitproberen van al dan niet dubieuze woorden, spelen we het door aan jullie: wat vinden jullie aan interessante zoektermen die worden geblacklist, opvallende verschillen tussen de Engelse en Nederlandse blacklist, en volkomen brave zoekopdrachten die in de kiem worden gesmoord?
frank
Als je begint te typen.. can i… vult ie aan
can i get aids from swimming with black people..
misschien dat ze die ooit nog maar eens eruit moeten halen…:D
Annedien Hoen
Nog los van de precieze zoektermen: ik vind het nogal discutabel dat de grootste zoekmachine op de stoel van de rechter gaat zitten en blijkbaar de belangen van de van auteursrecht-inkomsten afhankelijke industrie behartigt. Laten ze die discussies door de industrie, belanghebbenden en inbreukplegenden zelf laten uitvechten.
Oguzhan
Ik denk dat het woord sex voor educatieve onderzoek (sexual intercourse) in een grijs gebied terecht komt, als men in het engels naar pornografisch materieel zoekt dan is het woord ‘fuck/fucked/fucking/ed’ meer gepast in de context. In het nederlands zou bijvoorbeeld geslachtsgemeenschap.
Google instant vind ik zowiezo een irritante feature dat ik sinds de introductie heb uitgeschakeld.
Erik
http://www.technomancy.org/google-suggest-venn/#start=How+can+I+get+my+X+to&end0=wife&end1=cat&end2=dog
Miriam
1) sex is een heel normaal Engels woord, zowel in de betekenis van ‘seks’ als de betekenis van ‘geslacht’.
2) Tik bittorend (je scherm blijft leeg) en ga door met spatie + avatar. Google corrigeert meteen je tikfout en zegt “Resultaten weergeven voor bittorrent avatar. ” waarna Google Instant alle zoekresultaten laat zien. Helaas staat onderaan de eerste pagina dat de zoekresultaten gecensureerd zijn op basis van een Amerikaanse wet. Wanneer slaat de roep om democratie van de Arabische landen over naar de VS? 😉
3) Neuken is ook een gewoon woord. Waar bemoeien die fatsoensrakkers zicht mee. Zelfbevrediging mag trouwens ook al niet van die gekke Amerikanen, na zel krijg ik nog zelfmoord aangeboden, maar na zelfbev blijft het scherm leeg. Gelukkig kunnen mijn kinderen nog wel voor onaneren bij Google terecht.
Katja Lawrence
Ik vind het onzin. Het liefste lees ik nu een artikel over alternatieven voor Google. Niet omdat dit de functionaliteit voor google voor mij te erg beperkt, maar omdat ik vind dat Google niet op de stoel van de rechter dient te zitten. En als ze dat wel willen, moet dat zonder mijn zoekopdrachten.
Ewald
Any “feature” that cannot be turned off is a bug.
Mark
Zou mooi zijn als dit default aan staat om onze kinderen te beschermen, maar wees dan consequent. Omdat ik persoonlijk nogal vaak naar racistische, sex en ‘how to kill….’ pagina’s zoek, zou ik het in mijn Google account profiel heeeeeeel graag uitzetten.
M.a.w. Google, fuck op met deze belachelijke Amerikaanse fatsoens shit.
Axel Arnbak
@Katja Lawrence
We noemen een aantal andere zoekmachines in het blogje, zoals Scroogle en Ixquick. In ‘Webwijs’, onze zelfverdedigingsgids voor internetters, bieden we meer alternatieven.
Zie: https://www.bof.nl/ons-werk/webwijs/click-5-anoniem-googlen/
Kevin de Bie
Vraag me af of dit niet gewoon (een vorm van) sensuur is. Vooral dingen als hate speech vind ik een beetje te generiek. Wanneer is iets hate speech? Volgens mij heeft dat alles te maken met jou als individu. Net zoals dat er een wet moe(s)t komen tegen beledigen. Dat kan gewoon niet.
Joris Dirks
Leuk om mee te spelen, waarmee duidelijk wordt dat een paar worden filteren, geen zinnig effect heeft. Als ik Google’s “Do no evil” mantra geloof, is dit een ludieke actie om te laten zien hoe internetfilters falen.
“Sex” geeft alleen resultaten voor: “Sex and the City”, maar “safe sex” wordt gefilterd.
“How to download il” wordt aangevuld tot: “How to download illegally/illegal movies/illegal music”
“Best file” wordt: “best file sharing”.
ben
https://ssl.scroogle.org/ 🙂
Jeroen
Dat is dan de eerste stap van de plannen die in deze video’s worden besproken
http://www.youtube.com/watch?v=A2XPiqhN_Ns&feature=related
http://www.youtube.com/watch?v=Jev2Um-4_TQ
scroogle of ixquick “net neutrality”
piet
i am verry gay
piet
ik wil seks pijpen enzo uber harde kontseks!!!!!!!!!!!!!!!!!!!!!!!!!!!!