Aggressiv rättstavning hos Google förvränger sökresultat?
Vi har fått påpekat för oss att Google ägnar sig åt en rätt aggressiv form av rättstavning i vissa fall. Jag tillstår att jag i alla fall inte var medveten om detta tidigare. Så här fungerar det:
Om man söker med de tre orden open access scoap fÃ¥r man i Google upp träffar ungefär som om man sökt pÃ¥ open access scope. Träffmängderna blir inte riktigt desamma men mycket lika. I träfflistan för den förstnämnda ser man ordet scope i fetstil i sammanfattningarna under träffarna. Med andra ord har man frÃ¥n Googles sida bara förutsatt att man menat scope och inte brytt sig om att förklara att man “gjort om” sökningen.
Det här är verkligen inte bra. I det aktuella fallet är det sÃ¥ att SCOAP är en akronym som stÃ¥r för “sponsoring consortium for open access publishing”. SÃ¥ här blir det fullständigt fel. Tydligen gÃ¥r det att fÃ¥ Google att ta ordet scoap pÃ¥ allvar genom att skriva fraseringstecken runt ordet dvs. open access “scoap” . Men vem gör det? Inte ens sökmotorfreaks som vi skulle fÃ¥ för oss att göra detta för en oavbruten sträng av bokstäver.
Alla de övriga större sökmotorerna hanterar denna sökning på ett korrekt sätt. Faktiskt verkar Google vara ensamma om detta tilltag.
- Yahoo låter sökningen passera men påpekar att man kanske menade soap
- Ask och Gigablast låter sökningen passera men föreslår scoop
- Microsofts Live.com och Exalead genomför bara sökningen utan kommentar
Vi undrar nu om någon av läsarna har fler exempel på den här typen av agressiv rättstavning? Samtidigt vill vi tacka Ulf Kronman på KTH för tipset!

14 Oktober 2007 kl. 20:53
Här finns en patentansökan från Google om denna typ av funktionalitet:
http://appft1.uspto.gov/netacgi/nph-Parser?Sect1=PTO1&Sect2=HITOFF&d=PG01&p=1&u=%2Fnetahtml%2FPTO%2Fsrchnum.html&r=1&f=G&l=50&s1=%2220060224554%22.PGNR.&OS=DN/20060224554&RS=DN/20060224554
Kan vara relaterat, mer här:
http://www.seobythesea.com/?p=323
24 Oktober 2007 kl. 16:06
Jag hittade just ett nytt exempel på denna mindre trevliga hjälpsamhet. Jag arbetar med ett utvecklingsredskap som heter Django och ville veta hur jag rensar min databas.
Jag sökte på: > django clear database
25 Oktober 2007 kl. 07:30
Det Google gör är att den fetar även sökordet clean (vilket kan vara förvirrande). Det betyder inte att ordet clear INTE finns med i sökningen. Om man kollar i cached sÃ¥ ser man att ordet clear finns med pÃ¥ sidan nÃ¥nstans (ta Ctrl+F) eller sÃ¥ ser man förklaringen: “These terms only appear in links pointing to this page: clear”.
Samma sak gäller sökningen open access scoap. Jag kollade bl.a. träff 30 och ytterligare träffar längre ned i listan. Finns åtminstone i inlänkarnas text. Jag skulle inte kalla det aggressiv rättstavning utan trubbig query expansion. Dvs. Google petar inte bort sökordet clear eller scoap utan breddar det. I många fall är det bra, i vissa fall galet.
25 Oktober 2007 kl. 07:43
OK, jag förstÃ¥r att bÃ¥de “clear” och “clean” finns med.
Jag skrev ju inte att problemet är att de byter ut ord, utan att de relevanta träffarna drunknar i träffar frÃ¥n de ofrivilliga “hjälpord” som Google introducerar. Man fÃ¥r tydligen vänja sig vid att citera bort Googles hjälp när bruset blir för omfattande.
// Uffe
5 November 2007 kl. 21:56
Skriv sökordet inom citationstecken.
26 Februari 2008 kl. 10:32
Skriv ett plustecken före det ord du inte vill ska ändras. Söker du efter bil så kommer Google att leta efter bil, bilar, bilen osv men söker du efter +bil så blir det enbart just bil.
15 Mars 2008 kl. 12:10
Söker man pÃ¥ BrÃ¥ fÃ¥r man upp bÃ¥de bra och braa. Trevligt att fÃ¥ tips pÃ¥ hur man undviker googles “rättande”!