Det senaste numret av tidskriften ACM Queue kom ut i april och är ett specialnummer kallat Enterprise Search. I detta finns ett flertal intressanta artiklar om sökmotorer och artiklarna går också att läsa i fulltext på Internet. Why writing your own search engine is hard är skriven av Anna Patterson på Stanforduniversitet. För er som inte känner till det är Anna den som har skrivit sökmotorn bakom Internet Archives fritextsökning Recall som har ett index på 11 miljarder äldre kopior av webbsidor. Det är världens största sökmotorindex hittills och Annas artikel är lättsam och roande läsning samtidigt som hon ger massor av tips på hur man ska undvika fallgropar. Köp inte SCSI-diskar, bandbredd är viktigare än CPU-kraft, använd inte filsystemet NFS, lägg inte energi på indexformat utan lägg krutet på rankingen, använd inte länkanalys vid rankingen, alla fel som du tror aldrig kommer att hända kommer att hända…

I tidskriftsnumret finns också intervjun A conversation with Matt Wells. Det roliga med denna är att det är skaparen av söktjänsten InfoSeek Steve Kirsch som gjort intervjun med Wells som är den som har konstruerat och äger sökmotorn Gigablast. I senaste numret av Datormagazin har min medredaktör på Internetbrus, Lars Iselid, gjort en intervju av Wells på svenska (”Gigablast utmanar”) och den i ACM Queue fungerar bra som ett komplement. Kirsch och Wells blir nämligen ganska tekniska (den förre har faktiskt varit den senares chef en gång på Infoseek) och för de som är intresserade av tekniken bakom sökmotorerna är det en spännande läsning. Wells drar många halvskruvade paralleller mellan hur sökmotorer och den mänskliga hjärnan fungerar och slutar med orden: “The ultimate goal of computer science is to create a machine that thinks like we do, and that machine will have a search engine at its core, just like our brain”.


No Comments on “Läs experternas råd om sökmotorkonstruktion”

Comments on this entry are closed.