Yahoos index det frÀschaste enligt vetenskaplig studie
För ett par Är sedan roade vi oss med att hÄlla koll pÄ frÀschören pÄ sökmotorernas index genom att jÀmföra hur snabba de var pÄ att indexera vÄr egen webbplats. Det gör vi inte lÀngre men med Firefox-tillÀgget Resurrect Pages som beskrivs hÀrunder gÄr det snabbt att göra stickprov av de tre stora sökmotorernas index. TyvÀrr Àr inte Yahoos cachade dokument daterade. DÀrför Àr det enklast med webbsidor som har nÄgon form av datummarkering som t.ex. dagstidningar och bloggar.
Jag kollade ett tiotal webbplatser och det var genomgÄende för dessa att Yahoo var bÀst uppdaterat och för det mesta hade en eller flera dagar frÀschare indexering gentemot Google och Microsoft medan kollen mot Gigablast inte fungerade nÀr jag testade. Det var ju en helt ovetenskaplig undersökning frÄn min sida det inser jag men den bekrÀftas faktiskt av en vetenskaplig artikel som ska publiceras senare i Är i Journal of Information Science.
I preprintet till A three-year study on the freshness of Web search engine databases av Dirk Lewandowki kan man konstatera att denna sÀger ungefÀr samma sak. I en figur pÄ sidan 15 visar Lewandowski att Google i 68% av fallen behöver 2 dagar för att göra en sida som deras spindel hÀmtat tillgÀnglig för sökning. För Yahoo gÀller att i 50% av fallen Àr webbsidan sökbar samma dag som den hÀmtats av Yahoo. Microsoft verkar behöva 1-2 dagar och Àr ocksÄ nÄgot bÀttre Àn Google men uppenbart Àr som sagt att Yahoo gör det hÀr bÀst.
Egentligen förvÄnar det mig inte. Yahoo fick med köpet av Overture tekniker frÄn bÄde Altavista och FAST Search & Transfer (AlltheWeb) som bÀgge satsat mycket pÄ snabb indexering och att ha ett sÄ uppdaterat sökindex som möjligt. Tidigare hade Yahoo ocksÄ köpt sökföretaget Inktomi som hade utvecklat en oerhört kraftig sökmotorspindel som heter Slurp. Med en lyckad kombination av tekniker som kan snabb spindling och snabb indexering fÄr man naturligtvis ett frÀscht sökindex.
