Sök med vanliga ord bland mer än 11 miljarder webbsidor i Internet Archive

Anna Patterson från Stanforduniversitet i Kalifornien har skapat sökmotorn Recall för de sparade kopiorna av gamla webbsidor i Internet Archive. Förut kunde man bara söka i Internet Archive med hjälp av en URL i söktjänsten som kallas The Wayback Machine. Nu kan man alltså använda vanliga sökord för att söka i en delmängd av Internet Archive. Den delmängden är på över 11 miljarder webbsidor vilket är över tre gånger mer än någon annan sökmotor någonsin har haft ett index över! Indexets storlek är på 2 terabyte och Recall har tillgång till 312 datorer med 1/2 GB minne så denna betatestversion saknar inte datorkraft. Sökmotorn jobbar med relevansranking baserad på sökorden och inte länkanalys som t.ex. Google. I träffbilderna presenteras också klustrade grupper förutom den vanliga träfflistan. Dessutom finns en personalisering som innebär att Recall använder sig av dina tidigare sökningar för att styra rankingen senare under en söksession. Man kan begränsa sin sökning till webbsidor från olika år och olika månader. Man får också en grafisk presentation hur antalet träffar på ett sökuttryck förändrats med tiden. Mer information finns i en PowerPoint-presentation av Anna Patterson och i kortare form på hjälpsidan. Det finns nu också en gemensam startsida för Wayback Machine och Recall. Ännu så länge är Recall som det verkar bara tillgänglig periodvis men det tar sig säkert efter hand så kom tillbaka senare om ni inte får kontakt med Recall direkt.

1 kommentar på “Sök med vanliga ord bland mer än 11 miljarder webbsidor i Internet Archive”

  1. » Cuil - the new large search engine skriver:

    […] Patterson from Stanford University was responsible for the Recall Project, and she is actually one of the founders of […]

Skriv en kommentar