Clusty introducerar remixad klustring - vad finns under ytan?
23 Januari 2008 av Lars VågeVivisimo har under flera år visat att det går att skapa meningsfulla automatiska kategorier eller kluster av sökmotorträffar. Poängen är att stoppa in de första par hundra träffarna i mappar med liknande träffar. Det största problemet med detta var inte att hitta likheterna, det finns det matematisk-statistiska metoder för. Utmaningen låg snarare i att hitta bra namn eller etiketter på klustren av sökmotorträffar. Här krävdes också en språklig intelligens i programvaran. Vivisimo lyckades väldigt väl med detta och har lyckats sälja sin teknik till många stora kunder samtidigt som internetanvändarna kunnat använda deras publika metasöktjänst Clusty för att prova på.
Nu har man lanserat ett nytt koncept som man (naturligtvis…) kallar Clustering 2.0. Det handlar om att kunna remixa träffarna för att fÃ¥ nya kluster. Raul Valdes-Perez, Vivisimos CEO, förklarar det hela sÃ¥ här:
Although clustering reveals the major topics in the top 200, 500, or more search results, there are always more topics than can be shown, without overloading the user with a very long list. There hasn’t been any better approach, until now.
With a single click, remix clustering answers the question: What other, subtler topics are there? It works by clustering again the same search results, but with an added input: ignore the topics that the user just saw. Typically, the user will then see new major topics that didn’t quite make the final cut at the last round, but may still be interesting.
Så genom att i en remix undvika de ämnen som redan extraherats och som användaren sett ska man kan kunna hitta mindre självklara spår i träffmängden. Jag är inte klar över om detta betyder att alla tidigare genererade kluster som man sett eller alla som genererats i den första klustringen (även sådana man inte sett) används på ett negerat sätt i remixen. Man har ju redan tidigare kunnat få se fler kluster (med allt färre träffar i) genom att klicka på More clusters. Men den viktigaste frågan är trots allt om man tycker att man hitter mer av intresse genom att klicka på Remix-länken.
I Clusty måste man först och främst tänka på att söka med engelska sökord eftersom klustringstekniken misslyckas med att ge begripliga namn på klustren om den t.ex. använder svenska sökträffar. När man sökt får man förutom en vanlig träfflista till vänster en ruta till höger där man hittar klustren. I denna visas dessutom träffar efter söktjänst och efter webbplatser. Clusters är det som är aktivt som standard. När man tittat igenom namnen på klustren som genererats i den första omgången och vill gräva djupare ska man alltså klicka på Remix-länken till höger.


Ska erkänna att tjänsten 

