Arkiv för kategorin ‘Metasöktjänster’

Zuula - anpassningsbart metasökverktyg

28 Januari 2008 av Lars VÃ¥ge

Vi har aldrig tagit upp den amerikanska metasöktjänsten Zuula här på Internetbrus fick vi påpekat av företagets CEO(!). Det är ganska länge sedan vi överhuvud taget skrev om metasöktjänster så OK då. Fast egentligen är väl Zuula inte ens en metasöktjänst för här blandas inte träffarna från de olika ingående söktjänsterna. Istället får man växla mellan dem genom att klicka på flikar för var och en.

Zuula har sex olika söktjänstsamlingar - webbsökning, bildsökning, videosökning, nyhetssökning, bloggsökning och jobbsökning. När man först kommer till Zuula är det förstås webbsökningen som är standardvalet och den aktiva söktjänsten är Google. Urvalet av andra webbsöktjänster tycker jag är bra och det gläder mig att de två mindre kända men stora söktjänsterna Exalead och Gigablast finns med. Däremot saknar jag Ask och är mer tveksam till Accoona och Mojeek.

I bildsökningen tycker jag det är bra att Flickr är med som en egen ingång inte bara representerad i de övrigas index. I videosökningen finns förutom Google, Yahoo och MSN sådana som YouTube, DailyMotion och MetaCafe. Standardsöktjänst i nyhetssökningen är Yahoo och det tycker jag är motiverat, däremot saknar jag sådana som Wikio och RocketNews och att det är lite lite med bara fyra val. Nio bloggsöktjänster är däremot mer än tillräckligt, men Googles bloggsökning borde inte vara standard enligt min mening, då hade Technorati varit ett bättre val. Det kanske har att göra med Technoratis ibland lite långa svarstider.

En fördel med Zuula är att det är lätt att göra anpassningar och man kan välja bort de söktjänster man aldrig använder. Sedan kan man också välja om man vill ha en sökhistorik till vänster om träfflistan. Det finns också en Zuula Toolbar som man kan installera om man blir biten. Sammanfattningsvis kan man väl säga om Zuula att det är ett praktiskt metasökverktyg som man kan använda när man snabbt vill jämföra träfflistor för olika sökuttryck i olika söktjänster.

Clusty introducerar remixad klustring - vad finns under ytan?

23 Januari 2008 av Lars VÃ¥ge

Vivisimo har under flera år visat att det går att skapa meningsfulla automatiska kategorier eller kluster av sökmotorträffar. Poängen är att stoppa in de första par hundra träffarna i mappar med liknande träffar. Det största problemet med detta var inte att hitta likheterna, det finns det matematisk-statistiska metoder för. Utmaningen låg snarare i att hitta bra namn eller etiketter på klustren av sökmotorträffar. Här krävdes också en språklig intelligens i programvaran. Vivisimo lyckades väldigt väl med detta och har lyckats sälja sin teknik till många stora kunder samtidigt som internetanvändarna kunnat använda deras publika metasöktjänst Clusty för att prova på.

Nu har man lanserat ett nytt koncept som man (naturligtvis…) kallar Clustering 2.0. Det handlar om att kunna remixa träffarna för att fÃ¥ nya kluster. Raul Valdes-Perez, Vivisimos CEO, förklarar det hela sÃ¥ här:

Although clustering reveals the major topics in the top 200, 500, or more search results, there are always more topics than can be shown, without overloading the user with a very long list. There hasn’t been any better approach, until now.

With a single click, remix clustering answers the question: What other, subtler topics are there? It works by clustering again the same search results, but with an added input: ignore the topics that the user just saw. Typically, the user will then see new major topics that didn’t quite make the final cut at the last round, but may still be interesting.

Så genom att i en remix undvika de ämnen som redan extraherats och som användaren sett ska man kan kunna hitta mindre självklara spår i träffmängden. Jag är inte klar över om detta betyder att alla tidigare genererade kluster som man sett eller alla som genererats i den första klustringen (även sådana man inte sett) används på ett negerat sätt i remixen. Man har ju redan tidigare kunnat få se fler kluster (med allt färre träffar i) genom att klicka på More clusters. Men den viktigaste frågan är trots allt om man tycker att man hitter mer av intresse genom att klicka på Remix-länken.

I Clusty måste man först och främst tänka på att söka med engelska sökord eftersom klustringstekniken misslyckas med att ge begripliga namn på klustren om den t.ex. använder svenska sökträffar. När man sökt får man förutom en vanlig träfflista till vänster en ruta till höger där man hittar klustren. I denna visas dessutom träffar efter söktjänst och efter webbplatser. Clusters är det som är aktivt som standard. När man tittat igenom namnen på klustren som genererats i den första omgången och vill gräva djupare ska man alltså klicka på Remix-länken till höger.

Wink - sökmotor för sociala nätverk

19 November 2006 av Lars VÃ¥ge

I början av Ã¥ret nämnde vi en metasöktjänst kallad Wink som sökte pÃ¥ taggsfären eller pÃ¥ tjänster där användarna kunde sätta egna tags (nyckelord) pÃ¥ webbsidor och annat. Med denna kan man som man uttrycker det “search the social web to find what people like for any query” plus att man fÃ¥r träffar frÃ¥n Google. Det betyder att man kan hitta webbplatser som andra har bedömt vara de bästa för en given sökfrÃ¥ga. Hjälp pÃ¥ vägen alltsÃ¥. Användbarheten av denna sökform beror naturligtvis pÃ¥ hur mÃ¥nga som deltar genom att bedöma webbplatser.

I torsdags lanserades Wink officiellt ocksÃ¥ som en “social network search engine”. Man kan nu söka efter andra människor pÃ¥ nätet genom en People search. Det man dÃ¥ söker pÃ¥ är folks profilsidor där de berättar om sig själva och sina intressen. Det är profiler frÃ¥n sociala nätverk som MySpace, Bebo och LinkedIn. Enligt pressmeddelandet har Wink indexerat över 100 miljoner sÃ¥dana personliga profiler.

På detta sätt vill man göra det möjligt att hitta andra med liknande intressen på nätet. Om jag t.ex. söker på min föga kände favoritkompositör Kaikhosru Sorabji hittar jag faktiskt elva människor därute som omnämnt denne på sina profilsidor (allihop på MySpace). Bl.a. 23-årige Luke i Belfast som för ögonblicket har Sorabji som sin favoritmusik och som överväger att skriva en avhandling om honom i framtiden. Jättekul. En känd Sorabji-tolkare Tellef Johnson dyker också upp och honom skulle man ju kunna skriva och fråga när hans inspelning av den tredje pianosonaten egentligen skall ges ut.

Även om man inte fÃ¥r för sig att ta kontakt med nÃ¥gon med likartade intressen kan man fÃ¥ intressanta tips genom att läsa om annat som de tycker om som man själv inte är bekant med. Nu tycker jag att min kollega Iselid ska ta och söka pÃ¥ West Bromwich eller Baggies för att hitta fler av den sorten. Jag tror att de är väldigt mycket fler än de som gillar Sorabjis musik. Jag unnar honom det faktiskt trots att SkellefteÃ¥ slog TimrÃ¥ i veckan…

Sök på taggsfären med Wink och andra metasöktjänster

9 Januari 2006 av Lars Iselid

Wink - metasöktjänst, metasearch enginesFler och fler tjänster tillåter användarna att beskriva olika objekt med taggar, till exempel bokmärkestjänster som Del.icio.us eller personaliseringstjänster som Yahoo My Web. Kanske har ni hört begreppet bloggsfären tidigare som betecknar världen av sammanlänkade bloggar. Det senaste modeordet är taggsfären. I taggsfären ingår alla dessa objekt som kategoriserats av användarna och bloggkategorier (de beskrivande ord som vi lägger in under våra blogginlägg) brukar även räknas dit även om bloggkategorier ger betydligt mer funktionalitet än vanliga taggningar.

Nu finns fler och fler söktjänster som metasöker tjänster där olika taggar lagts upp och en av dessa är Wink. Wink metasöker taggar frÃ¥n Del.icio.us, Digg och Yahoo My Web och du kan ocksÃ¥ själv lägga in taggar pÃ¥ de länkar du hittar. De 1-10 första träffarna i Wink kommer frÃ¥n redan nämnda tjänster, men under dessa visas träffar frÃ¥n Google. Bakom fliken “Wink answers” visas ocksÃ¥ ett textutdrag frÃ¥n Wikipedia. Det gÃ¥r att sortera om träffarna frÃ¥n taggsfären efter datumordning.

Wink är inte den enda tjänst som metasöker på taggsfären. Gada.be söker inte bara på taggsfären utan även på Amazon, Google News m.m. Icerocket tags söker på bloggkategorier, Technorati tags söker både på taggar från Flickr, Furl och Del.icio.us plus bloggkategorier. Tagobert, Tagcentral och Guten Tag är andra liknande metasöktjänster.

Oodle får inte metasöka på Craiglist

16 Oktober 2005 av Lars Iselid

Oodle heter en metasöktjänst som samlar annonser från olika webbplatser i samma stil som svenska Alla annonser. Nu har de råkat i samma knipa som Alla annonser gjort när de metasökt på Blockets annonser och blev stämda men lyckligtvis friades. Oodle fick nyligen ett brev från Craiglist, en populär annonswebbplats i USA, som bad Oodle att sluta metasöka på deras annonser. I motsats till Alla annonser har Oodle också slutat upp med metasökningen men tycker på sin blogg att de inte konkurrerar med Craiglist genom att ta annonser. 20% av annonserna har kommit från Craiglist enligt statistik från förra månaden , men trots förlusten av Craiglist har man 4.5 miljoner aktiva annonser att metasöka. Några av kommentarerna i bloggen låter så här:

craigslist is just the first player who will exit your list. you serve no purpose other than to act like a parasite with others content.
Ray

is google a parasite? why is it bad for oodle to show me multiple places where i can find things? i live in the bay area where craigslist rules and still find it useful.
Gina

Ray, do you use Google, Yahoo search, Technorati or any blog readers? How would you compare what they are doing with Oodle?
Brett

the problem is that random spidering/scraping is a business model that doesn’t fully support content owners/creators. it’s intrusive to the content owner and getting a little extra traffic doesn’t necessarily make it worthwhile for craiglist to allow this.
PixsyBizDev

Hey guys, we’re developing one huge source of information and media for college students. We’re going to be available at over 2,000 college campuses. We’d love to have our content searched by oodle. We’re offering jobs, housing, items for sale. It’s a shame craigs list blocked you guys
Jason L. Baptiste

Carrot2 - Open Source-baserat metasöktjänstprojekt

20 Juli 2005 av Lars VÃ¥ge

carrot2
Gillar ni Vivisimo och Clusty kommer ni att tycka om det Open Source-baserade Carrot2-projektet. Carrot2 är ett slags ramverk för experimenterande med olika typer av metasökningar och träffpresentationerna av dessa. Tyngdpunkten har hittills legat på automatisk klustring liksom hos Vivisimo. Den flexibla arkitekturen hos Carrot2 gör dock att de som vill och kan (dvs är riktigt bra på matematik och programmering) har möjlighet att använda ramverket till många olika typer av lösningar. De två tongivande utvecklarna, Dawid Weiss och Jerzy Stefanowski, kommer från Poznans tekniska universitet i Polen. På Carrot2-webbplatsen finns det länkar till sju artiklar (varav fem på engelska) som skrivits av forskare knutna till projektet. Den som vill kan ladda ned källkoden till Carrot2, som är programmerat i Java, från SourceForge.

För att få en uppfattning av vad det hela går ut på kan man besöka sök-demon med Carrot2-teknik. Högst upp finns en sökruta och omedelbart under en rullgardinsmeny där man kan välja sökprocess. Med det senare menas i det här sammanhanget en kombination av datakälla, klustringsalgoritm/filter och presentationsform. Förvalt är Google som källa, LINGO-algoritmen som filter och Dynamic tree för presentation av träffarna. Provar man att göra en sökning får man en träffbild som känns igen från Vivisimo med träffarna sorterade i namngivna kluster till vänster. Klustring är språkberoende och det fungerar bäst att söka på engelska eller om man kan polska. Förutom Google som datakälla finns även Alltheweb, BBC News och Yahoo! News. I en del av de valbara sökprocesserna finns stemming med som en komponent. Om resultatet med t.ex. LINGO-algoritmen är bättre eller sämre än hos Vivisimo är svårt att säga men nog verkar det vara av åtminstone samma klass.

Det ska också sägas att LINGO används som klustringsalgoritm av Grokker som på denna byggt sin egen spännade visualisering av träffarna. På webbplatsen Carrot-search.com finns länkar till webbversionen av Grokker liksom ett par andra demos som utnyttjar LINGO.

Är överlappningen mellan sökmotorer betydligt överskattad?

23 Maj 2005 av Lars VÃ¥ge

InfoSpace, det amerikanska företaget som äger flera metasöktjänster, har pÃ¥ Dogpiles webbplats publicerat ett white paper om överlappningen mellan olika sökmotorers träffar. Deras undersökning visar att om man jämför de 10 första träffarna frÃ¥n Google, Yahoo och AskJeeves för olika sökord finner man att överlappningen i genomsnitt är endast 3 %! Det är inte utan att man frÃ¥gar man sig om det verkligen kan vara sÃ¥ illa och om InfoSpace hävdar detta bara för att kunna sälja sina metasöktjänster. Det senare är nog svÃ¥rt att tro med tanke pÃ¥ att studien faktiskt skett i samarbete med tvÃ¥ olika amerikanska universitet. Det finns en tvÃ¥sidig pdf-fil med en sammanfattning av resultaten där man kan läsa att dessa bygger pÃ¥ 10 316 sökningar pÃ¥ slumpvis valda nyckelord som plockats frÃ¥n sökmotorloggar. PÃ¥ Dogpile finns nu ocksÃ¥ ett särskilt verktyg kallat Missing Pieces med vilket man grafiskt kan studera hur överlappningen är för olika sökord. För sökordet “internetbrus” rapporterar Missing Pieces bara en överlappande träff och dÃ¥ ser det ut som pÃ¥ bilden nedan.
missingpieces

Lägg till kolumner i A9

31 Mars 2005 av Lars Iselid

A9 har kommit med en ny funktion som gör det möjligt att söka i andra tjänster än de som redan finns som förval, dvs. webben via Google, böcker via Amazon, bilder via Google Images, filmfakta via IMDB.com, allmänfakta via Gurunet, amerikanska gula sidor. Genom att skapa nÃ¥got de kallar OpenSearch har A9 gjort det möjligt för alla webbplatser som vill att syndikera sitt sökresultat som användarna i sin tur kan välja att lägga till i gränssnittet som kolumner. A9 vill att: “OpenSearch ska göra för sökningen vad RSS har gjort för att sprida innehÃ¥ll”, som de uttrycker det.

Att A9 nu ökat tillgången till ytterligare sökkällor i form av kolumner var väntat och efterlängtat, men själva lösningen är överraskande. Att det är webbplatsägarna och användarna som styr valet av sökkällor. OpenSearch är skapat med hjälp av RSS-standarden och påstås var enkelt att koda ihop. Har inte provat själv ännu. Man kan också spara RSS-flöden för varje sökning mot respektive sökkälla i sin bloggläsare. T.ex. kan jag lägga in medicinska databasen PubMed som ny kolumn och göra en sökning i A9 på cystic fibrosis therapy och sedan spara XML-länken, som finns längst ner i PubMed-kolumnen, till min bloggläsare (Bloglines såklart;-) Via min bloggläsare kan jag sedan bevaka nya artiklar om behandling av cystisk fibros.

Man ska också kunna syndikera andras OpenSearch RSS på den egna webbplatsen, men naturligtvis måste man fråga om lov. För tillfället finns 120 sökkällor att välja mellan och de lär öka, vilket ställer stora krav på att det blir lätt att söka igenom den kommande mängden av kolumner. Saknar du en sökkälla så handlar det om att starta operation övertalning för att få de att skapa en OpenSearch RSS. Skulle sitta fint med några svenska sökkällo
r: Nationalencyklopedin, Mediearkivet, Computer Sweden(borde väl alla kunna fungera om man har prenumeration), Libris, Bibliotek.se etc

Clusty - ny klustrande söktjänst från Vivisimo

3 Oktober 2004 av Lars VÃ¥ge

Flera gånger under de senaste åren har vi skrivit med uppskattning om metasöktjänsterna och specialsökningarna som funnits tillgängliga från företaget Vivisimos hemsida. Dessa har fungerat som en demo av deras klustringsteknik och i synnerhet deras metasöktjänst med vanliga sökmotorer har fått mycket beröm. Därför är det roligt att kunna konstatera att Vivisimo nu kommer med en egen söktjänst som använder klustring och som passande nog kallats Clusty. För de som inte omedelbart känner igen ordet klustring i det här sammanhanget (eller något annat för den delen) rör det sig alltså om att stoppa in sökresultaten i ett antal mappar med likartade resultat tillsammans och med meningsfulla beteckningar på mapparna. På så sätt får användaren snabbt överblick över vad för typ av träffar som sökningen genererat.

Startsidan har intensivt blå bakgrundsfärg, en logotyp som ser ut som ett påsytt broderat jackmärke, en sökruta och 6 flikar med olika sökningar och möjligheten att lägga till ytterligare tre sökflikar. Flikarna som finns i start är för vanlig webbsökning, nyhetssökning, bildsökning, shoppingsökning, faktasökning (encyclopedia) och skvaller(!). Till dessa kan man om man vill aktivera flikar för eBay-sökning, bloggsökning och sökning i tekniknyhetsbloggen Slashdot. Om man fortfarande inte är nöjd kan man skapa upp till fyra egna flikar till vilka man kan välja källor själv bland 20 alternativ. Några exempel på valbara källor är MSN, Open Directory, Gigablast, Reuters, BBC News, Washington Post, PubMed, BizRate och Librarians Index to the Internet. I skvallersökningen finns källor som Associated Press, MTV och Rolling Stone. Faktasökningen baserar sig faktiskt på Wikipedia vilket inte är helt okontroversiellt.

Som ni börjar förstÃ¥ finns det ganska stora möjligheter att skräddarsy Clusty för sina egna behov. Clusty har ju inget eget index sÃ¥ kvaliteten pÃ¥ träffarna är naturligtvis beroende pÃ¥ de ingÃ¥ende söktjänsterna själva som vi brukar hävda. Fast det är ju inte sant i det här fallet eftersom klustringstekniken förändrar utseendet pÃ¥ träfflistorna kraftigt om man jämför med att utföra sökningen pÃ¥ de ingÃ¥ende söktjänsternas egna webbplatser. Det är ju ocksÃ¥ hela poängen med klustringen, att ge ett mervärde gentemot de vanliga trista linjära träfflistorna. I New York Times har John Markoff skrivit om Clusty och hävdar: “Many search experts say that clustering offers a better way of looking at information than Google’s page ranking system”. Förmodligen helt sant men att fÃ¥ de vanliga användarna att göra nÃ¥got annat än vanemässigt skriva in google.com i adressfältet i webbläsaren verkar nästan omöjligt just nu. Det är synd det eftersom det förekommer en hel del kreativ utveckling pÃ¥ annat hÃ¥ll.

Söktjänsten A9 ej längre i beta och med nya funktioner

16 September 2004 av Lars Iselid

Amazonägda söktjänsten A9 som söker i Googles sökmotor och Amazons böcker har nu släppt en “stabil” version och har samtidigt lagt till mÃ¥nga nya funktioner. Nu visas ocksÃ¥ resultat frÃ¥n Googles bildsökning, filmträffar frÃ¥n Internet Movie Database, encyklopediträffar frÃ¥n Gurunet. Genom att registrera sig kan man ocksÃ¥ spara bÃ¥de bokmärken, sökhistorik, noteringar och fÃ¥ länkförslag.

A9:s integrering av träffar från webbplatser som Gurunet, IMDB och Amazon följer samma tanke som t ex Yahoo och Ask Jeeves har vad gäller search shortcuts där man föröker lyfta fram bra faktabaserade webbplatser som motvikt till sökmotorernas, ibland bristfälliga, träfflistor. Presentationen av och sökningen efter dessa faktabaserade webbplatser skiljer sig dock i A9 i jämförelse med Yahoo och Ask Jeeves.

Bloggtoppen.se

Blogglista.se

Global Voices Online - The world is talking. Are you listening?

Creeper

Nowhere North

↑ Grab this Headline Animator



iselid info

↑ Grab this Headline Animator