Arkiv för kategorin ‘Exalead’

Exalead uppgraderar

25 Oktober 2005 av Lars Iselid

Exalead  sökmotor från FrankrikeDen franska sökmotorn Exalead som vi tidigare hyllat för sina avancerade sökfunktioner som trunkering, närhetssökning, stemming, fonetisk sökning, fältsökning för språk, har gjort en uppgradering. Bland annat har indexet ökat och ligger över 2 miljarder sidor, ungefär lika mycket som Gigablast, vilket är dubbelt som mycket som tidigare. Den exakta siffran på storleken är inte så viktig men om det är ca 1 miljard eller 2 miljard är av betydelse, som vi tidigare argumenterat för.

Sedan december 2004 har det funnits möjlighet att lägga in egna länkar till sidor under själva sökrutan. Förändringen är nu att man kan lägga in upp till 18 genvägar. Med fördel kan man lägga in sökvägen till andra söktjänster, vilket gör det möjligt att utföra samma sökning på ytterligare söktjänster genom att klicka på genvägen som utformas som en liten bild under sökrutan. I hjälpen i Exalead under Miscellaneous och rubriken Smart bookmarks kan man se hur det går till. Här finns också en mer pedagogisk förklaring från Search Engine Watch blog.

Det finns många fler bra funktioner i Exalead och den är väl värd att testa. I hjälpen under Keyboard shortcuts finns instruktioner till genvägar för att lättare navigera i träfflistan. Med Enter eller genom att klicka nånstans på träffen (dock inte på själva länken) kan man få en liten förhandstitt på sidan utan att behöva gå direkt till sidan. Samma funktion finns i Clusty.com (fanns tidigare i både Brainboost och WiseNut). Med Esc eller Enter kan man stänga förhandstitten. Med mellanstegstangenten kan man vandra framåt i träfflistan och med Shift+Mellanstegstangenten backa i träfflistan.

Exalead visar till vänster i träfflistan en funktion för relaterade termer, relaterade kategorier (hämtade länkar från Dmoz.org) och webbplatser utifrån land (länkar från Dmoz.org sorterade efter land). Längst ner sorteras träffarna efter dokumenttyp, bl.a. power point, PDF, flash, men inga andra ljud eller videofiler. Video och audio kan man däremot begränsa till högre upp på sidan i den grå ramen. Här finns också valet RSS som gör att man ser vilka eventuella träffar i listan som har RSS-länkar.

Förvalet i träfflistan är att man för se en liten bild av webbsidan, liknade det som är möjligt med Thumbshots i Open Directory och Firefox tillägget GooglePreview. Det går att välj i den grå ramen högst upp till höger om man inte vill se dessa små bilder eller enbart dessa små bilder med reducerad text.

Med tanke på Exaleads ökning av indexet har de visat att de vill vara med och konkurrera med de stora och deras avancerade sökfunktioner gör att man inte längre sörjer gamla Altavista advanced som hade både trunkering och närhetssökning i sin sökarsenal.

Det ska också läggas till att Exalead nu också lanserar ett eget skrivbordsökningsprogram under namnet Exalead One Desktop. Men den får ni äran att testa själva.

Gigablast passerar det magiska 1 miljard-strecket, liksom Exalead

11 Januari 2005 av Lars Iselid

Gigablasts planer var att nå 5 miljarder webbdokument i sitt sökmotorindex redan under föregående år. Nu har man i varje fall äntligen passerat det magiska 1 miljard-strecket som ändå bara är drygt en åttondel av Googles index. I samma stund när jag kollar Exalead så har även de passerat 1 miljard webbdokument.

Meningarna går ibland isär om vikten av att ha ett stort index. Att det är viktigare att presentera relevanta svar. Min uppfattning är att bland avancerade användare av sökmotorer, dvs. vi som håller koll på storleken, är stort index viktigt av den enkla anledningen att vi alltid bär på en känsla av att vi kanske missat något som kunde varit (ännu mer) relevant om vi söker på en mindre sökmotor. Mindre avancerade användare är säkert nöjda så länga de får relevanta svar, men hittar de inte grannen Bosses hemsida i den mindre sökmotorn är nog chansen stor att de byter sökmotor och förhoppningsvis kanske väljer någon av de stora mer kända sökmotorerna. Därför är det med stor glädje jag ser Gigablast och även Exalead växa. Det finns många små sökmotorer med bra lösningar i övrigt, som Gigablast, men som självdör av den enkla orsaken att man inte klarar av det mödosamma tekniska arbetet med att hantera stora textmängder på servrar.

Med detta sagt menar jag inte att relevanta svar i sökmotorerna är oviktigt, men kanske inte så mycket viktigare än indexstorlek som det ibland påstås.

Här har du en aktuell ställning på sökmotorernas indexstorlek och här kan du läsa min intervju med Gigablasts Matt Wells [PDF] som publicerades i april förra året i Datormagazin.

Exalead - ny superavancerad sökmotor ger sig in i leken

27 Oktober 2004 av Lars VÃ¥ge

Så här i höstmörkret har det dykt upp ett nytt globalt sökmotorindex att söka i - Exalead. Egentligen har Exalead funnits tillgängliga ett tag eftersom AOL France valde bort Google och de andra till förmån för det franska företaget Exalead. Nu har man kommit med en betaversion som ska indexera inte bara den franska webben utan hela webben. Just nu har man runt 450 miljoner indexerade länkar men man satsar på att komma upp i en miljard inom kort. Vad finns det då att hämta här som inte finns i t.ex. Google? Tja, det visar sig vara en hel del. Om vi börjar med funktioner som de är ensamma om bland de stora sökmotorerna så finns här:

  • Närhetssökning: med hjälp av närhetsoperatorn NEAR (fanns hos Altavista tidigare)
  • Trunkering: med hjälp av asterisken * kan man kapa av ett ord var man för att täcka olika ordformer (fanns hos Altavista tidigare)
  • Fonetisk sökning: genom att aktivera denna kan man fÃ¥ träff pÃ¥ ord som lÃ¥ter som det man skriver även om man stavat fel (tycks inte fungera som vanlig stavningskontroll)
  • Reguljära sökmönster: detta är den typ av sökuttryck som används av programmeringssprÃ¥k som t.ex. skriptsprÃ¥ken PHP och Perl. Ingen stor global sökmotor har mig veterligt haft stöd för detta nÃ¥gonsin.

Inte dåligt men det stoppar inte där. Bland funktioner som finns hos andra sökmotorer men inte är vanliga finns hos Exalead:

  • Aktivera stemming (ordstamssökning) sÃ¥ att en sökning expanderas till att omfatta bÃ¥de singular/plural och verbkonjugationer (MSN Search har idag stöd för stemming, hur blir det framöver?)
  • Datumsortering: nyast först eller äldst först
  • Datumsökning: hitta dokument sparade eller modifierade före eller efter ett exakt datum. Skriv t.ex. sÃ¥ här: sökord >= 2004/09/01
  • Tumnagelsbilder i träfflistan: och det är deras egna, inte lÃ¥nade frÃ¥n Thumbshots.org

Dessutom indexerar man alla de viktigaste dokumentformaten vid sidan av html som PDF, Word, Excel, Powerpoint, Rich Text Format och vanliga textdokument. Navigationen i träfflistorna är mycket väl utformad och man kan lätt byta mellan visning med bara text, text och tumnaglar eller bara tumnaglar(!). När man klickar på en tumnagel öppnas webbsidan i ett preview-fönster längst ner till höger. Här är sökorden markerade och man kan smidigt navigera mellan de olika förekomsterna av ordet i dokumentet. Det fungerar t.om. för filformat som PDF och Word. Det finns också relaterade söktermer, relaterade kategorier i Open Directory, träffar indelade efter länder samt träffar indelade efter dokumenttyp.
e ha stöd för bokstäverna å,ä och ö tyvärr. Annars är Exalead rena partyt om man som jag är road av avancerade sökmotorer. Vill man inte använda de specialiserade sökfunktionerna fungerar Exalead utmärkt som en sökmotor med bara en sökruta. Korsordslösare (med programmeringskunskaper?) rekommenderas dock av Exalead att använda de reguljära sökmönstren. Jag roade mig med att söka på vad som helst (skriv det kryptiska sökuttrycket /.*/) med äldsta dokumentet överst. Då fick jag en sida som senast sparades 17 maj 1997 som första träff.

Läs gärna VeriTest “pertinence relevance test” av AOL France i jämförelse med Google frÃ¥n sept. 2004. [PDF]

Exalead, Mooter, Exactseek - framtidens sökmotorer?

3 November 2003 av Lars Iselid

Exalead, Mooter och Exactseek heter tre nya sökmotorer med intressanta tekniska lösningar.
Exalead startades i Paris 2000 av Francois Bourdoncle som fick idén sÃ¥ tidigt som 1996 när han med Patrice Bertin kläckte idén till Altavista Live Topics. Han tyckte att söktjänster var dÃ¥liga pÃ¥ att föra dialog med sina användare och föresprÃ¥kade mer interaktivitet. Vad Exalead använder är en statistisk sprÃ¥kteknik för att känna igen naturligt sprÃ¥k, vilket är väl kända tekniker men inte används av de stora sökmotorerna idag. Mer exakt använder Exalead lemmatisering av ord, d.v.s. man försöker hitta ordens grundform. Till exempel bryts verben “spelat” och “spelade” ner till “spela” och som vid stemming bryts bestämd form av substantiv ner till obestämd form och pluralis till singularis. “Fotbollen” och “fotbollar” blir “fotboll”. Istället för att använda ordlistor som bekräftar regler för grammatiken, gör Exalead statistiska beräkningar och sparar därför tid för att hÃ¥lla ordlistorna uppdaterade. Exalead konverterar ocksÃ¥ alla insamlade HTML-dokument till XML med hjälp av deras XML/Java-baserade ExaScript. PÃ¥ Exaleads webbplats kan man testa deras produkt bÃ¥de mot franska och engelska sidor. En trubbig beräkning där en sökning pÃ¥ “wristler” ger 4 träffar i Exalead ger 174 i Google. Vilket innebär ca 2% av Googles indexstorlek pÃ¥ drygt 3,3 miljarder sidor. Exalead är främst tänkt att säljas för intranät och portaler och mÃ¥let är inte att bli en internetsökmotor. Kolla särskilt in den automatiserade kategoriseringen i högerramen och Keywords-funktionen längst ner i ramen.

Mooter vill vara ett alternativ till de dumma booleska sökmotorerna på nätet genom att använda artificiell intelligens baserade på psykologiska förklaringsmodeller. Hängde ni med? :-) Vanliga sökmotorer fungerar mest som papegojor, dvs. de levererar dokument som innehåller de ord man angett. Mooter tittar på de val du gör när du söker, inte genom någon cookie utan under söktillfället, och omsorterar sedan träffarna baserat på denna information vilket gör att olika personer kan få olika träffar. Mooter försöker förstå betydelsen av sökfrågan, inte bara matcha sökorden. Mooter presenterar först en enkel grafisk bild av träffarna och deras relation med andra kategorier, liknande Kartoo och Webbrain. Utifrån detta väljer man kategori och får fram träffarna. Artificiell intelligens är ett stort forskningsområde som handlar om att få datorer att efterlikna mänskligt tänkande. För ett par år sedan lanserade Chalmersforskaren Peter Nordin sökmotorn Laika på Vill.se baserad på artificiell intelligens, men Laika-projektet dog ut. Kanske lyckas Mooter bättre.

Exactseek använder ett sätt att ranka dokument mot varandra genom att använda statistik om vilka sidor som är populärast hos användarna. Tanken är inte helt ny, vilket VD:n Mel Strocen hävdar, eftersom den har likheter med DirectHits rankingteknik som kallas länkpopularitet eller ibland klickpopularitet. DirectHit tittar på vilka länkar i en träfflista som en besökare tittar på och hur ofta de klickar på den länken, men även hur länge de stannade på den valda sidan. Statistiken som ExactSeek använder hämtas från Alexa, ägt av Amazon.com. Fördelen med denna ranking som bygger på besökspopularitet är att den, i princip, inte går att manipulera och på det viset kan den bli ett viktigt komplement till andra rankingtekniker.

Exactseek har ett bra avancerat sökformulär där närhetssökning är förval(!) även om indexet är på ynka 2 miljoner sidor så ökar det med 30.000 nya sidor per dag. Exactseek använder faktiskt metatagg-information från HTML-dokumentet som rankingkriterium och kan väl gärna göra det eftersom det är besöksstatistiken som fäller det slutgiltiga avgörandet om rankingvärde. Det innebär att både Exactseek och Gigablast i motsats till de stora drakarna använder metataggar i rankingen.

Bloggtoppen.se

Blogglista.se

Global Voices Online - The world is talking. Are you listening?

Creeper

Nowhere North

↑ Grab this Headline Animator



iselid info

↑ Grab this Headline Animator