Arkiv för kategorin ‘Gigablast’

Gigablast lanserar rättstavning och planerar större index

22 November 2003 av Lars Iselid

Den lilla uppstickaren Gigablast, med udda lösningar som Gigaboost och Superrecall, har nu lagt till en rättstavningsfunktion i deras sökmotor. Gigablast använder de cachade sidorna för att skapa ordlistan som behövs för att kunna presentera lämpliga alternativa ord. Om ordet eller frasen inte finns i den skapade ordlistan presenteras det mest närliggande ordet. Om flera av dessa ord och fraser ur ordlistan är närliggande sÃ¥ väljs orden ut enligt popularitetsranking. Liksom i Googles rättstavning mÃ¥ste man i Gigablast Ã¥tminstone stava den första bokstaven rätt. I svenska Siteseekers sökmotor, som Internetbrus använder, finns en annan funktion än den popularitetsranking som Mats Wells Gigablast använder. Den gÃ¥r ut pÃ¥ att avgöra närliggande ord även utifrÃ¥n var närmaste bokstav ligger pÃ¥ tangentbordet. Är den förmodade felstavade bokstaven s kan det rätta ordet förmodas vara: w, d, x, z eller a hellre än i, o, p, l osv. En bra funktion eftersom mÃ¥nga snarare slinter pÃ¥ tangenterna än stavar fel. Vill ni läsa mer om rättstavning stÃ¥r det mer pÃ¥ 123-126 i vÃ¥r bok “Informationssökning pÃ¥ Internet”.

Gigablasts Matts Wells meddelar också att han inom 12 månader hoppas kunna köpa in hårdvara som ska göra det möjligt att öka Gigablasts index till 5 miljarder sidor. Klart vi önskar Matts Wells lycka till! För tillfället är nog Gigablast den mest innovativa sökmotorn vid sidan om Google och det är alltid roligt med lyckade enmanskraftsverk som Gigablast. En intervju med Matt Wells gjord av Gary Price publicerades i SearchDay tidigare i höst.

Gigablast testar avancerade metataggar och utlovar större och fräschare index

26 September 2003 av Lars Iselid

Matt Wells enmansprojekt Gigablast utlovar 18 september i sin blogg att Gigablast inom de närmsta månaderna kommer att öka indexet från nuvarande ca 200 miljoner till 400 miljoner sidor och att indexet ska bli betydligt bättre uppdaterat. I skrivande stund kan man se att internetbrus indexerades senast 22 juli och DN 17 juni, vilket inte är imponerande.

Gigablasts Matt Wells uppmanar också de som skapar webbsidor att använda sig av avancerade metataggar som anger geografisk tillhörighet, författare, språk och klassifikation (som får tolkas som ett fält för fria ämnesord). Denna uppmaning öppnar upp för manipulation, vilket Gigablast måste hantera på något sätt om fler och fler sidor använder dessa meta-taggar. Vill ni veta mer om Gigablasts grundare Matt Wells så intervjuades han igår 25 september i nyhetsbrevet Searchday av ingen mindre än Gary Price från Resourceshelf. I intervjun får man bl.a. veta att Matt Wells jobbat på Infoseek fram till augusti 2000. Han berättar också att Gigablasts rankingalgoritm inte baseras lika mycket på länkanalys som t.ex. Google, Teoma, WiseNut m.fl., av den enkla orsaken att nya sidor inte ska premieras lägre än etablerade sidor, vilket är ett problem med strikta länkanalys-algoritmer. Matts framtidsplaner är att experimentera mer med rankingalgoritmer. Yahoo/Overture och Google har utan tvekan fått en ny konkurrent att räkna med, sedan Teoma och WiseNut hamnat i en innovativ dvala.

Gigablast får boolesk sökmöjlighet

3 September 2003 av Lars Iselid

Matt Wells som stÃ¥r bakom Gigablast meddelade i mÃ¥ndags pÃ¥ sin blogg “Rants & Raves” att det nu är möjligt att söka med booleska operatorer(OR, AND, OR NOT, AND NOT) i Gigablast. Av nÃ¥gon anledning envisas Gigablast, precis som Altavista, med att kräva operatorerna AND NOT för att utesluta ett ord, medan de flesta sökmotorer bara kräver operatorn NOT. Det gÃ¥r däremot lika bra att använda minustecken före ett ord i Gigablast om man vill utesluta ett ord, precis som i Altavista och de flesta andra sökmotorer.

Gigablast är också ensam bland de större sökmotorerna att ha operatorn OR som förval när man söker på två ord. Något som Altavista envisades med förut och WebCrawler, på den tiden den var sökmotor och inte metasöktjänst.

Söker man pÃ¥ ett ovanligt ord som fejset (7 träffar) och lägger till ordet ansikte visar Gigablast att det fanns tvÃ¥ träffar med bÃ¥da orden och att träffarna därefter bara innehÃ¥ller ett av orden i varje träff. I en blÃ¥ ram som separerar träffarna stÃ¥r det:”The results below may not have all your query terms”. Denna funktion kallar Gigablast Super Recall. Om man inte är nÃ¥gon vän av detta med OR som förval kan man sätta ett plustecken före de ord man söker pÃ¥ sÃ¥ sätts Super Recall ur funktion.

Gigablast växer och utvecklas

21 Juli 2003 av Lars VÃ¥ge

Den största självständiga sökmotorn som finns kvar, Gigablast, fortsätter att kämpa på vid sidan av jättarna. I slutet av juni kom Gigablast 2.0 som enligt utvecklaren Matt Wells gör att sökmotorn nu kan hantera dubbelt så många sökfrågor på samma tid. Med den hårdvara som nu finns ska indexet kunna växa från 193 miljoner webbsidor idag till 400 miljoner. I en intervju med SEO Journal News säger Matt att Gigablast körs på 8 datorer med 1.4GHz AMD-processorer och att han nu har full redundans så att om någon av datorerna går ner rycker en annan in. Han överväger också att låta Gigablast börja spindla PDF-dokument. Gigablast är den största sökmotorn vid sidan av Google som ger tillgång till cachade webbsidor och dessa har till skillnad från hos Google datummärkning. Men tänk på att Gigablast är den enda sökmotor som använder OR som underförstådd operator när ni söker. För att förtydliga detta har Matt i förra veckan lagt till en blåfärgad avskiljare som visar när träffarna inte innehåller alla sökorden längre i träfflistan.

Gigablast datumstämplar sparade kopior

14 Augusti 2002 av Lars Iselid

Gigablast heter en söktjänst värd att nämnas som dök upp i början av detta år. Liksom Google sparar den en kopia av varje spindlad webbsida men i motsats till Google anges också datum för spindlingen.

Den enda söktjänst som också har denna datumangivelse, mig veterligen, är nyhetssöktjänsten Daypop. Gigablast påstår sig också anpassa spindlingsfrekvensen efter hur ofta en webbsida ändrar information. Det vore trevligt även med information om hur ofta spindlingen sker för respektive webbsida.

De gånger Google saknar en sparad kopia av en webbsida, t ex Washington Posts nyheter som Google inte får spara, kan man med fördel använda Gigablast eller Daypop. Prova en sökning i Gigablast om sri lankan peace och Washingtonpost.com. Det finns en sparad kopia men den rätta länkan är död.

Gigablast är ett enmansprojekt av den före detta Infoseek-anställde Matt Wells. Gigablast har blivit hårt kritiserad för dåliga rankingalgoritmer som är lätta att manipulera och att det är alldeles för lätt att anmäla sidor. En dröm för de som älskar att manipulera sökmotorer alltså. Vi får se vad som händer.

Bloggtoppen.se

Blogglista.se

Global Voices Online - The world is talking. Are you listening?

Creeper

Nowhere North

↑ Grab this Headline Animator



iselid info

↑ Grab this Headline Animator