Arkiv för kategorin ‘Internetsöktjänster’

Google Blogsearch nu med klustring och kategorisering

3 Oktober 2008 av Lars Iselid

Google Blogsearch har nu integrerat funktioner för kategorisering och klustring av “diskussionsämne”. Kategorierna är inte exakt desamma som redan finns i Google News, men liknande. T.ex. Video Games och Movies finns bara i bloggsökningen. Klustringen är den funktion där blogginlägg som diskuterar samma händelse sorteras tillsammans som länge funnits i Google News för nyheter. Skall inte förväxlas med klustring för själva sökresultatet där flera träffar frÃ¥n samma blogg kan sorteras under en träff.

Kanske får vi i framtiden också se en större integration mellan Googles nyhets- och bloggsökning. I dagsläget finns de som helt separata tjänster, men i nyhetssökningen kan man efter en sökning klicka på länken Blogs till vänster så görs samma sökning bland bloggar. Personaliseringsfunktionerna i nyhetssökningen kanske kommer till bloggsökningen snart också.

Hubert Chang självutnämnd medkonstruktör av Google

25 September 2008 av Lars Iselid

Som gubben ur lÃ¥dan dyker Hubert (Hung-Hsien) Chang upp och självutnämner sig som den tredje bortglömde medkonstruktören av Googles algoritm PageRank samt delaktig i utformandet av Googles affärsplan. SÃ¥ dags nu kanske ni tänker och känner igen det frÃ¥n TV-sÃ¥por där den okände sonen dyker upp och vill ha en del av arvet frÃ¥n sin nyss avlidne far. Hubert Chang har publicerat en egen video under rubriken:”Google truth, the truth of Google’s birth” pÃ¥ Vimeo där han presenterar sin egen syn pÃ¥ saken:


Google truth, the truth of Google’s birth from googletruth on Vimeo.

Så här beskriver han sin inblandning:

“Through intensive collaboration with Larry and Sergey, Google was designed. The plan includes the search engine algorithm, business model, the name of the company, a graduate school like corp culture, the outline of system architecture and Google’s growing path”.

Chang pÃ¥stÃ¥r att han blev erbjuden att “sätta” sitt namn pÃ¥ det paper om PageRank som presenterades pÃ¥ The Seventh International World Wide Web Conference in Brisbane, Australia, 14-18 april, 1998. Han avböjde för att han ville fokusera pÃ¥ sitt avhandlingsarbete istället, vilket han erkänner i efterhand inte var sÃ¥ smart strategi. Han pÃ¥stÃ¥r att han meddelade Page och Brin att de kunde fortsätta själva med Google-projektet sÃ¥ skulle han kontakta dom sÃ¥ fort han var klar med sin avhandling, vilket han blev 2002. När han tog upp kontakten igen verkade de första stegen lovande, men sedan fick han bara svar frÃ¥n en tredje person. Är Chang bara en dÃ¥lig, kanske t.o.m. klantig förlorare, eller har Larry Page och Sergey Brin gÃ¥tt över lik? Döm själva!

Enriched Content: Concept, Architecture, Implementation, and Applications” heter Hung-Hsien Changs avhandling frÃ¥n 2003.

Google Books lanserar API med förhandsgranskning och annat

24 September 2008 av Lars Iselid

Google Books har lanserats en API som gör det möjligt att integrera förhandsgranskning (Google Preview), visning av sökresultat från fulltext, sociala funktioner som betyg, recensioner etc.

Framför allt är det förhandsgranskningen som nu används av flera nätbokhandlare (t.ex. Books-A-Million), förlag (t.ex. O’Reilly ) och bibliotek (t.ex. University of California Libraries)

Här kan man se vilka som använder Google Books API och här finns mer info om Google Books API.

Exalead förbättrar bildsökningen med intuitivt gränssnitt

19 September 2008 av Lars VÃ¥ge

En av våra favoriter bland söktjänsterna är den ledande europeiska sökmotorn Exalead. Nu har man kommit med en uppdatering av sin bildsökning som innehåller flera förbättringar. Gränssnittet har blivit betydligt bättre och är kanske det mest genomtänkta av de stora söktjänsternas för bilder. Träffarna presenteras endast som tumnagelsbilder med uppgift om upplösning under. För man musen över bilderna visas en rad praktiska länkar att följa.

Man kan t.ex. spara bilden med ett enda klick vilket tar tre eller fler klick i Google och de andra. Man kan gå direkt till bilden i originalstorlek (två klick i de andra). Man kan gå direkt till sidan med bilden utan att den visas i en egen ram som i Google och Yahoo. En annan bra sak är att om man sätter markören i sökrutan för att skriva något nytt visas möjligheterna till filtrering. I den rutan kan man direkt välja filter efter storlek, orientering, färgtyp, filtyp och innehåll. Vad gäller det sistnämnda är det bara ansikten som kan väljas och där har Microsofts Live Search dessutom möjligheten att välja Huvud och axlar. Men på det hela taget skulle jag säga att Exalead har den bästa bildsökningen av de stora nu om det inte vore för att man får betydligt färre träffar än hos t.ex. Google.

Funktioner från Powerset testas i Windows Live Search

19 September 2008 av Lars Iselid

Windows Live Search har börjat integrera funktioner frÃ¥n Powerset som man köpte 1 juli i Ã¥r. Powerset kallar sig för en semantisk sökmotor och pÃ¥stÃ¥r sig använda “natural language”. Varje gÃ¥ng jag hör detta begrepp osäkrar jag min revolver. Läs gärna Danny Sullivans lÃ¥nga ojande över begreppet Natural Language frÃ¥n 2006.

Danny Sullivan sa följande om Powerset i maj:

“…I beg that you forget you ever heard ‘natural language’ being associated with Powerset. That’s not really describing what they do in comparison to regular search engines”.

Hur som helst sÃ¥ är Powerset’s twist att söka mot Wikipedia och presentera resultat pÃ¥ ett bättre sätt än nuvarande sökmotorer gör. Egentligen är det huvudsakligen tre saker frÃ¥n Powerset som man testar och visar slumpmässigt:

1.När man söker i Live Search Answers får man även träffar från Freebase och ett exempel på hur det kan se ut finns här på Flickr.

2.En mindre ändring, men nog så viktig, är att den beskrivande texten som visas under titeln i sökmotorns träffar från Wikipedia har fräschats upp. Hur texten extraheras från Wikipedia och visas i träfflistan.

3.Man använder nu ocksÃ¥ Powerset’s Factz för relaterade söktermer. Ingen stor innovation precis, men man kan hoppas att den är ännu bättre än andra liknande.

Både funktionen med relaterade söktermer och även att kunna presentera träffar bättre som söker mot faktabaserade webbplatser (som wikipedia och who2) har Ask.com sysslat med på ett förträffligt vis länge. Testa en sökning på James Dean till exempel. Windows Live försöker alltså uppdatera sig och vi får se hur det artar sig ju mer de lägger ut.

EU inte nöjda med Google men det tar sig lite

17 September 2008 av Lars VÃ¥ge

En följetong som vi följt med långa mellanrum är EU:s krav på att Google ska ta bättre vara på sina användares personliga integritet. Det handlar främst om hur länge Google sparar sökmotorloggar med personlig information. I maj förra året påpekade EU:s arbetsgrupp för dataskydd att Google sparade sina loggar 18-24 månader vilket inte var förenligt med EU:s lagstiftning. Google fick också kritik från andra håll och kategoriserades med termerna Comprehensive consumer surveillance & entrenched hostility to privacy av Privacy International i London.

I juni förra året gick Google med på att behålla sökloggarna i bara 18 månader istället för 18-24. Inte så tillmötesgående men i alla fall ett steg på väg tyckte EU:s dåvarande kommissionär för rättsliga och inrikes frågor Franco Frattini. 4 april i år kom EU:s Article 29 Working Party som jobbar med frågor kring dataskydd med en skrivelse (opinion) där man skrev att sex månader var den tid man fick spara sökloggar inom EU. Google svarade att de behövde loggarna för att kunna erbjuda högkvalitativa tjänster.

Nu har Google kommit med ett 20-sidigt officiellt svar på EU:s krav där man skriver att man vill visa att man tycker att frågorna om den personliga integriteten är viktig för sökmotorn. Det yttrar sig på så sätt att man nu halverar den tid man sparar sina sökloggar och fortsättningsvis ska det alltså vara 9 månader. Dessutom har man lagt en länk med texten Privacy på hemsidan (längst ner) som leder till sidor med information om Googles Privacy Policy.

EU:s kommissionär för generaldirektoratet Rättvisa, frihet och säkerhet Jacques Barrot kommenterar Googles svar med orden “a good step in the right direction”. Alex Türk som är ordförande i Article 29 Working Party tycker att det här är början pÃ¥ en dialog och ser ocksÃ¥ positivt pÃ¥ Googles svar. Inte desto mindre pÃ¥pekar han i ett pressmeddelande att EU och Google fortarande har olika synsätt i en rad frÃ¥gor. Ett exempel är att Google anser att europeisk lagstiftning ang. dataskydd inte är tillämplig pÃ¥ Google trots att de har etableringar, personal och servrar pÃ¥ europeisk mark. Ett annat att Google anser IP-adresser vara konfidentiella men inte privata data. Vidare är en halvering till nio mÃ¥nader visserligen bra men det är fortfarande ett halvÃ¥r som ska gälla för sparande av sökloggar inom EU.

Riktigt gamla nyheter i Google News Archive

10 September 2008 av Lars VÃ¥ge

Häromdagen kunde man läsa i Googles officiella blogg att man har börjat digitalisera äldre amerikanska dagstidningar. Redan tidigare har man haft avtal med New York Times och Washington Post som gjort det möjligt att söka långt bak i tiden i de tidningarna i Google News. En del andra avtal finns också med t.ex. Newspaperarchive.com men för den vanlige användaren går det inte att läsa själva artiklarna utan att betala för sig. Därför är det roligt att det material som nu digitaliseras kan läsas gratis. Det nya initiativet kallas News Archive Partner Program och genom att delta i detta kan dasgtidningarna lägga ut äldre material i Google News Archive.

Vad kan man då hitta nu som man inte kunde förut? Jo ett antal mindre kända dagstidningar som t.ex. St. Petersburg Times, Prescott Evening Courier, The Evening Independent och The Coquill Valley Independent. Det låter ju inte så upphetsande men täckningen verkar vara flera decennier så man kan läsa både om Titanics undergång och utbrottet av andra världskriget. Gränssnittet är väldigt tilltalande tycker jag. Det är lätt att förflytta sig mellan sidorna och zooma in och ut. Man får känslan av att sitta och rulla mikrofilm fast på skärmen. Däremot går det inte att skriva ut eller ladda ner sidorna som PDF.

Tyvärr finns ingen lista på vilka dagstidningar som är med i partnerprogrammet. Inte heller går det att söka specifikt på detta innehåll. Det enda man kan göra är att om man råkar på en sådan dagstidning kan man ange den som source i Google News avancerade arkivsökformulär. I de vanliga träfflistorna dyker annars det här materialet upp tillsammans med det övriga och man kan få bläddra igenom ganska många träffsidor innan man hittar ett exempel. När man hittat en artikel kan man sedan bläddra igenom hela tidningsnumret. Ser man då någon annan artikel av intresse kan man lätt länka till den genom att använda funktionen Link to Article och sedan klicka på en rubrik. Listigt.

Exempel:
Hitler sends answer to British message Evening Independent 1939-08-29
Standing on Bridge With Megaphone In Hand Captain Goes Down With His Ship St. Petersburg Daily Times 1912-04-18

Google lanserar sin egen webbläsare Chrome

3 September 2008 av Lars VÃ¥ge

Någon vecka efter att den publika betaversionen av Internet Explorer 8 släppts dyker Googles egna och länge emotsedda webbläsare Google Chrome upp. Tidigare i veckan har information om Chrome dykt upp i form av en tecknad serie men nu går webbläsaren också att ladda ner och installera. Serien är ett roligt grepp men man tröttnar ganska fort på de tekniska beskrivningarna av Open Source-baserade Chrome. Däremot är Chrome ett nöje att installera om man jämför med Internet Explorer 8. Snabbt och lätt, inga omstarter eller installationer av hjälpprogram som Silverlight.

Det kommer att ta tid att utvärdera de två nya webbläsarna och frågan är om Chrome kommer att kunna hota Firefox som IE:s konkurrent nummer ett. I samband med att IE 8 dök upp gjordes det stor affär av att man kunde surfa på nätet tämligen anonymt genom den funktionalitet som Microsoft byggt in för detta. Porrfiltret som det kallades i vissa medier hade också potential att störa Googles affärsmodell eftersom mycket av deras annonsering bygger på data som användarna skickar ovetandes när de använder en webbläsare. Man frågar sig naturligtvis om Microsoft nu tänkte sig att utnyttja IE:s dominans för att försvåra för Google. Då är det ju inte helt ologiskt att Google Chrome poppar upp precis just nu.

Yahoo skippar fullt stöd för boolesk sökning

22 Augusti 2008 av Lars Iselid

Via Pandia läser vi att Greg Notess skriver i nr 4-2008 av Online i sin kolumn “Search Engine Update” att Yahoo skippar sitt stöd för fullt boolesk sökning. Dvs. NOT-operatorn som utesluter ett ord och AND som kombinerar ord funkar inte längre, men AND är fortfarande förval om skriver in mer än ett ord. OR-operatorn finns gudskelov kvar. Att söka med AND eller NOT i parenteser funkar inte tillfredställande. Kom ihÃ¥g att NOT kan ersättas genom att söka med minustecken!

Greg Notess konstaterar att nu är det bara Live search som ger fullt stöd för boolesk sökning. Han syftar förmodligen på de tre stora: Google, Yahoo, MSN Live. Exalead har ju nämligen fullt stöd för boolesk sökning. Yahoo gör en missbedömning tror jag. Även om booleska operatorer inte används i nån större utsträckning enligt deras statistik så kan man ju undra varför stödet inte kan få vara kvar ändå? Särskilt parentes-sökning är viktigt att ha kvar för avancerade sökningar, enligt min mening. Nu ger parentessökningar väldigt förrvirrade svar.

Cuil - ny stor sökmotor lanserad

29 Juli 2008 av Lars VÃ¥ge

cuil.jpg

En ny stor sökmotor kallad Cuil (uttalas cool) lanserades igår. Tre gånger så stor som Google, Yahoo och de andra om man får tro vad Cuil själva säger. Över 120 miljarder webbsidor hävdas det att indexet innehåller. Senast jag såg så höga siffror i jämförelse med andra sökmotorer var i den kortlivade fulltextsökningen av Internet Archive som fanns 2003 under namnet Recall. Ansvarig för Recall-projektet var Anna Patterson från Stanford. Samma Anna hör till grundarna av Cuil i vars team vi också hittar en viss herr Louis Monier. Just det, mannen som skapade Altavista. Både Anna och Louis liksom andra i Cuil-teamet kommer närmast från Google.

OK, vad har storleken för betydelse egentligen i sökmotorerna dÃ¥? Med tanke pÃ¥ att de flesta knappt orkar titta pÃ¥ den första träffsidan med 10 länkar sÃ¥ har det inte sÃ¥ stor betydelse. Det är egentligen bara väldigt specialiserade eller helt enkelt illa formulerade sökningar som genererar sÃ¥ fÃ¥ träffar att det gÃ¥r att jämföra hur mycket man fÃ¥r frÃ¥n sökmotorerna. Hittills har jag inte sett att Cuil skulle ge sÃ¥ mycket fler träffar än de andra. Vad gäller relevansen av träffarna är den sÃ¥där. Här finns arbete att göra för Patterson, Monier och de andra. I pressmeddelandet talar man om “content-based results, not just popular ones, providing different and more insightful answers”. Om man med det menar att man helt skippar länkanalys tror jag man ska tänka om.

Fast visst är det spännande med en ny stor sökmotor. Gränssnittet är också lite roligare än de andra stora med undantag av Ask.com. Istället för en linjär lista med 10 träffar med möjligen en YouTube-video insprängd som i t.ex. Google får vi tre kolumner med träffar. Varje träff presenteras med ett längre textutdrag än vad som är vanligt och många med bilder till. Det gör att färre träffar syns på en gång men å andra sidan ser det trevligare ut. En kuriositet är att bilderna ibland inte kommer från webbsidan ifråga. På en sökning på internetbrus illustrerades en av våra sidor med ett fjärilsmönster!?

Cuils bakgrundsfärg är nattsvart (energisnålt) och andra färger i gränssnittet är blått och grått. Som tur var är bakgrunden till träffpresentationerna vit! Ett par saker står ut. Liksom i Yahoo och Ask får man förslag på sökuttryck samtidigt som man skriver i sökrutan och det är en tidsbesparande funktion. Sedan får man också förslag på mer fokuserade sökningar i form av flikar i träfflistan. När jag sökte på Sundsvall fick jag flikar för Gif Sundsvall, Sundsvall Dragons och Sundsvall Hockey. Inte så illa.

Sedan har vi den intressanta funktionen Explore by Category. Först trodde jag det skulle vara automatgenererade kluster här men det verkar vara någon slags named entity recognition som använts. Det annorlunda är att det inte bara är ett antal igenkända namn på personer, platser eller företeelser från texten. De är indelade i begripliga grupperingar som bebop-pianister, indiska kricketspelare, allsvenska klubbar, komponister för kyrkorgel m.m. och det har jag inte sett förut. Att klicka på något i fönstret Explore by category innebär liksom att använda flikarna en fokusering av sökningen eftersom det man klickar på läggs till det ursprungliga sökuttrycket.

Det finns tyvärr ingen som helst dokumentation av söksyntaxen i Cuil än så länge men det kommer säkert. Cuil sparar förresten ingen information i sökloggar som gör att det går att identifiera vem som har gjort olika sökningar. På det sättet visar man att man är medveten om att det finns krav på större rätt till anonymitet då man använder sökmotorer nu än tidigare, t.ex. inom EU. Vi får se vad som händer med Cuil, om de kan förbättra det som inte är så bra, men det är i alla fall roligt med fler sökmotorval.

Bloggtoppen.se

Blogglista.se

Global Voices Online - The world is talking. Are you listening?

Creeper

Nowhere North

↑ Grab this Headline Animator



iselid info

↑ Grab this Headline Animator