Arkiv för kategorin ‘Internetsöktjänster’

Riktigt gamla nyheter i Google News Archive

10 September 2008 av Lars VÃ¥ge

Häromdagen kunde man läsa i Googles officiella blogg att man har börjat digitalisera äldre amerikanska dagstidningar. Redan tidigare har man haft avtal med New York Times och Washington Post som gjort det möjligt att söka långt bak i tiden i de tidningarna i Google News. En del andra avtal finns också med t.ex. Newspaperarchive.com men för den vanlige användaren går det inte att läsa själva artiklarna utan att betala för sig. Därför är det roligt att det material som nu digitaliseras kan läsas gratis. Det nya initiativet kallas News Archive Partner Program och genom att delta i detta kan dasgtidningarna lägga ut äldre material i Google News Archive.

Vad kan man då hitta nu som man inte kunde förut? Jo ett antal mindre kända dagstidningar som t.ex. St. Petersburg Times, Prescott Evening Courier, The Evening Independent och The Coquill Valley Independent. Det låter ju inte så upphetsande men täckningen verkar vara flera decennier så man kan läsa både om Titanics undergång och utbrottet av andra världskriget. Gränssnittet är väldigt tilltalande tycker jag. Det är lätt att förflytta sig mellan sidorna och zooma in och ut. Man får känslan av att sitta och rulla mikrofilm fast på skärmen. Däremot går det inte att skriva ut eller ladda ner sidorna som PDF.

Tyvärr finns ingen lista på vilka dagstidningar som är med i partnerprogrammet. Inte heller går det att söka specifikt på detta innehåll. Det enda man kan göra är att om man råkar på en sådan dagstidning kan man ange den som source i Google News avancerade arkivsökformulär. I de vanliga träfflistorna dyker annars det här materialet upp tillsammans med det övriga och man kan få bläddra igenom ganska många träffsidor innan man hittar ett exempel. När man hittat en artikel kan man sedan bläddra igenom hela tidningsnumret. Ser man då någon annan artikel av intresse kan man lätt länka till den genom att använda funktionen Link to Article och sedan klicka på en rubrik. Listigt.

Exempel:
Hitler sends answer to British message Evening Independent 1939-08-29
Standing on Bridge With Megaphone In Hand Captain Goes Down With His Ship St. Petersburg Daily Times 1912-04-18

Google lanserar sin egen webbläsare Chrome

3 September 2008 av Lars VÃ¥ge

Någon vecka efter att den publika betaversionen av Internet Explorer 8 släppts dyker Googles egna och länge emotsedda webbläsare Google Chrome upp. Tidigare i veckan har information om Chrome dykt upp i form av en tecknad serie men nu går webbläsaren också att ladda ner och installera. Serien är ett roligt grepp men man tröttnar ganska fort på de tekniska beskrivningarna av Open Source-baserade Chrome. Däremot är Chrome ett nöje att installera om man jämför med Internet Explorer 8. Snabbt och lätt, inga omstarter eller installationer av hjälpprogram som Silverlight.

Det kommer att ta tid att utvärdera de två nya webbläsarna och frågan är om Chrome kommer att kunna hota Firefox som IE:s konkurrent nummer ett. I samband med att IE 8 dök upp gjordes det stor affär av att man kunde surfa på nätet tämligen anonymt genom den funktionalitet som Microsoft byggt in för detta. Porrfiltret som det kallades i vissa medier hade också potential att störa Googles affärsmodell eftersom mycket av deras annonsering bygger på data som användarna skickar ovetandes när de använder en webbläsare. Man frågar sig naturligtvis om Microsoft nu tänkte sig att utnyttja IE:s dominans för att försvåra för Google. Då är det ju inte helt ologiskt att Google Chrome poppar upp precis just nu.

Yahoo skippar fullt stöd för boolesk sökning

22 Augusti 2008 av Lars Iselid

Via Pandia läser vi att Greg Notess skriver i nr 4-2008 av Online i sin kolumn “Search Engine Update” att Yahoo skippar sitt stöd för fullt boolesk sökning. Dvs. NOT-operatorn som utesluter ett ord och AND som kombinerar ord funkar inte längre, men AND är fortfarande förval om skriver in mer än ett ord. OR-operatorn finns gudskelov kvar. Att söka med AND eller NOT i parenteser funkar inte tillfredställande. Kom ihÃ¥g att NOT kan ersättas genom att söka med minustecken!

Greg Notess konstaterar att nu är det bara Live search som ger fullt stöd för boolesk sökning. Han syftar förmodligen på de tre stora: Google, Yahoo, MSN Live. Exalead har ju nämligen fullt stöd för boolesk sökning. Yahoo gör en missbedömning tror jag. Även om booleska operatorer inte används i nån större utsträckning enligt deras statistik så kan man ju undra varför stödet inte kan få vara kvar ändå? Särskilt parentes-sökning är viktigt att ha kvar för avancerade sökningar, enligt min mening. Nu ger parentessökningar väldigt förrvirrade svar.

Cuil - ny stor sökmotor lanserad

29 Juli 2008 av Lars VÃ¥ge

cuil.jpg

En ny stor sökmotor kallad Cuil (uttalas cool) lanserades igår. Tre gånger så stor som Google, Yahoo och de andra om man får tro vad Cuil själva säger. Över 120 miljarder webbsidor hävdas det att indexet innehåller. Senast jag såg så höga siffror i jämförelse med andra sökmotorer var i den kortlivade fulltextsökningen av Internet Archive som fanns 2003 under namnet Recall. Ansvarig för Recall-projektet var Anna Patterson från Stanford. Samma Anna hör till grundarna av Cuil i vars team vi också hittar en viss herr Louis Monier. Just det, mannen som skapade Altavista. Både Anna och Louis liksom andra i Cuil-teamet kommer närmast från Google.

OK, vad har storleken för betydelse egentligen i sökmotorerna dÃ¥? Med tanke pÃ¥ att de flesta knappt orkar titta pÃ¥ den första träffsidan med 10 länkar sÃ¥ har det inte sÃ¥ stor betydelse. Det är egentligen bara väldigt specialiserade eller helt enkelt illa formulerade sökningar som genererar sÃ¥ fÃ¥ träffar att det gÃ¥r att jämföra hur mycket man fÃ¥r frÃ¥n sökmotorerna. Hittills har jag inte sett att Cuil skulle ge sÃ¥ mycket fler träffar än de andra. Vad gäller relevansen av träffarna är den sÃ¥där. Här finns arbete att göra för Patterson, Monier och de andra. I pressmeddelandet talar man om “content-based results, not just popular ones, providing different and more insightful answers”. Om man med det menar att man helt skippar länkanalys tror jag man ska tänka om.

Fast visst är det spännande med en ny stor sökmotor. Gränssnittet är också lite roligare än de andra stora med undantag av Ask.com. Istället för en linjär lista med 10 träffar med möjligen en YouTube-video insprängd som i t.ex. Google får vi tre kolumner med träffar. Varje träff presenteras med ett längre textutdrag än vad som är vanligt och många med bilder till. Det gör att färre träffar syns på en gång men å andra sidan ser det trevligare ut. En kuriositet är att bilderna ibland inte kommer från webbsidan ifråga. På en sökning på internetbrus illustrerades en av våra sidor med ett fjärilsmönster!?

Cuils bakgrundsfärg är nattsvart (energisnålt) och andra färger i gränssnittet är blått och grått. Som tur var är bakgrunden till träffpresentationerna vit! Ett par saker står ut. Liksom i Yahoo och Ask får man förslag på sökuttryck samtidigt som man skriver i sökrutan och det är en tidsbesparande funktion. Sedan får man också förslag på mer fokuserade sökningar i form av flikar i träfflistan. När jag sökte på Sundsvall fick jag flikar för Gif Sundsvall, Sundsvall Dragons och Sundsvall Hockey. Inte så illa.

Sedan har vi den intressanta funktionen Explore by Category. Först trodde jag det skulle vara automatgenererade kluster här men det verkar vara någon slags named entity recognition som använts. Det annorlunda är att det inte bara är ett antal igenkända namn på personer, platser eller företeelser från texten. De är indelade i begripliga grupperingar som bebop-pianister, indiska kricketspelare, allsvenska klubbar, komponister för kyrkorgel m.m. och det har jag inte sett förut. Att klicka på något i fönstret Explore by category innebär liksom att använda flikarna en fokusering av sökningen eftersom det man klickar på läggs till det ursprungliga sökuttrycket.

Det finns tyvärr ingen som helst dokumentation av söksyntaxen i Cuil än så länge men det kommer säkert. Cuil sparar förresten ingen information i sökloggar som gör att det går att identifiera vem som har gjort olika sökningar. På det sättet visar man att man är medveten om att det finns krav på större rätt till anonymitet då man använder sökmotorer nu än tidigare, t.ex. inom EU. Vi får se vad som händer med Cuil, om de kan förbättra det som inte är så bra, men det är i alla fall roligt med fler sökmotorval.

Spionbugg i Eniros mobilsök upptäckt av Computer Sweden

15 Juli 2008 av Lars Iselid

Computer Sweden avslöjade igÃ¥r att man upptäckt en allvarlig spionbugg i Eniros mobilsök. Förra veckan lanserade Eniro en mobil postioneringstjänst kallad “Sök nära dig” som gör att du kan söka efter affärer och restauranger där du befinner dig. Computer Sweden upptäckte att det gick att slÃ¥ in andras mobilnummer och se var denna mobilen befann sig. En allvarlig bugg som inte ger nÃ¥got större förtroende för Eniro, men det är ändÃ¥ kul att de satsar pÃ¥ mobil sökning. Tjänsten är för tillfället stängd och tur är väl det.

Förra veckan lanserade Eniro även en iPhone-anpassning för att som de skriver:

“…bättre nyttja iPhones stora skärm och grafiska presentationsmöjligheter.

Jag tillhör fortfarande de (o)lyckliga? som inte har en iPhone, men i Umeå behagar man till och med att köa långt i förväg när Telia gjorde sitt iPhone-släpp.

BOSS - bygg din egen söktjänst med Yahoo

12 Juli 2008 av Lars VÃ¥ge

Att kunna bygga egna specialiserade söktjänster genom att välja ut speciella källor som man söker mot är inget nytt. Google Co-op har funnits ett par år och sociala söktjänster och swickitjänster som Eurekster och Rollyo likaså. Nu ger Yahoo tillgång till ett programmeringsgränssnitt kallat BOSS (Build your own search engine) med vilket man ska kunna göra samma saker och mer därtill. I utvecklarbloggen skriver BOSS-teamet att eftersom det idag är i princip omöjligt att slå sig in på sökmotormarkanden så vill man erbjuda ett alternativ. Med BOSS-API:n ska det vara möjligt att göra många intressanta lösningar och man pekar på några tidiga exempel i form av Hakia och Cluuz. Mer information om BOSS finns bl.a. på sidorna Yahoo! Search BOSS och BOSS Mashup Framework, och i utvecklaren Vik Singhs blogg: BOSS - an insider view.

Eniro inte först ut med mobilsök i Sverige

2 Juli 2008 av Lars Iselid

Eniro.se lanserar idag mobilsök och hävdar i sitt pressmeddelande:

“Mobil.eniro.se blir först ut i Sverige med att lansera en söktjänst för mobila Internetsajter”.

Hmm, ni glömde bort att Sesam har svenskt mobilsök (och då menar jag mobilt sökindex): mobil.sesam.se. Eniro har samma startrutor med Vad/Vem/Nummer respektive Var(adress el. ort) i mobilsök som i webbsökningen. En sökning i första rutan på t.ex. Zlatan ger både träffar i ett index över enbart mobila webbsidor och träffar i Personer och Köp och sälj. Även Kartor, Vägbeskrivning och Gula sidorna är sökbara. Väljer man att klicka direkt på länken Sök moblit internet kommer man direkt till mobilindexet. Där kan man välja att begränsa sin sökning via Ämne, Hur, För vem, När eller klicka på detaljsök och skriva/trycka in ord.

Om vi jämför Eniros mobila index med Sesams då? En sökning på Zlatan ger 18 träffar i Sesam men bara 2 träffar i Eniro. Även om några träffar i Sesam är irrelevanta så får man fler mobila webbsidor. En sökning på Öland ger 16 träffar i Sesam och ingen träff i Eniro. Sesam ger mer info men viss irrelevans och som vi skrivit tidigare hade Sesam problem även med spam och porr på den norska varianten. Eniro ger dock 0 träffar på flera sökningar jag testar där Sesam ofta ger ett antal träffar åtminstone.

Sesam och Eniro har alltså enbart mobilanpassade webbsidor i sina index och har inget webbindex som Google mobilsök har, där dom konverterar webbsidor till mer mobilanpassade sidor. Kul att att få tillgång till Eniros söktjänster via mobilen, men jag sedan länge vant mig vid Hitta.se på mobilen.

Google och Yahoo lär sig indexera Flash

1 Juli 2008 av Lars Iselid

Google meddelar att de precis har lanserat en ny algoritm för indexering av Flash. På Google Webmaster Blog beskriver de mer ingående tillvägagångssättet. De har riktat in sig på alla sorters SWF-filer och olika flash-element som knappar, menyer, banners etc. Även länkar i flash-filer samlas in och ställs i kö för att bli spindlade. Fast de lägger in en passus:

“…may now be better able to discover and crawl more of your website”.

Vilket jag tolkar som att de inte alltid lyckas med indexeringen. Sedan är de tydliga med att förklara att det bara är text i själva flash-filen som indexeras, inte om det bara är bilder med text i flash-filen. Vill man inte att Google ska indexera text från flash-filen, t.ex. text om upphovsrätt, så rekommenderas att man helt enkelt lägger det i en bild i själva flash-filen.

Dessutom bryr de sig inte om länktexten, vilket ju är ett viktigt rankingkriterium i Googles vanligtvis. Detta med tanke på det utbredda fenomenet Googlebombning. De bryr sig inte heller om FLV-filer som t.ex. YouTube använder.

Hur gÃ¥r det dÃ¥ till när Google spindlar en flash-fil? Tja, det är naturligtvis en hemlighet hur det gÃ¥r till i detalj men algoritmen har kunnat förbättrats genom att använda Adobe’s nya Searchable SWF library. Där kan man läsa att Adobe samarbetar bÃ¥de med Yahoo och Google men pÃ¥ Yahoos blog finns inget mer nämnt frÃ¥n deras sida i skrivande stund.

Det finns tre huvudsakliga tekniska begränsingar i Googles spindling av flash just nu:

1. Vissar typer av javascript. Om Flash-filen laddas av ett javascript kan Google ha problem.

2. Innehåll från externa resurser som laddas av flash-filer. T.ex. om flash-filen laddar en HTML-fil, XML-fil, SWF-fil etc. Google kommer att indexera dessa resurser separat och räknas inte just nu som en del av innehållet i din flash-fil.

3. Google har stöd för de flesta av världens språk men än så länge finns inte stöd för t.ex. arabaiska och hebreiska, men det kommer.

Innebär då detta att vi kan slå alla flash-kritiker på fingrarna? Nej, inte i mina ögon, men det är en klar förbättring för de som redan lagt ut en massa pengar på att anlita en dyr flashreklamwebbyrå.

Hörde pÃ¥ en podcastintervju när jag cyklade till jobbet med Ianus Keller gjord av Nicole Simon pÃ¥ Cruel to be kind. Hon säger:”I hate flash. Because it restricts me in so many ways…” (About 14:30 of 47:23). Vill du höra mer av hennes argument och Iannus svar är det bara att lyssna frÃ¥n ca 13:00 och framÃ¥t ett antal minuter.

Googles sponsrade länkar på Yahoo

16 Juni 2008 av Lars Iselid

Yahoo har tecknat ett avtal med Google om att visa Google AdWords, dvs. deras sponsrade länkar, på Yahoos sajter i USA och Kanada, enligt pressmeddelande från Google 12 juni och pressmeddelande från Yahoo 12 juni. Intressant särskilt med tanke på att Microsoft så envetet försökt köpa upp Yahoo.

I Googles pressmeddelande säger man:

“Yahoo can use Google’s advertising technology on as many or as few of its search results and content pages as it chooses”.

I Yahoos pressmeddelande skriver man följande om MSN och Yahoo Messenger:

Yahoo! and Google agreed to enable interoperability between their respective instant messaging services.

I avtalet finns också ett förbehåll om att båda parter har rätt att säga upp avtalet om ägarförhållandena hos någon av parterna ändras. Yahoo måste betala en avgift om avtalet sägs upp. Intressant. Mera pengar för Microsoft att ev. betala om de till slut sväljer Yahoo. Enligt BBC skulle avtalet ge Yahoo inkomster på 800 miljoner dollar varje år. Avtalet löper i första hand på tre år, men kan fortsätta i upp till tio år om Yahoo väljer att fortsätta.

Ask ger upp och satsar på gifta kvinnor(!) och Yahoo trängs ihop alltmer mellan Microsoft och Google.

Över 33 städer med vinklade flygfoton i Eniro

3 Juni 2008 av Lars Iselid

Eniros flygfoton i 45 graders vinkel finns har nu ökats på från 13 städer till över 33 svenska städer. Däribland min hemstad Skellefteå. Tyvärr har man inte direkt färska bilder och Skellefteå Kraft Arena är enligt Eniro fortfarande en byggarbetsplats:

Skellefteå Kraft Arena

Skellefteå Kraft Arena invigdes 12 januari 2008.

Andra städer som tillkommit är bl a Skövde, Karlskrona, Örnsköldsvik, Uddevalla.

Bloggtoppen.se

Blogglista.se

Global Voices Online - The world is talking. Are you listening?

Creeper

Nowhere North

↑ Grab this Headline Animator



iselid info

↑ Grab this Headline Animator