Arkiv för kategorin ‘Nyhetssökning’

Greg Linden avslutar sitt livsverk Findory

24 Januari 2007 av Lars Iselid

Greg Linden meddelade söndag den 14 januari på sin blogg Geeking with Greg att hans livsverk Findory saligen somnat in. För er som kanske undrar vad Findory är så kan vi berätta att det är en nyhetssöktjänst som försöker presentera nyhetssök med hjälp av personalisering.

Jag har följt Gregs blogg under ett par år och även om det är en rätt smal blogg (ur sökhänseende) har den hört till en av mina absoluta favoritbloggar, så det är med visst vemod man läser att Findory nu är ett minne blott. Greg har stora kunskaper inom personalisering bl a genom sitt tidigare arbete på Amazon, men på bloggen har han även kommenterat andra händelser och tekniker inom sökning. Så här låter det på bloggen:

“I built Findory to follow a passion. I built Findory around the idea of applying Amazon.com-style personalization and recommendations to information. Search only helps if you can say what you want. Personalization helps you discover things that you could not have found on your own”.

Men vad ska Greg göra nu istället?

“I am moving on now, not to a new venture, but to spend more time on health and with family”.

Det missunnar vi honom inte. Findory kommer dock att finnas kvar förmodligen under hela 2007 men någon utveckling kommer inte att ske och till sist lär den dö ut. Men jag kommer mer att sakna Gregs blogg än Findory som inte heller lyckats övertyga mig. Det är inte lätt med personalisering för att styra sökning, men Greg har definitivt varit ett språkrör för tekniken:

“Findory has influenced work at Google, Microsoft, AOL, and elsewhere. I am pleased with what Findory has accomplished”.

Både Google, MSN och AOL har viss personalisering i sin nyhetssökning. Vad gäller Gregs blogg verkar den leva än eftersom han redan skrivit flera inlägg sen han tog död på Findory 14 januari. Jag hoppas han fortsätter blogga och prioritera familjen ;-)

Wikio - den franska nyhetssöktjänsten 2.0 pÃ¥ engelska, tyska, spanska, italienska…

16 Januari 2007 av Lars VÃ¥ge

I somras skrev jag om den spännande franska nyhetssöktjänsten Wikio när den lanserades. För ett par veckor sedan kom Wikio för engelskspråkiga källor vilket naturligtvis gör det så mycket intressantare att kika på Wikio Det är mycket Web2.0 över tänket i Wikio och gränssnittet är lättanvänt och snyggt precis som i den lysande RSS-läsaren Netvibes, som är en produkt från samma utvecklare. Jag upprepar här från mitt inlägg om den franska versionen vad det är som gör Wikio så intressant:

  • I Wikio kan man pÃ¥verka rankingen genom att rösta pÃ¥ träffar
  • Man kan skriva kommentarer till träffarna i Wikio
  • I Wikio kan man t.om. skriva egna nyhetsartiklar och fÃ¥ indexerade i söktjänsten
  • Användarna kan lägga upp sina egna personaliserade nyhetssidor
  • Wikio indexerar inte bara professionella nyhetsmedier utan ocksÃ¥ bloggar
  • Artiklar och blogginlägg blir automatkategoriserade med taggar i Wikio
  • RSS-strömmar finns tillgängliga för bÃ¥de taggar och egna sökfrÃ¥gor i Wikio

Dessutom finns nu även Wikio för tyska källor, spanska källor och italienska källor. För de som kan läsa de här språken tror jag säkert att de kan vara mycket intressanta att kolla in. Att den engelskspråkiga Wikio är lika bra eller bättre än Google och Yahoos nyhetssöktjänster tror jag är en realistisk bedömning och framför allt är den mycket roligare. RSS-strömmarna som Wikio genererar för egna sökuttryck fungerar mycket bra kan jag intyga som använt de franskspråkiga i något halvår.

Norska Google News tvingas plocka bort pressbilder

11 December 2006 av Lars VÃ¥ge

I mitten av november lanserades den norska varianten av Google News. Nyhetssöktjänsten indexerar ca 400 källor och är uppbyggd pÃ¥ samma sätt som de övriga sprÃ¥kversionerna med virtuellt renderade rubriker, ingresser och lÃ¥nat bildmaterial. Fast sedan i helgen sÃ¥ finns det inte sÃ¥ mycket bildmaterial kvar pÃ¥ norska Google Nyheter. För de norska tidningarna och branschorganisationer som Pressefotografenes Klubb och Mediebedriftenes Landsforening tyckte inte alls om att Google “lÃ¥nade” deras copyrightade bilder.

Även om många av de norska medierna gärna vill synas i Google Nyheter Norge så menar man att Google åtminstone måste be om lov innan de använder deras bildmaterial. En intensiv debatt synes ha förts bl.a. på den norska facktidskriften Journalistens webbplats. Vissa anser att man inte ska stänga dörren för bildlånen, medan andra menar att det vore en slapp hållning och någon påpekar att om man vill slippa detta kan man spärra Googles spindel genom att använda Robots exclusion protocol. Med det sistnämnda kan man förbjuda sökmotorindexering av vissa kataloger eller filer via filen robots.txt i webbserverns rotkatalog.

Hur som helst så meddelade den norska journalistorganisationen Norsk Journalistlag i fredags på sin webbplats att nu har det mesta bildmaterialet plockats bort. Tydligen är det bara bilder från TV2 Nettavisen (som inte är medlem i Mediebedriftenes Landsforening) och några mindre självständiga webbplatser som nu finns kvar i norska Google Nyheter. Flera norska fotografer hade beklagat sig över Googles lån och branschorganisationerna agerade genom att ställa krav på att Google skulle ta bort medlemstidningarnas bilder.

Svenska Google News är här

17 November 2006 av Lars VÃ¥ge

Igår blev en svensk version av Googles nyhetssökjtänst kallad Google Nyheter tillgänglig och kan nu nås direkt på adressen news.google.se. Som andra versioner av Google News är nyhetssökningen begränsad till ett språk vilket kan vara en nackdel för somliga eller en fördel för andra. Det är också så att Google News på svenska fungerar som en nyhetsaggregator och inte bara erbjuder sökning. Det är aggregeringen av texter som är upphovsrättsskyddade som resulterat i en hel del kritik mot Google News t.ex. från franska nyhetsbyrån AFP och nyligen i Belgien.

Google News teknik bygger pÃ¥ att man bland ett stort antal artiklar kan urskilja vilka som är olika representationer av samma “story”. Dessa samlas i ett kluster som utgör en “nyhet” som ges en samlingsrubrik och en ingress som visas pÃ¥ startsidan av Google News. Det är den sistnämnda som skapas genom s.k. automatisk textsammanfattning som använder text som finns i originalartiklar som har kritiserats mest.

NÃ¥gra snabba reflexioner:

  • Att det bara ingÃ¥r runt 100 nyhetskällor att jämföras med Eniros nyhetssök som indexerar runt 700
  • Man har stöd för att spara sökningar som RSS-strömmar vilket tyvärr saknas i Eniros nyhetssök
  • Yahoo News har ocksÃ¥ mycket fler svenska källor och RSS men när man ska spara en sökning som RSS i Yahoo News funkar det inte med svenska tecken, vilket jag konstaterat att det gör i Google
  • Inga svenska bloggar är indexerade vad jag kan se vilket finns i Eniros nyhetssök
  • Det gÃ¥r att söka med svenska bokstäver :-) även om Hjälp-sidan när jag läste den saknade Ã¥,ä och ö :-(
  • “Sortera efter betydelse” är ett alternativ i träfflistan. Varför krÃ¥ngla till det sÃ¥ - det heter ju relevans som pÃ¥ engelska. Vad är det för betydelse man menar kan nog användarna frÃ¥ga sig
  • Google Nyheter konkurrerar med nyhetsportaler pÃ¥ ett helt annat sätt än de andra svenska nyhetssöktjänsterna eftersom de senare inte använder tekniker för att automatiskt rendera “virtuella” rubriker och ingresser

Eniros nyhetssök är än så länge det klart bästa alternativet för sökning av svenska nyheter på webben tycker jag. Men man måste lägga till möjligheten att spara sökningar som RSS. Newsdesks fria sökning av svenska pressmeddelanden är bäst på den typen av sökning och har också RSS numera. Yahoo News är fortfarande det bästa alternativet bland de internationella söktjänsterna när det gäller att söka på svenska nyheter. Google Nyheter kommer naturligtvis att bli jättepopulär bara för att det är en produkt från Google men man ska ha klart för sig att det finns ju bättre alternativ.

Nyhetr.se söker nyheter via Google med Google co-op

11 November 2006 av Lars Iselid

Svenska nyhetssöktjänsten Frisim har skapat en egen anpassad sökmotor med Google co-op som de kallar Nyhetr.se. Kul initiativ! Jag har just sett Johan Elmander på egen hand dänga in 3-1 för Toulouse mot Sedan. En sökning på Elmander i Nyhetr.se ger inga nyheter om detta. Jag testar Frisim och hittar inget om detta heller. Klustringen av nyheter är inte 100% heller. Jag provar Eniro nyhetssök. Bingo! En nyhet från Kvällsposten kommenterar målet av Elmander:

Anfallaren låg bakom Tououses första mål, och såg sedan till att ge laget ledningen i början av den andra halvleken.
3-1, som definitivt avgjorde matchen, var ett riktigt klassmål.
Trots hård uppvaktning sprang han ifrån Sedan-försvaret och pricksköt in bollen i mål.

Grattis Eniro!

Martin Jönsson och Frisim om nyhetsaggregering

11 Oktober 2006 av Lars Iselid

Via alltid lika pigga nyhetssöktjänsten Frisim läser jag Martin Jönssons inlägg på sin blogg på SvD där han säger:

Hittills har det inte gjorts något storskaligt försök med nyhetsaggregering i Sverige.

Frisim, genom Clas?, kommenterar:

Vad han menar med storskaligt vet jag ju inte, men Eniro/nyhetssok använder ett större nyhetsarkiv än Sesam.

Syftar Martin mer på nyhetstjänster som strukturer nyhetsrubriker eller även nyhetssöktjänster som erbjuder sök i första hand? Syftar han bara på fria nyhetssöktjänster? Vi har ju båda betalnyhetstjänsterna Presstext och Mediearkivet? Mediearkivet kommer också tids nog på ett eller annat sätt att kopplas till Sesam nyhetssök, enligt Schibsted söks Mikal Rohde.

Mediearkivet har dessutom tillgÃ¥ng till fulltexten av tryckta utgÃ¥van av t ex Göteborgsposten. Inte den fria webbutgÃ¥van. Man mÃ¥ste göra en tydlig distinktion mellan nyheterna publicerade pÃ¥ webben och vad som finns i den tryckta utgÃ¥van. SÃ¥ länge den tryckta utgÃ¥van ligger gömd i “dyra” betaldatabaser kommer de fria webbpublicerade nyheterna att vara den dominerande informationsinhämtningen för nyhetssugna surfare.

Jag tycker det här ett exempel på hur betaldatabaser med bra innehåll glöms bort för att de inte finns fria på Nätet. Vad är det för mening att biblioteken betalar en massa pengar för Mediearkivet och Nationalencyklopedin om de flesta skattebetalarna (som finansierar bibliotekens medieanslag) söker fritt i t ex Eniro nyhetssök respektive Wikipedia istället?

Äntligen sökbevakningar som RSS hos Newsdesk

10 Oktober 2006 av Lars VÃ¥ge

Newsdesk har länge varit mitt förstaval för att söka svensk pressinformation. Lättanvänt gränssnitt och mycket god täckning. Enda smolken i bägaren har varit att sökbevakningar har levererats som e-post. Med sökbevakningar menar jag att man skriver in ett sökuttryck och sedan blir meddelad så fort det dyker upp något nytt i indexet som svarar mot sökuttrycket. Sådant har funnits väldigt länge i biblioteksbranschen och kallats SDI-profiler eller selective dissemination of information. Hur som helst så har ju e-post alerts varit ganska stort ett par år men i och med all spam har e-post mest blivit något av en plåga.

Med RSS har mycket av denna problematik lösts även om det inte är så många söktjänster som erbjuder sökprofiler som RSS än så länge, men det blir fler hela tiden. Yahoo! News har haft det länge och numera har även Google News liksom många bloggsöktjänster. När nu Newsdesk introducerar detta är det en stor och efterlängtad förbättring tycker jag. Det är vad jag kan se endast i delen Sök pressinformation som man kan Prenumerera på din sökning som RSS som länktexten heter. Det är också bara den delen som är öppen för alla användare. Sök i medier är till för registrerade användare som journalister och inbjudna bloggare och där hittar jag inget RSS-stöd än.

Det bästa vore naturligtvis om det fanns en gratis svensk nyhetssöktjänst med RSS-stöd. Det gör det i och för sig eftersom Frisim.com har RSS-stöd men antalet källor är lite för begränsat, åtminstone för mig. Tänk vilka kraftfulla svenska nyhetsbevakningar man skulle kunna göra om Eniros nyhetssök började med RSS för användardefinierade sökuttryck. Eller för den delen om Frisim indexerade fler källor.

Google News i blåsväder i Belgien

20 September 2006 av Lars VÃ¥ge

I början av veckan rapporterade nyhetsbyråerna DPA och Reuters om ett domstolsutslag i Belgien som var riktat mot Google News belgiska version. Uppenbarligen har Google beordrats av domstolen att ta bort artikelsammanfattningar gjorda med citat från franskspråkiga dagstidningar i Belgien. Klagomålet hade riktats genom organisationen Copiepress som hanterar copyright för franskspråkig press i landet. Domen som föll den 5 september blev inte känd förrän i fredags för Google. Enligt denna hade Google fått till på måndag i denna veckan på sig att ta bort länkar och sammanfattningar till det aktuella medieinnehållet. Enligt DPA hade de på måndagen tagit bort ur indexet artiklar från tidningarna Le Soir och Grenzecho.

Google menar att de alltid tar bort material ur sitt index på begäran från copyrightinnehavaren om denne så önskar. Att därför driva frågan till domstol menar man var onödigt och bara kostade onödiga pengar för parterna. Klagomålet rörde att Google för annonser och det var fel att de aktuella tidningarnas texter hjälpte Google att göra pengar på dessa annonser. Nu för faktiskt inte Google News några annonser själva. Däremot hamnar ibland länkrubriker till nyhetsartiklar i Googles vanliga träfflistor om det finns nyhetsartikelträffar som svarar mot de använda sökorden.

Enligt Reuters artikel hade rätten åberopat ett expertvittne vid namn Luc Golvers som är datakonsult. Golvers hade sagt att Google News måste betraktas som en informationsportal snarare än en sökmotor. Jag tycker ju att det är både och. Golvers hade också anfört att Google hade cachade versioner av artiklar som plockats bort från webbplatserna ifråga. Det kan möjligen stämma om vanliga Google men Google News har för sin del inga cachade kopior. Sålunda kan tanken att Google News förhindrade för utgivarna av tidningarna att själva tjäna pengar på annonser på sina egna webbplatser inte sägas vara riktig. Det skulle möjligen kunna sägas om Googles vanliga webbsökning men de presenterar ju bara rubriker inga sammanfattningar.

Tidigare har Google blivit osams med den franska nyhetsbyrån Agence France Press och är involverade i en liknande rättsprocess med dem. För flera år sedan var frågan om en nyhetssökmotor som använde tidningstexter och rubriker uppe i Danmark och den gången förlorade nyhetssökmotorn. I andra fall i Tyskland och Holland har webbplatser som länkat till copyrightat material gått fria. Kampen mellan nyhetsmedia och sökmotorerna går vidare. Personligen tror jag att sökmotorerna i själva verket mest driver traffik till webbplatser med nyhetsinnehåll. Blir folk intresserade av en nyhetsrubrik i Googles träfflistor är det väl mycket troligare att de följer länken till webbplatsen ifråga snarare än att få för sig att klicka på en annons på träffsidan.

Google har idag överklagat att den belgiska domstolen beordrat att de skulle lägga ut en kopia av domstolsutslaget på Google News Belgique.

Updatering:
Google kommenterar händelsen i Belgien på sin blogg.

Google News Archive Search - ny sökning med gamla nyheter

6 September 2006 av Lars VÃ¥ge

Äntligen en nyhet pÃ¥ sökfronten frÃ¥n Google! Det är nyhetssökningen Google News som idag fÃ¥tt en ny komponent som kallas Google News Archive Search. Tidigare har man med Google News kunnat söka efter artiklar publicerade den seanste mÃ¥naden men nu finns material sökbart som i vissa fall är över 100 Ã¥r gammalt. Utvecklaren Anurag Acharya säger till Reuters att: “The goal of the service is to allow users to explore history as it unfolded”.

För att skapa denna nya sökning har man bl.a. samarbetat med större databasproducenter som Factiva, LexisNexis och HighBeam. Amerikanska media som New York Times, Washington Post, Time Magazine och Wall Street Journal är naturligtvis med men även brittiska som The Guardian. I indexet finns både artiklar som är gratis och sådana som man bara kan läsa ett utdrag av. Vill man läsa hela artikeln i de fallen måste man alltså betala till innehållsleverantören. Ofta är priset för dessa artiklar angivet direkt i träfflistan. Bra är att träffarna liksom i vanliga Google News är grupperade eller klustrade som de initierade söger. I arkivsökningen får man kluster baserade på tidsintervall och för enskilda publikationer.

Det finns ett enkelt och ett avancerat sökformulär för News Archive Search. Kikar man pÃ¥ det avancerade sökformuläret finner man faktiskt att svenska hör till de sprÃ¥k som finns att välja. Gör man det och skriver in ett sökord som “och” fÃ¥r man upp intressanta resultat. Här finns t.ex. artiklar publicerade i den svensksprÃ¥kiga tidningen Barometern i Sioux City, Iowa pÃ¥ 1880-talet. Det var ju inte sÃ¥ tokigt men tittar man pÃ¥ träfflistan för 1990-talet hittar man t.ex. rubriken “Britney Spears om nya turnén och livet som världsartist” frÃ¥n Aftonbladet med datumet Dec 2, 1981. Hur gammal är Britney egentligen!? Liknande felaktiga dateringar finns det gott om som t.ex. artiklar om Anja Pärsson som uppges vara frÃ¥n tidigt Ã¥ttiotal.

Trots dessa tabbar tycker jag att det är en spännande utveckling och att Google News Archive Search kan vara ett intressant alternativ för de som inte har tillgång till några liknande sökmöjligheter t.ex. via ett universitetsbibliotek. Söktjänsten kommer säkert att utvecklas och bli bättre. Det är också bra att Google på detta sätt arbetar med traditionella media istället för att råka i konflikt som t.ex. med franska nyhetsbyrån AFP.

MÃ¥nga nyheter hos Topix.net

8 Augusti 2006 av Lars VÃ¥ge

Topix.net har utvecklats till att bli en av de allra viktigaste självständiga nyhetssöktjänsterna och blir allt bättre. Igår lanserades ett par viktiga förbättringar inför ett framträdande idag på Search Engine Strategies-konferensen i San José. Först och främst har man utökat sitt index till att innehålla ett arkiv på inte bara en månad utan ett helt år. Det är en stor fördel att ha tillgång till ett helt år även om vissa av nyhetsartiklarna inte längre finns tillgängliga gratis.

Den andra förbättringen är att man får ett slags histogram över frekvensen av träffar under det senaste året. Detta kallar man ett click-o-gram eftersom det är interaktivt och man kan klicka på en tidpunkt och få träffar från denna och bakåt. Mycket bra funktion och det enda liknande jag sett är histogrammen i bloggsöktjänsten Blogpulse men de är inte klickbara. Den tredje nyheten är att sökningen har gjorts känslig för stora och små bokstäver sk. case-sensitive searching. Ingen av de större sökmotorerna stöder denna sökform idag, men på 90-talet fanns det flera. Att kunna skilja bush och Bush kan ju vara av värde menar utvecklarna så nu har man denna möjlighet i Topix.

I slutet av juni lanserade f.ö. Topix nÃ¥gra andra förändringar som vi inte rapporterat om. Som bekant har Topix egna nyhetssidor för en mängd amerikanska städer. Nu finns ocksÃ¥ local news för ca 5000 “internationella” städer i 171 länder. Det är visserligen bara engelsksprÃ¥kigt material sÃ¥ artiklarna kanske känns relevantare för beökaren än för den som bor där i en hel del fall. I alla fall indexerar man nu en mycket större mängd internationella nyhetskällor och utvalda bloggar.

Bloggtoppen.se

Blogglista.se

Global Voices Online - The world is talking. Are you listening?

Creeper

Nowhere North

↑ Grab this Headline Animator



iselid info

↑ Grab this Headline Animator