Arkiv för Juni 2007

Twingly på Computer Sweden och andra IDG-tidningar

28 Juni 2007 av Lars Iselid

Vi har tidigare skrivit om tjänsten Twingly som visar länkar till blogginlägg som kommenterat en viss artikel i tidning. Nu har Computer Sweden och andra svenska IDG-tidningar hoppat på Twingly. Tjänsten knyter ihop bloggarna med tidningssfären på ett utmärkt sätt genom att länka till varandra och därigenom också styra trafik (och eventuell PageRank) mellan varandra.

Förutom Twingly finns nu också länkar till både Del.icio.us och Hypa.se (en svensk Digg-variant som ägs av IDG).

EU vill syna fler sökmotorer än Google

26 Juni 2007 av Lars VÃ¥ge

Nyligen skrev vi om hur EU:s arbetsgrupp för dataskydd hade skickat ett brev till Google där man bl.a. önskade att sökmotorloggar och cookies skulle sparas under kortare tid än vad de gör. Google svarade att man skulle korta tiden tills man anonymiserade sökloggarna till arton månader. Dessutom skulle man försöka komma på en bättre teknik för cookiehanteringen så att dessa inte hade så lång livslängd som nu (trettio år).

Den 19-20 juni hade EU-gruppen som heter Article 29 Working Party ett av sina sammanträden. I pressmeddelandet som sammanfattar vad som sades under de två dagarna finns en rubrik för Search Engines. I texten står det att läsa att man inom de kommande veckorna noga ska gå igenom det svar som Google skickat men även titta på andra sökmotorers policy i de här frågorna.

Taking into account the current situation initiated by the “Google case”, the Working Party will deal with search engines in general, and scrutinize their activities from a data protection point of view, because this issue affects an ever growing number of users.

Man skriver ocksÃ¥ att det är gruppens önskan att följa och implementera den Resolution on Privacy Protection and Search Engines som antogs vid International Data Protection and Privacy Commissioners’ Conference i London i november förra Ã¥ret. I denna har tre rekommendationer formulerats:

  1. Söktjänster ska informera på ett tydligt och transparent sätt om hur data behandlas i samband med användande av tjänsten.
  2. Söktjänster ska inte spara någon information som kan länkas till användaren av söktjänsten. Efter en avslutad söksession ska alla data om denna raderas om inte användaren själv har givit sitt godkännande att dessa data kan sparas för att användas vid framtida sökningar.
  3. Söktjänster bör sträva efter att minimera de data de sparar. Detta gör det också enklare att hantera krav från tredje part om att utelämna sådana data. (Tredje part kan t.ex. vara fysiska personer, rättsliga instanser och myndigheter)

Det mest uppenbara här är naturligtvis att de flesta söktjänster inte alls följer den andra punkten. Det är också för det mesta si och så med punkt ett. Vi får se vad Article 29 Working Party tänker sig kunna göra åt den saken.

Blinkx + RealPlayer = genombrott för videosökning med automatisk taligenkänning?

25 Juni 2007 av Lars VÃ¥ge

Idag tillkännagavs att video- och ljudsöktjänsten Blinkx ska inleda ett samarbete med RealNetworks. I nästa version av den välkända mediespelaren RealPlayer ska en sökruta som ger en sökning med Blinkx finnas i programfönstret. Vad är då så speciellt med detta? Jo Blinkx är en av en handfull söktjänster som varit pionjärer när det gäller att utveckla och erbjuda sökning med automatisk taligenkänning. Det innebär att man kan söka på vad som sägs i t.ex. videoströmmar och podcasts. Den stora nackdelen är att man bara kan söka på engelska och att träffsäkerheten i sökningen ännu inte är precis hundraprocentig.

Inte desto mindre har man gått och väntat på att någon av de mindre söktjänsterna som jobbat med den här tekniken skulle inleda ett samarbete med någon av de stora spelarna. På så sätt skulle tekniken komma att spridas och populariseras. I förlängningen skulle detta leda till intensivare utvecklingsarbete och högre kvalitet. Det är i alla fall vad jag tror. Det känns som det här kan bli ett ganska stort steg på vägen.

Blink säger i pressmeddelandet att de nu indexerat närmare 12 miljoner timmar video och ljud. Det är tre gånger så mycket som när vi skrev senast om Blinkx för något år sedan. De två andra söktjänsterna med automatisk taligenkänning som vi känner till är Podscope som står bakom AOL Podcast Search och Podzinger som nyligen bytt namn till Everyzing.

Xerox nya FactSpotter söker djupare?

21 Juni 2007 av Lars VÃ¥ge

Vid Xerox Research Center Europe i Grenoble har man utvecklat en sökprogramvara som sägs kunna söka djupare och intelligentare än de vanliga sökmotorerna. Nu är det ju brukligt att man skriver så i pressmeddelanden som ska väcka intresse så det är svårt att veta vad man ska tro. Programvaran kallas FactSpotter och ska användas för det som på engelska kallas text mining. FactSpotter går längre än vanlig nyckelordssökning och tar sökningen till nästa nivå genom att analysera ordens mening och dess kontexter sägs det. Nästan poetiska är de ordalag som används för att beskriva programvaran: den gör att man kan hitta de en eller två guldklimparna på stranden full med stenar.

FactSpotter ska lanseras nästa år som en del av Xerox Litigation Services och det känns osannolikt att vi vanliga användare ska få tillgång till en gratis sökmotor som använder tekniken. Om man läser pressmeddelandet får man i stort sett bara reda på hur fantastiskt det här är men inte så mycket verklig information. Det enda jag hittar är de här passusarna:

FactSpotter looks not only for the keywords contained in a query but also the context of the document those words contain. For example, if searching for documents that reference Angelina Jolie, FactSpotter will also return results where the pronoun “she” is used instead of Jolie’s full name.

FactSpotter takes into account the context of the entire document instead of just a cluster of nearby words. It introduces the concept of “relation,” searching within and across sentences and paragraphs.

Sedan står det också att man ska kunna söka med naturligt språk men det är ju knappast något nytt. En annan sak är att man inte nödvändigtvis ska få hela dokument som svar utan bara de relevanta delarna. Det kan ju vara bra ibland men andra gånger vill man nog se texten i hela dokumentets kontext.

Picsearch på Eurekster och Twerq

21 Juni 2007 av Lars Iselid

PicsearchSvenska Picsearch ångar på med nya kunder och den sista i raden är kanadensiska Twerq som jobbar med flikar (eng. tabs) i sökgränssnittet.

Förra veckan slöt Picsearch också ett avtal med Eurekster som bl.a. är känd för sina swickis. En swicki är en sökmotor där du kan ställa in själv vad den ska söka på, liknande Google Co-op. Du kan också dela med dig din sökmotor med andra så att ni tillsammans bygger upp och ställer in sökmotorn. Sökmotorn går sedan att integrera på en egen webbplats. Eurekster beskriver kortfattat en swicki:

“Swickis are a cross between search engines and Wikipedia - the community can add, delete and improve the results”.

Undrar vad Wikipedias Jimmy Wales tycker om den liknelsen med anledning av hans Google Killer-planer med sitt projekt Wikia?

Jakob Harnesk om biblioteket 2.0 på konferensen Nord I&D

20 Juni 2007 av Lars Iselid

- Varför inte låta användarna styra biblioteket? undrade Jakob Harnesk i sitt anförande om bibliotek 2.0 (eng. library 2.0) på The 13th Nordic Conference on Information and Documentation som gick av stapeln 18-19 juni vid Stockholms universitet, Aula Magna.

Med anledning av att konferensdeltagarna dagen före besökt Wasamuseet ställde han också den retoriska frågan: varför lät vi inte sjömännen bygga regalskeppet Vasa? eller för att ta en mer nutida ytterligare retorisk fråga: varför inte låta läsarna skriva encyklopedin?

Det vimlar av web 2.0- och bibliotek 2.0-föreläsningar på IT- och bibliotekskonferenser idag och många gör inte mer än att de belyser begreppet och visar sedan en massa häftiga web 2.0-tjänster. Det gjorde inte Harnesk. Han borrade sig djupare in i fenomenet som formligen har exploderat på nätet, men med fokus på hur biblioteket ska hantera detta, vilket fött begreppet library 2.0. Web 2.0 är något mer än bara unga, narcissistiska, dokusåpaskadade googlifierade bloggande wikipedianer som bara vill prata om sina förehavanden.

- Vi lever i en 2.0-värld, menade Harnesk och radade upp en massa 2.0-begrepp bl.a. öppenhet 2.0 som Carl Bildt myntat. En av konferensens produktvisningar hade titeln PR 2.0 för att ta ett ytterligare exempel.

- Lita på amatörerna, sa Harnesk och påpekade att ordet amatör härstammar från det latinska namnet amare som betyder kärlek. Här kom han in på begreppet radical trust som myntats av biblioteksgurun Michael Casey. Biblioteken måst ge större tilltro till användaren.

- Betrakta Wikipedia som en ständigt pågående process utan slut.

- Det finns idag nära 100 miljoner bloggar och ungefärligt 120 svenska bloggar som skriver om bibliotek. Varför är det så många människor som vill dela med sig av sina idéer och tankar?

- Web 2.0 har gjort det traditionella biblioteksarbetet med katalogisering trendigt, menade Harnesk med hänvisning till den alltmer utbredda företeelsen: taggning. Det vi i bibliotekssammanhang med fikonspråk kallar ämnesordsindexering. I fallet taggning har vi överlämnat ämnesindexeringen till användaren. Han pratade om Librarything där man man kan ladda ner information om böcker med bokomslag och katalogisera sin bok ytterligare med taggning elller annan info.

Harnesk menade att han varit rätt motvillig till tanken om att användarna skulle katalogisera böckerna men ändrat inställning efter att ha läst om hur astronomer pÃ¥ tre mÃ¥nader “katalogiserat” NASAs bilder över mars tack vare att man öppnat upp det för användarna.

- Vi (Läs:biblioteken) måste förstå användarna och komma närmare dom. Vi måste kolla upp de som finns på arenan och inspireras: Last.fm, Amazon etc.

En del av uppmaningarna från Harnesk har vi hört i andra föredrag om biblioteket 2.0 men de tål att upprepas t.ex.

  • integrera bibliotekets katalog (OPAC) med bibliotekets webbplats.
  • acceptera att allting inte behöver vara perfekt före man lägger upp en ny tjänst utan acceptera att det är en betaversion som ständigt förbättras.

- Biblioteksutlånen på folkbiblioteken har sjunkit med 25% och nåt allvarligt håller på att hända, sa Harnesk. Public service (PS) över huvud taget befinner sig i en kris. Unga människor har övergett PS till förmån för annat bl.a. kommersiella kanaler. TV:n änvänds allt oftare till dataspel än TV-tittande.

- Vårt förhållande till böcker har också förändrats. Det är något vi köper på stormarknaden och slänger är vi läst den. Man kan till och med få erbjudandet att få två pocketböcker på köpet när man köper godis.

- Gör inte biblioteken något radikalt kommer många bibliotek att måsta stänga inom 10-20 år.

Harnesk uppmanade ytterligare:

  • Se till att personalen blir synliga pÃ¥ webben. Norrköpings stadsbibliotek har t.ex. filmat biblioitekarier som ger boktips och lagt upp detta pÃ¥ YouTube. Vi mÃ¥ste vara där användarna är.
  • Bibliotekscommunityn inkluderar bÃ¥de användarna och bibliotekarierna, dvs. tanken är inte att varken användarna enbart eller bibliotekarierna enbart ska styra hela sajten.

Slutkontentan var: Släpp in användarna och se vad som händer!

Vill ni läsa mer om föredragen från konferensen så kan ni med fördel läsa SFIS västs Ann-Christin Karlén Gramming blogginlägg som ihärdigt bloggade i realtid under konferensen.

Harnesk förklarade också skämtsamt under sitt föredrag att varför han hoppade mellan två uppkopplade laptops vid ståpulpeten var för att han bloggade samtidigt som han pratade.

Quintura får riskkapital och uppmärksamhet

19 Juni 2007 av Lars VÃ¥ge

Quintura - den annorlunda söktjänsten med det visuella gränssnittet och ordmolnen som vi skrivit om vid ett flertal tillfällen är inne i en lovande utveckling. Det dyker upp mÃ¥nga innovativa söktjänster som självdör eller blir uppköpta och nedlagda medan fÃ¥ gÃ¥r vidare till nästa “nivÃ¥”. Quintura har nu fÃ¥tt en en partner i Mangrove Captial Partners som investerar flera miljoner dollar i riskkapital pÃ¥ söktjänsten. Mangrove har tidigare stött t.ex. Skype under deras uppbyggnadsfas.

Dessutom fÃ¥r Quintura allt oftare omnämnanden i tidskrifter och bloggar. PC World har t.ex. med Quintura bland sina 25 Web Sites To Watch som man skrev om i gÃ¥r. Man tror att “the Web’s next breakout hit” kan finnas bland dessa 25. IgÃ¥r tog ocksÃ¥ ZDnets blogg Between the Lines upp Quintura i sin serie Life Without Google. Holländska TV4B intervjuade nyligen Quinturas huvudman Yakov Sadchikov och det finns en streamad videoupptagning av intervjun att titta pÃ¥ för den som är intresserad.

Vad svarade Google EU:s arbetsgrupp för dataskydd?

12 Juni 2007 av Lars VÃ¥ge

Som jag antydde i den senaste bloggposten här pÃ¥ Internetbrus är det inte bara Privacy International utan även EU som har “issues” med Google i frÃ¥gor om dataskydd. Ordförande för EU:s Article 29 Data Protection Working Party, Peter Schaar, skickade den 16 maj ett brev till Googles jurist Peter Fleischer som är ansvarig för frÃ¥gor om dataskydd. I brevet poängterar han att sökmotorloggar innehÃ¥ller information som kan länkas till identifierbara personer och därför faller under definitionen för personliga data som formulerats i EU:s dataskyddsdirektiv 95/46/EC.

Även om Google har beslutat att anonymisera sina sökmotorloggar efter 18-24 mÃ¥nader sÃ¥ anser arbetsgruppen inte att detta “seem to meet the requirements of the European legal data protection framework”. Inte heller tycker man att Google redovisat syftet med att spara sökmotorloggarna vilket är ett krav enligt det ovan nämnda EU-direktivet. Därutöver tycker man att den beräknade livslängden pÃ¥ Googles cookie-filer, 30 Ã¥r, är alldeles oproportionerligt lÃ¥ng. I detta sammanhang hänvisas till EU:s ePrivacy-direktiv 2002/58/EC. Slutligen undrar man huruvida anonymiseringen av sökmotorloggarna är reversibel, dvs om det gÃ¥r att Ã¥terställa informationen pÃ¥ nÃ¥got sätt.

Nu har Googles Peter Fleischer svarat på arbetsgruppens brev och valt att publicera sitt svar på nätet. I en bloggpost i Googles officiella blogg har man också igår kommenterat hur man resonerat.

I svaret går man ut med att man nu anammar en ny policy som går ut på att sökmotorloggar ska anonymiseras efter 18 månader istället för som nu 18-24 månader. Ett litet steg för att visa sin goda vilja får man förmoda. Angående om anonymiseringen skulle vara reversibel skriver man att den sista delen (oktetten) i IP-numret kommer att raderas. Inte bara krypteras utan verkligen raderas. I den ovan nämnda bloggposten finns en uppräkning av skälen för att spara sökmotorloggarna. Bland dessa finns att höja kvaliteten på sökalgoritmerna, att skydda användarna från spam, att skydda Google från attacker, att kunna lämna ut data i rättsfall som t.ex. barnmisshandel och att möta lagliga krav på att behålla data en viss tidsperiod.

Slutligen skriver man att “we are exploring ways to redesgin cookies” sÃ¥ att de löper ut fortare. Problemet är att göra detta pÃ¥ ett naturligt sätt utan att användarna Ã¥terigen ska fylla i basdata som vilket sprÃ¥k man föredrar. Vet inte om jag köper det sista helt och hÃ¥llet. Vilket sprÃ¥k som visas verkar ändÃ¥ mest bero pÃ¥ analysen av mitt IP-nummer. Jag har inte angett att jag är i Sverige, men det vet ju Google ändÃ¥. Detta blir mycket tydligt om man använder en anonymiseringsmetod som t.ex. Tor-nätverket och roar sig med att byta identitet nÃ¥gra gÃ¥nger. Ibland serveras du Google pÃ¥ tyska, ibland pÃ¥ engelska, ibland pÃ¥ nÃ¥got annat sprÃ¥k.

Nu får vi se vad EU:s dataskyddsgrupp tycker om Googles svar. De sammanträder senare denna månaden och frågan ska tas upp då.

UPDATE 2007-06-14: EU:s kommissionär för rättsliga och inrikes frÃ¥gor, Franco Frattini, kommenterade igÃ¥r Googles brev. Vid en presskonferens som hölls i samband med att Europeiska Unionens RÃ¥d sammanträdde fick Frattini frÃ¥gan vad han tyckte om att Google skulle anonymisera sina loggar redan efter 18 mÃ¥nader. Frattini svarar att “It is indeed a good step” och att det känns bra att Google försöker gÃ¥ EU till mötes i den här frÃ¥gan. Han tycker ocksÃ¥ att det är bra att Google överväger att göra förändringar i hanteringen av sina cookies. Det märks här att han inte är sÃ¥ tekniskt bevandrad vilket han själv ocksÃ¥ medger. Han frÃ¥gar personen bredvid om det heter “cooks” men blir diskret rättad. Det här kan man titta pÃ¥ i den streamade videoupptagningen av presskonferensen efter ca 18:40 och framÃ¥t. (Tack till vÃ¥r eminenta EDC-bibliotekarie för denna upplysning!).

Google - sämst av internetföretagen på att skydda användarnas privatliv

11 Juni 2007 av Lars VÃ¥ge

Google har tillsammans med 22 andra företag rankats med avseende på hur bra de är på att skydda användarnas privatliv. Det är den icke-statliga organistaionen Privacy International i London som har gjort rankingen. Själva rapporten om undersökningen finns att läsa och heter A Race to the Bottom - Privacy Ranking of Internet Service Companies. Bland de företag som undersökts finns alla Internetgiganterna som Google, Yahoo, Microsoft, Apple, Amazon, eBay, Skype, MySpace, AOL o.s.v. Det som sticker ut i den här rapporten och som media har plockat upp fort är att Google placerat sig absolut sämst. Som enda företag har Google hamnat i den svarta kategorin med den illavarslande etiketten: Comprehensive consumer surveillance & entrenched hostility to privacy.

Det här kommer säkert att skapa en hel del debatt. Google försvarar sig och menar att det bygger på missuppfattningar och felaktigheter. Varför kontaktade inte Privacy International oss innan de publicerade rapporten, undrar Google. Vi kontaktade er i god tid innan publicerandet men ni har ju inte brytt er om att svara, säger Privacy International. Se artikeln från AP. Hur som helst är undersökningens metodik väl dokumenterad så det hela är nog inte tagit helt ur luften.

Även EU:s arbetsgrupp för dataskydd, Article 29 Data Protection Working Party har riktat klagomål mot Google på sistone. I ett brev som man skickade till Google i slutet av maj hette det bl.a. angående sparandet av sökloggar att

“The new storage period of 18 to 24 months on the basis indicated by Google thus far does not seem to meet the requirements of the European legal data protection framework”

Fortsättning följer…

Picsearch lanserar videosök via turkiska Mynet

8 Juni 2007 av Lars Iselid

PicsearchPicsearch har slutit avtal med turkiska portalen Mynet som har 16 miljoner användare.

Så här uttrycker sig Emre Kurttepeli, VD på Mynet, i pressmeddelandet från Picsearch:

- En familjevänlig söktjänst är viktigt för turkiska användare. Det är ingen hemlighet att Picsearch är den marknadsledande leverantören av multimediasöktjänster och att de är enastående inom familjevänlighet. Som den ledande portalen i Turkiet är vi stolta över att samarbeta med andra företag som också är ledande inom sitt område. Vi ser fram emot att arbeta tillsammans med Picsearch.

Intressant är Mynets betoning på familjevänlig. Mest överraskande är dock Picsearch lansering av videosök eftersom den inte är tillgänglig via Picsearch.com bara via Mynet video. Så här svarar Carl Särnstad på Picsearch i ett mejl när jag frågar:

- Mynet är en av våra första kunder inom videosök. Produkten befinner sig fortfarande under utveckling och har inte samma kvalitet som bildsök. Inom två veckor släpper vi ett nytt index för videosöktjänsten som kommer att förbättra räckvidden dramatiskt, säger Carl Särnstad på Picsearch.

Är Mynet det första stället där ni visar videosök publikt?

-Mynet är den första vi har offentliggjort. Ett flertal av våra andra kunder av bildsök har också smugit igång videosök. Eftersom videosök ännu inte har samma höga kvalitet som bildsök, så har många valt att ligga lågt och inte slå på trumman förrän de känner sig trygga att produkten motsvarar användarnas förväntningar. Bildsök motsvarar idag 10 procent av alla sökningar på Internet, vilket kan jämföras med videosök som utgör 1 procent. Bättre videosöktjänst kommer att leda till att andelen videosökningar ökar. Det kommer också leda till att sajter med videosök får fler användare.

Och när får vi se videosök på Picsearch.com?

- Det är inte bestämt ännu.

Vi hoppas få anledning att testa Picsearch videosök mer ingående längre fram.

Bloggtoppen.se

Blogglista.se

Global Voices Online - The world is talking. Are you listening?

Creeper

Nowhere North

↑ Grab this Headline Animator



iselid info

↑ Grab this Headline Animator