Arkiv för kategorin ‘Google’

Äntligen klustring av trĂ€ffarna i Google News

4 September 2007 av Lars VÄge

Jag kunde aldrig förstĂ„ varför Google News inte anvĂ€nde klustring av trĂ€ffarna frĂ„n början. Deras startsidor har hela tiden anvĂ€nt dublettdetektion och samsorterat artiklar som var i grunden samma “story”. Detta gĂ€llde bara den autogenererade startsidan dock, sĂ„ fort du sökte slogs funktionen av. Nu har man Ă€ntligen valt att aktivera den vid sjĂ€lva sökningen i Google News. T.om. pĂ„ svenska Google Nyheter Ă€r detta aktivt nu. Det hĂ€r innebĂ€r att trĂ€ffarna inte nödvĂ€ndigtvis kommer i kronologisk ordning. Vill man kan man emellertid slĂ„ av dublettdetektionen och det kĂ€nns bra att man har det valet.

En annan nyhet Àr att Google nu har ett aktivt samarbete med fyra viktiga nyhetsbyrÄer. Det Àr franska Agence France Press, amerikanska Associated Press, brittiska Press Assocation och Candian Press. Eftersom ingen av de fyra nyhetsbyrÄerna har haft en egen webbplats dÀr deras artiklar publicerats har Google inte kunnat lÀnka till originalversioner av deras material vilket missgynnat dem. JÀmför med Reuters som har en egen webbplats till vilken Google har drivit trafik via Google News. Samarbetet gÄr ut pÄ att Google lagrar nyhetsbyrÄernas artiklar pÄ Googles egna servrar. HÀr Àr ett exempel: en AFP-artikel pÄ en Google-server.

Detta att Google “hostar” nyhetsbyrĂ„ernas artiklar har naturligtvis en rad implikationer. SkĂ€let att detta sker Ă€r vĂ€l delvis rĂ€ttstriderna med bl.a franska AFP. Men det hĂ€r kan ju inte vara en lösning som gagnar dagstidningar som köper t.ex. AFP:s artiklar och publicerar dem. NĂ€r nu en AFP via Google-version finns att lĂ€sa behöver man ju inte surfa till en tidning som för AFP:s artikel. Hmmm. Om sedan Google börjar placera annonser pĂ„ de hĂ€r sidorna med nyhetsbyrĂ„ernas artiklar…

Google Book Search - nu med PDF-nedladdning

10 Juli 2007 av Lars VÄge

Nu erbjuder Google Book Search inte bara möjlighet att lÀsa hela böcker pÄ webbplatsen utan ocksÄ att ladda ned vissa av dem i PDF-format. Det rör sig om inskannade böcker som det inte lÀngre finns nÄgon som Àger copyright till. Vilket man Àr noga med att poÀngtera i Google Book Search utvecklarblogg och inte utan anledning med tanke pÄ all kritik man fÄtt utstÄ.

Hur ska man dÄ hitta böcker som finns i PDF-format? Störst chans har man om man anvÀnder det avancerade sökformulÀret och klickar i Full view innan man söker. Nu Àr det hÀr lÄngt ifrÄn nÄgon garanti eftersom det mesta som finns i fulltext inte finns i PDF-version Àn. SÄ det Àr bara att söka och hoppas.

I utvecklarbloggen finns nÄgra lÀnkar med exempel men bara vissa av lÀnkarna leder verkligen till böcker med PDF-nedladdning. MÀrkligt slarvigt av Google. I alla fall fungerar lÀnken till en utgÄva av Dantes Inferno som skannats in vid Harvarduniversitetets bibliotek. Ett annat exempel Àr en utgÄva av Simon Bolivars tal.

Google Images kÀnner igen ansikten

1 Juni 2007 av Lars Iselid

Google har smyglanserat en funktion för ansiktssökning i deras bildsöktjÀnst Google Images. Om man söker pÄ en person t.ex. Henrik Larsson och sedan klistrar in följande strÀng &imgtype=face i slutet av en webbadressen fÄr man bara ansikten. TyvÀrr inte enbart bilder pÄ fotbollsspelaren Henrik Larsson. Ett steg vidare vore om Google kunde klustra sina trÀffar efter olika personer med samma namn. UngefÀr som Google klustrar nyheter och söktrÀffar. En sökning pÄ James Dean skulle kunna klustra skÄdespelaren James Dean och sÄngaren James Dean Bradfield i olika trÀffmÀngder.

Det Àr ocksÄ möjligt att byta ut face i strÀngen mot news sÄ fÄr man bara nyhetsrelaterade bilder.

Dessa nya funktioner kan nog antas vara det första resultatet av Googles köp av Neven Vision hösten 2006.

Fler europeiska bibliotek ansluter sig till Google Book Search

29 Maj 2007 av Lars VÄge

Mycket av kritiken mot Google Book Search har kommit frÄn Frankrike. BÄde den tidigare presidenten Chirac och dÄvarande chefen för det franska nationalbiblioteket, Jean-Noel Jeanneney, har uttryckt oro för att engelsksprÄkiga texter skulle komma att trÀnga undan de pÄ andra viktiga kultursprÄk (lÀs franska). En annan kritik Àr att man kör sitt eget race och inte deltar i Open Content Alliance liksom att man pratar om att Àven lÀgga ut upphovsrÀttskyddat material.

Under den senaste tiden har det skett saker som delvis har förÀndrat bilden av Google Book Search tycker jag och det Àr att flera europeiska bibliotek nu gÄtt med i projektet. I takt med att skanningen av böcker vid dessa bibliotek kommer igÄng kommer den anglosaxiska dominansen att bli mindre total.

I lördags kom beskedet att biblioteket vid Universitetet i Ghent i Belgien hoppar med i Google Book Search. Biblioteket i Ghent grundades 1817 och sÀger sig ha det rikaste bestÄndet av tryckta böcker frÄn 1600-talets Flandern. HÀr finns ocksÄ en mycket omfattande samling pÄ franska.

Veckan innan, den16 maj, kom pressmeddelande om att Google skulle skanna 100 000 böcker vid Universitetetsbiblioteket i Lausanne i Frankrike Schweiz. Det var det första biblioteket med franska böcker som Google fÄtt med. Den 7 mars i Är anslöt sig Die Bayerische Staatsbibliothek. Ett oerhört stort bibliotek som grundades 1558 och har nÀrmare 9 miljoner band. Google verkar ha lovat att skanna allt som inte Àr upphovsrÀttsskyddat. SÄ tysk litteratur borde bli vÀl företrÀdd i Google Book Search.

Om vi riktar blicken mot Spanien sÄ meddelade det katalanska nationalbiblioteket i Barcelona (Biblioteca de Catalunya) i januari i Är att de liksom tidigare biblioteket vid Universidad Complutense de Madrid (sept. 2006) har kommit överens med Google om att vara med i projektet. Sammanlagt har vi nu dÄ ett franskt, ett belgiskt, ett tyskt, ett katalanskt och ett spanskt bibliotek förutom nio amerikanska och ett engelskt bibliotek. Det tar sig ju, eller hur Monsieur Jeanneney?

Googles Universal Search - för lite, för sent

17 Maj 2007 av Lars VÄge

Det Àr inte sÄ ofta Google skickar ut pressmeddelanden som har med sökningen i Google att göra. Det Àr kanske inte sÄ konstigt med tanke pÄ att Google av idag Àr i första hand ett media- och annonseringsföretag. DÀrför hajar man till lite grann nÀr det dyker upp nÄgot som utlovar nyheter i sökfunktionalitet. Inledningen av pressmeddelandet lÄter ju lovande:

Google today announced its critical first steps toward a universal search model that will offer users a more integrated and comprehensive way to search for and view information online.

Och lite lÀngre ner:

Google’s vision for universal search is to ultimately search across all its content sources, compare and rank all the information in realtime, and deliver a single, integrated set of search results

Users no longer have to visit several different Google search properties to find such a wide array of information on the topic.

Man talar om att blanda sökresultat som webbsidor, lÀnkar till nyhetstrÀffar, bildtrÀffar, videosnuttar i trÀfflistan. Man talar ocksÄ om att nÀr man söker pÄ vissa sökord ska man fÄ navigeringslÀnkar till trÀffar av andra slag som i bloggsökningen, boksökningen o.s.v. Det Àr nu jag kÀnner att det Àr svÄrt att bli imponerad. Hur lÀnge har liknande funktionalitet funnits hos konkurrenterna? Hur innovativt Àr det hÀr pÄ en skala?

Vem började med att lÀgga in genvÀgar till trÀffar i nÄgot av de specialiserade indexen pÄ den vanliga trÀfflistan? Det var sökmotorn Alltheweb som utvecklades av norska FAST och som hade lika stort webbindex som Google pÄ den tiden. NÀr skedde det? Sommaren 2001 började Alltheweb visa lÀnkar till trÀffar i sitt Multimediaindex vid sidan av webbtrÀffarna. Snart sex Är sedan.

Ask har sysslat med att integrera trÀffar frÄn andra index Àn webbindexet och lÀgga genvÀgar till trÀffar i de andra indexen i flera Är. De kallar detta Smart Answers nuförtiden men funktionen fanns redan 2003. Yahoo! Search Shortcuts med lÀnkar till trÀffar av andra slag Àn bara webbsidor kom 2004. Detta skedde efter att man köpt Altavista (och Alltheweb) och byggde pÄ Altavistas Shortcuts som kom i början av 2002.

Det Ă€r det jag menar med “för sent”. Ett annat problem Ă€r att man bara ibland fĂ„r lĂ€nkarna till specialindexen i Google nĂ€r man söker. I t.ex. Exalead och i gamla Alltheweb fĂ„r/fick man alltid lĂ€nkar till alla index dĂ€r det fanns trĂ€ffar. Ofta specificerade med antal. Enkelt, tydligt och klart. Gör man nĂ„gra provsökningar i Google nu ser man att deras lĂ€nkar till andra index dyker upp mycket oregelbundet och ger ingen feedback om antalet trĂ€ffar i specialindexen. Det Ă€r det jag menar med “för lite”.

Det kÀnns som nÀr Microsoft lanserade Internet Explorer 7 och funktioner som varit givna i Opera och Firefox i flera Är beskrevs som nyheter. Lite pinsamt.

Google web history sparar historik över sidor du besöker

26 April 2007 av Lars Iselid

Funktionen att spara sin sökhistorik i Google har funnits lÀnge. Förra veckan lanserade Google funktionen web history som gör det möjligt att spara historik över alla sidor du besöker, inte bara dina sökningar. Det krÀvs dock att du installerar Google Toolbar med pagerank aktiverat.

FrÄgan Àr vÀl om man vill spara denna historik? Det Àr följt möjligt att ta bort sin webbhistorik hÀr. Finns det nÄgra integritetsrisker? Tja, Àr du inloggad pÄ Google och lÀmnar datorn sÄ kan vem som helst som sÀtter sig vid datorn komma Ät din webbhistorik. (Om de gör det innan Google krÀver att man loggar in pÄ nytt nÀr man klickar pÄ web history-funktionen). Det Àr lÀtt att glömma bort att logga ut. Det Àr inte bara en gÄng lÄntagare pÄ mitt bibliotek glömmer att logga ur Mina sidor (dÀr lÄn och reservationer syns) i vÄran bibliotekskatalog. Alldeles nyss hade nÄgon inte loggat ur sitt Hotmailkonto pÄ en av vÄra tunna klienter pÄ Medicinska biblioteket, UmeÄ UB.

Det har t ex hÀnt mig nÄgra gÄnger nÀr jag velat logga in pÄ Gmail pÄ en frÀmmande dator att en annan anvÀndare glömt att logga ur sitt Gmail-konto. Cookies i all Àra, men den mÀnskliga faktorn Àr inte att leka med. Eller har vi börjat ge upp den personliga integriteten?

Google köper svenska Marratech

20 April 2007 av Lars VÄge

Att Google ska köpa DoubleClick och dÀrmed skaffa sig ett riktigt jÀrngrepp om annonsmarknaden pÄ Internet lÀr vÀl inte sÄ mÄnga missat. Somliga menar att med detta uppköp kommer sökmotorgiganten att bli sÄ dominant nÀr det gÀller webbannonsering att det börjar kÀnnas lÀtt skrÀmmande. De mindre spelarna kan lÀgga av nu kÀnns det som.

FÀrre lÀr i alla fall ha uppmÀrksammat gÄrdagens pressmeddelande om att det svenska företaget Marratech AB:s programvara med samma namn ocksÄ ska köpas av Google. Företaget producerar en programvara för videokonferenser över Internet som anvÀnds av mÄnga svenska universitet och i synnerhet NÀtuniversitetet. Jag har sjÀlv anvÀnt det ett antal gÄnger och vet vilken betydelse det har i arbetet mot distansstudenter. Jag vet uppriktigt sagt inte om det Àr bra eller dÄligt att Google köper Marratech men sÄ Àr det i alla fall.

Holocaust Memorial Musueum och Google Earth dokumenterar folkmordet i Darfur

11 April 2007 av Lars VÄge

United States Holocaust Memorial Museum har med hjÀlp av Google Earth samlat bildbevis för det pÄgÄende folkmordet i Darfur. Det hÀr Àr starten pÄ ett projekt som kallas Genocide Prevention Mapping Initiative som gÄr ut pÄ att skapa en slags interaktiv global karta över konfliktomrÄden. Tanken Àr att man pÄ sÄ sÀtt ska kunna hjÀlpa till att hindra vÄldsutvecklingen i de olika omrÄden genom att sprida visuell dokumentation av hÀndelserna.

Idag har man gjort tillgÀngligt bildmaterial över Darfur som kan laddas i Google Earth och illustrerar vad som hÄller pÄ att hÀnda. Först mÄste man alltsÄ om man inte redan gjort det ladda ner och installera Google Earth-applikationen. Sedan ska man ladda ner kmz-filen Crisis in Darfur frÄn det ovan nÀmnda muséets webbplats och öppna den inne i Google Earth. DÄ kan man ta del av dokumentation som ska visa att mer Àn 1600 byar helt eller delvis förstörts och 133 00 byggnader brÀnts ner under konflikten. Materialet bestÄr av mycket högupplösta satellitbilder som tÀcker regionen och som kompletteras med ett kartfilter som lÀggs ovan pÄ och markerar hÀndelser och platser. Till detta kommer ocksÄ att man fÄr tillgÄng till fotografier, video och vittnens berÀttelser.

Det hÀr Àr naturligtvis ett verkligt bra sÀtt att anvÀnda sökmotorn Googles enorma resurser. Holocaust Memorial Museums idé med hela projektet - att göra vÀrlden medveten om begynnande folkmord och förföljelser genom den hÀr typen av dokumentation - Àr mycket bra. Det kommer inte att bli lika lÀtt att agera i det fördolda lÀngre, Ätminstone inte i regioner som Àr sÄ lÀtt överblickbara med satellitfotografering som Darfur.

Google har Àntligen gjort upp med nyhetsbyrÄn AFP

10 April 2007 av Lars VÄge

För tvÄ Är sedan startade en rÀttsprocess mellan Google och den franska nyhetsbyrÄn Agence France Press. Först nu har man lyckats komma till en slutpunkt. Det var i mars 2005 som AFP stÀmde Google för att man ansÄg att Google News anvÀndande av nyhetsbyrÄns rubriker, sammanfattningar och foton utgjorde ett copyrightintrÄng. Som bekant har liknande processer drivits t.ex. i Belgien. Hur som helst har man nu enats och hÀdanefter kommer AFP:s material Äter anvÀndas och bli sökbart i Google News. Inte bara det vad det verkar. SÄ hÀr sÀger AFP:s ordförande Pierre Louette nÀmligen:

“The agreement will allow uses of AFP’s content in ways that go beyond its typical use of content in Google’s services, which features just headlines and snippets of text to provide just a taste of what an article offers”

Det sÀgs ocksÄ i uttalandet att uppgörelsen:

“will enable the use of AFP’s newswire content in innovative, new ways that will dramatically improve the way users experience newswire content on the Internet”

Vad i hela vÀrlden har de kokat ihop frÄgar man sig. Under alla omstÀndigheter Àr det vÀldigt bra att AFP syns igen i Google News, deras artiklar har ofta andra och intressantare perspektiv Àn Reuters och AP tycker jag.

AFP:s eget pressmeddelande

Google ska radera personlig information efter tvÄ Är

18 Mars 2007 av Lars VÄge

De stora nyhetsbyrÄerna som Reuters och AFP rapporterade i veckan att Google skulle börja radera personlig information om anvÀndarna av sökmotorn. Tidigare sparade Google alla data pÄ obestÀmd framtid men nu ska det alltsÄ bli Àndring pÄ detta. Information frÄn cookies liksom den sista delen av IP-numren i loggarna ska rensas ut efter ungefÀr tvÄ Är. NyhetsbyrÄerna citerar följande uttalande frÄn Googles webbplats:

“By anonymising our server logs after 18-24 months, we think we’re striking the right balance between two goals: continuing to improve Google’s services for you, while providing more transparency and certainty about our retention practices”

Citatet kommer frÄn Googles officiella blogg och inlÀgget frÄn i onsdags har rubriken Taking steps to further improve our privacy practices. Denna nya policy hoppas man kunna implementera inom ett Är. Kurt Opsahl frÄn Electronic Frontier Foundation sade till franska AFP att det hÀr var ett viktigt steg i rÀtt riktning och hoppades att det skulle kunna pÄverka de andra sökmotorerna att ta liknande beslut.

Lite mer detaljerad information om Googles nya inriktning finns i PDF-dokumentet Google Log Retention Policy FAQ som det lĂ€nkas till frĂ„n blogginlĂ€gget. En av frĂ„gorna i FAQ-dokumentet Ă€r vilka organisationer/personer Google har konsulterat och diskuterat med i samband med det hĂ€r. Det enda som namnges Ă€r “the Norwegian Data Protection Authority” (Datatilsynet Ă€r det norska namnet) som man tydligen trĂ€ffat i januari. En artikel frĂ„n Aftenposten den 23 januari som handlar om detta möte finns pĂ„ E24.no:s webbplats (tack Pandia.com för denna lĂ€nk!). Jag tycker att Google gör nĂ„got bra hĂ€r Ă€ven om naturligtvis anonymiseringen endast av IP-numrens sista del förmodligen fortfarande gör det genomförbart att spĂ„ra en bland 256 datorer/personer pĂ„ subnĂ€tet ifrĂ„ga.

Bloggtoppen.se

Blogglista.se

Global Voices Online - The world is talking. Are you listening?

Creeper

Nowhere North

↑ Grab this Headline Animator



iselid info

↑ Grab this Headline Animator