Arkiv för kategorin ‘Boksökning och böcker’

Omdiskuterade Google Print lanseras med icke copyright-skyddade böcker

4 November 2005 av Lars VÃ¥ge

Igår var det då dags. Google Print presenterades officiellt för världen med pressmeddelande och allt. Som vi skrivit tidigare har projektet med inskanning av böcker från fem stora anglosaxiska bibliotek (Stanford, Harvard, New York Public Library, Oxford och Michigan University) fått en hel del kritik. Från europeiskt (läs franskt) håll för det engelska språkets dominans och från flera av de stora amerikanska förlagen som lämnat in stämningar mot Google för missbruk av copyright-skyddat material och från författare. Senast var det förlag som McGraw-Hill, Pearson Education, Penguin Group USA, Simon and Schuster and John Wiley and Sons. Under tiden har ett andra bokskanningsinitiativ, Open Content Alliance, dykt upp med stöd av bl.a. Yahoo och nyligen hoppade Microsoft in i detta projekt som kommer att respektera copyright-ägarnas vilja helt.

När man beskriver Google print i pressmeddelandet som har rubriken Google makes public domain books accessible to the world nämns inte något om copyright-problematiken utan man lägger tonvikten helt på det copyright-befriade materialet. Och visst är det kul att det finns och det fungerar jättebra att söka i det. Men just nu känns det ändå som att Google står lite ensamma och att de vill gå sin egen väg oavsett vad andra intressenter (som t.ex. de som äger copyright) tycker och det är inte alls bra. Brewster Kahle på Internet Archive som administrerar Open Content Alliance hade önskat att Google kunde vara med där istället, att man kunde jobba tillsammans. Yahoo och Microsoft å sin sida gottar sig kanske åt kritiken mot Google som känns befogad. Det börjar bli lite som Steve Ballmer på Microsoft ska ha sagt nyligen om att just nu tror alla på vad Google säger och gör utom möjligen om de skulle hävda att de hade boten mot cancer. Jag ogillar att säga det men för en gångs skull håller jag med Ballmer.

Open Content Alliance - nytt och bättre initiativ än Google Print?

3 Oktober 2005 av Lars VÃ¥ge

ocaIdag tillkännagavs ett nytt stort projekt kallat Open Content Alliance som syftar till skapandet av ett internationellt digitalt arkiv med bl.a. inskannade böcker och filmer. Till skillnad frÃ¥n Google Print kommer man att vara mycket noga med att respektera copyright-skyddat material. I start kommer man att utgÃ¥ frÃ¥n böcker som ligger inom “the public domain”, där upphovsrätten har löpt ut, och copyright-skyddat material som de som äger rättigheterna själva frivilligt vill bidra med. Detta kan i sÃ¥ fall spridas med hjälp av en Creative Commons-licens där upphovsrättsägaren kan bestämma vilka rättigheter som ska gälla.

Google som tänker skanna in böcker frÃ¥n tre mycket stora amerikanska bibliotek (Harvard, Stanford och Michigan) har blivit stämda av Author’s Guild för copyright-intrÃ¥ng men verkar ändÃ¥ gÃ¥ vidare. Google har sagt att de författare/copyrightägare som har nÃ¥got emot att deras upphovsrättsligt skyddade verk skannas och görs sökbara mÃ¥ste höra av sig innan den 1 november. Kritiken har vuxit pÃ¥ sistone och man menar argumentet att bara ett par sidor visas Ã¥t gÃ¥ngen i Google Print inte är gott nog. Organisationer som Association of Learned and Professional Society Publishers och Association of American University Presses har uttalat sig positivt om OCA och tycker om att ledningen för det nya projektet vill jobba tillsammans med utgivare/författare.

Idag har det skrivits en del (t.ex. New York Times och Associated Press) om OCA men jag tycker att man har koncentrerat sig lite för mycket på det faktum att Yahoo är inblandat i projektet. Man menar att det är ett drag för att konkurrera med Google på just den här sökarenan. Kanske det är en faktor men i sammanhanget är den av sekundär betydelse. Yahoo är ett av flera företag och organisationer som deltar i uppstarten av OCA. Men det är grundaren av Internet Archive Brewster Kahle som är mest inblandad och det är IA som skall administrera projektet.

I gruppen som deltar i uppbyggandet av OCA finns:
Internet Archive - kommer initiellt att delta i skanning och lagring
Yahoo - kommer att skapa sökmotorindexet för OCA och finansiera viss skanning
Adode och Hewlett-Packard - kommer att bidra med mjukvara
University of California, University of Toronto och bokförlaget O’Reilly - bidrar med böcker
National Archives (Storbritannien) och Prelinger Archives - bidrar med filmmaterial

De inblandade organisationerna och företagen har enats om sex principer. Bland dessa finns alltså att de som bidrar med material till arkivet ska själva kunna bestämma i vilken grad det kan användas och spridas. Arkivet kommer nämligen att uppmuntra återanvändning av materialet i alla sammanhang. Yahoo kommer därför att göra det möjligt för andra sökmotorer att indexera arkivet om de så skulle vilja (vilket inte Google gör). Arkivet åtar sig att skapa metadata för materialet för att göra det lättare att hitta i. Det kommer också att finnas flera kopior av arkivet som ska vara spridda internationellt för att säkerställa tillgängligheten.

Mer information finns i pressreleasen och i Yahoo! Search Blog där Brewster Kahle gästskrivit.

Google Print backar

17 Augusti 2005 av Lars Iselid

Google meddelar pÃ¥ sin blog att Google Print stoppar sina skanningsplaner fram till november. Detta med anledning av den kritik man bl a fÃ¥tt frÃ¥n förlagen. Läs detta pressmeddelande frÃ¥n de amerikanska förlagens förening AAP: “Google library project raises serious questions for publishers and authors” pÃ¥ Publishers.org.

Google erbjuder förlag som är medlemmar i Google print program att tala om precis vilka böcker man vill digitalisera och är man med i Google Publisher Program kan man som förlag lämna en lista över vilka böcker som skannas som man godkänner att de görs tillgängliga i fulltext.

Kom ihåg att Google Library skannar hela boken men visar bara ett litet utdrag runt om sökordet om boken råder under copyright-lagarna. Här kan du se skillnaden mellan en bok i Google Library och Google print.

Google print och Google Library project väcker mÃ¥nga frÃ¥gor. Professor Siva Vaidhyanat förläste i juni pÃ¥ ALA Cognotes om “Googilization of everything”. Han sa bl a:

“Are we willing to trust our cultural heritage to a company that has been around less time than Brad Pitt and Jennifer Aniston were together?”

“If you think Kazaa or Grokkster infringes coyright, you’ve got to figure that Google does too”.

“How will we be able to make sure Google will not hand over our records to the FBI? There is nothing in Google’s privacy policy that would keep them from doing this and no reason they would feel obliged to keep the confidentiality of nonpaying patrons”.

“I am a fan and a user of Google, but I just happen to think that libraries are a lot cooler”.

Allt detta finns refererat på ALA Cognotes Highlights/Wrapup issue [PDF] Mer vad Siva tycker kan du läsa på hans blog.

Visst kan det ibland behövas ett privat initiativ, som Google, för att få fart på saker ibland, t ex dyra skanningsprojekt, men precis som Siva påpekar måste man betänka att Google inte har något som helst samhällsansvar och ett börsnoterat företag kan ena dagen säljas ut och vad händer då? Google Library Project är ett bra exempel på hur dåliga biblioteken varit på att samarbeta i skanningsprojekt över landsgränserna. Slår man ihop alla världens biblioteks resurser både i anställda och pengar så borde det väl finnas möjlighet till stora skanningsprojekt? Problemet är inte pengar utan innovation, kreativitet och förmågan att samarbeta. Den förmågan har åtminstone Brewster Kahle på Internet Archive.

På Internet Librarian International 2005 i oktober kommer Ronald Milne från Bodleian Library, University of Oxford, UK, att berätta om deras skanningsprojekt med Google.

Så här skrev Wade Roush i maj i Technology review:

“Whatever happens, transforming millions more books into bits is sure to change the habits of library patrons. What, then, will become of libraries themselves? Once the knowledge now trapped on the printed page moves onto the Web, where people can retrieve it from their homes, offices, and dorm rooms, ­libraries could turn into lonely caverns inhabited mainly by ­preservationists. Checking out a library book could become as anachronistic as using a pay phone, visiting a travel agent to book a flight, or sending a handwritten letter by post”.

Och på LITA blog:

“3 big worries about Google Print:
1.Privacy (Google, unlike libraries, has no ethical constraints against sharing/giving access to reading/searching habits)
2.Privatization (See Brewster Kahle’s 3 models regarding this)
3.Property (which means a copyright meltdown is possible - which would be a bad thing - libraries would likely *not* have a seat at the table)”

Chirac vill att europeiska böcker också ska läggas ut på nätet

19 Mars 2005 av Lars VÃ¥ge

Chefen Ordföranden för det franska nationalbiblioteket, Jean-Noel Jeanneney, har uttryckt oro för att Googles projekt med att scanna in böcker och tidskrifter frÃ¥n 5 av de största biblioteken i USA och England ska göra sÃ¥ att europeisk och i synnerhet fransk litteratur hamnar i skymundan. President Chirac vill göra nÃ¥got Ã¥t detta och har gett kulturminister de Vabres och Jeanneney i uppdrag att ta fram en plan för att göra samlingarna vid de stora biblioteken i Frankrike och Europa tillgängliga pÃ¥ Internet. Kulturministern säger att man inte vill konkurrera med Googles projket men önskar att det finns alternativ. “La diversité n’est dirigée contre personne”. Förmodligen är man dock rädd för att Google i sitt projekt företrädelsevis ska välja anglo-saxisk litteratur. Jeanneney uttryckte ocksÃ¥ Ã¥sikten att EU borde bidra till ett europeiskt initiativ för att balansera inflytandet som Google Print kan komma att fÃ¥ och skapa en egen sökmotor. FrÃ¥gan om en europeisk sökmotor med digitaliserade böcker ska tas upp vid ett möte om europeisk kultur den 2-3 maj i Paris. Källa: Reuters.

Google och Internet Archive skannar in böcker från biblioteken

14 December 2004 av Lars Iselid

Biblioteken vid Harvard University, Stanford University, Michigan University och Oxford University samt New York Public Library planerar att låta Google skanna in deras böcker. Google har sedan tidigare ett samarbete med förlagen i och med Google Print där man skannar in delar av böcker som lyder under upphovsrätten.

“Googles mÃ¥l är att organisera världens information och vi är intresserade av att samarbeta med biblioteken för att uppfylla detta mÃ¥l”, säger Googles Larry Page i ett pressmeddelande.

De böcker som fortfarande lyder under upphovsrätten kommer man bara att kunna läsa ett par sidor av i fulltext och i övrigt kommer bibliografisk information som titel, författare, ISBN osv. vara sökbart. Övriga upphovsrättsfria böcker kommer att skannas in allra först av Google och läggas ut i fulltext möjliga att läsa med begränsningen att inte kunna skriva ut.

Google har inga planer på att göra en särskild söktjänst för inskannade böcker i Google Print. Istället visas bokträffar från Google Print som första träff i ordinarie träfflistan när sökfrågan är relaterad, ungefär som sökvägar (eng. search shortcuts). Ett exempel är en sökning på Mastering digital photography.

Samtidigt meddelar det ideella projektet Internet Archive att man samarbetar om att skanna in böcker från flera olika bibliotek från 5 olika länder. Bland annat gäller det Zhejiang University, China (Professor Zhao), University of Toronto, Canada (Carole Moore), Library of Congress American Memory Project, USA (Deanna Marcum). Över 1 miljon böcker ska göras sökbara och för tillfället finns över 27.000 tillgängliga och ytterligare 50.000 planeras finnas under första kvartalet 2005.

Gratis e-böcker på Internet, både de som lyder och inte lyder under upphovsrätten, är inte på något sätt nytt. Vi har det internationella projektet Gutenberg och det svenska projektet Runeberg för äldre böcker som inte lyder under upphovsrätten. Nätbokhandeln Amazon har en mängd inskannade nyare böcker tillgängliga helt utan kostnad bara man anger sitt kreditkortsnummer i Amazon. Frågan är om det inte är en mer rätt väg att gå för biblioteken att samarbeta med ideella Internet Archive än en sån dominerande kommersiell aktör som Google ändå är? Utan tvivel kommer mycket att hända vad gäller e-boksökning i framtiden.

Läs mer om Googles samarbete med biblioteken.

Bok om hur vi söker på webben utgiven

1 November 2004 av Lars VÃ¥ge

Jag skulle tro att vad som är den första boken som helt handlar om folks sökvanor på webben nu har har blivit utgiven efter elva år med webbsökmotorer. Den heter Web search: Public searching of the web och har skrivits av Amanda Spinks (University of Pittsburgh) och Bernard Jansen (Penn. State University) och jag erkänner att jag inte läst den än. Nyhetsbyrån Associated Press har uppmärksammat bokens utgivande genom en artikel av Joe Mandak. Författarna har studerat hur webbsökningen har utvecklats under de senaste sju åren och kommit fram till att sex-relaterade sökningar har mer än halverats medan e-handelsinriktade har ökat med 86%. Söksessioner tyckts ta i snitt fem minuter och de flesta tittar bara på den första sidan med träffar. I allmänhet provar folk bara två sökuttryck och de flesta består bara av två ord. Detta stämmer väl överens med andra studier som t.ex. de från Onestat.com och studien Into the Mind of the Searcher från Enquiro.com som vi tidigare skrivit om här på Internetbrus. Den nya boken Web Search av Spinks och Jansen ges ut på det prestigefyllda vetenskapliga förlaget Springer och kostar tyvärr hela 100 euro. Om man inte genast vill lägga upp den nätta summan kan man läsa Jansens artikel som heter An Analysis of Web Documents Retrieved and Viewed som presenterades vid en konferens i Las Vegas i juni 2003 och som går att ladda ner gratis som en PDF-fil. Denna artikel beskriver sökningar utförda i februari 2001 med sökmotorn Alltheweb.

Program för att anmäla böcker till Google print

9 Oktober 2004 av Lars Iselid

Googles senaste schackdrag är att bokutgivare kan automatisera anmälan av sina e-böcker till Google som lägger ut boken i fulltext. Liknande det Amazon gjort ett bra tag där man kan få tillgång till inskannade böcker i fulltext bara man anmäler sitt kreditkortsnummer. Amazons böcker är tillsammans med bl a Googles index sökbart via sökmotorn A9. Tidigare har Google Print bara haft ett enkelt formulär för anmälan och enbart utdrag ur böcker samt bibliografisk information (titel, författare, ISBN etc) integrerat i sökmotorindexet. Nu har man istället lyft ut matrialet från Google print (exklusive artikelmaterialet) och precis som nyheter från Google News ger separata träffar i träfflistan gör Google print det också. En sökning på följande boktitel best short hikes in northwest oregon visar ett exempel på hur det kan se ut i träfflistan.

Att detta är ett svar på Amazon och A9 med sina fantastiska tjänster och en naturlig utveckling av Google print råder ingen tvekan. Det finns dock en hake. Användarna kan bara komma åt en begränsad del av innehållet av respektive bok varje månad (Frågan är om det kommer att styras med cookies?). Det går dessutom bara att bläddra två sidor framåt och två sidor bakåt. Fördelen är att man slipper lämna ut sitt kreditkortsnummer som i Amazon/A9.

Google kommer att länka vidare från bokmaterialet till nätbokhandlar men kräver inte betalt för länkningen. Istället tänker man tjäna pengar på annonser kopplade till indexet över e-böckerna och även dela inkomsterna med förlagen. På detta sätt hoppas Google få fler förlag att vilja lägga ut fulltexten av böckerna och därmed erbjuda ett effektivt sätt för förlagen att marknadsföra sina böcker.

Sökmotorer som A9 och Google börjar mer och mer visa fultextmaterial som funnits i åratal på biblioteken, vilket kan höja kavliteten på träffarna men samtidigt kan man ju undra om det blir de mest kavlitativa böckerna eller artiklarna som kommer att finnas i fulltext. Biblioteken har här en enorm uppgift att informera våra Googlande medborgare om hur det ligger till. Vad i detta fall Google och A9 kan erbjuda och vad biblioteken kan erbjuda elektroniskt.

En liten passus: Stort tack till Danny Sullivan för sitt initierande skrivande i SearchDay om sökmotorer och i detta fall Google print, MEN det är inte särskilt trovärdigt att först granska en Google-resurs och samtidigt sälja en stor Google-annons i högerspalten som skriker:”Can you boost the profitability of your business?”. Hur oberoende och granskande är SearchDay egentligen? Detta sagt utan att förhärliga eller söka sympati för Internetbrus hittills mer eller mindre osponsrade ideella arbete ;-)

Snabbtur över Google prints program för att anmäla e-böcker i fulltext

Inte mycket tryckt material i Google

30 September 2004 av Lars VÃ¥ge

Det har skrivits lite grann om Googles satsning på att få in tryckt material i sitt index - Google Print. Det rör sig dels om utdrag ur böcker, dels om artiklar antingen i fulltext eller utdrag från artiklar med länkar till webbplatser där fulltexten finns (men inte gratis). Att det varit svårt att vid vanliga sökningar få upp några träffar från detta material har det också klagats på. Tara Calishain på Researchbuzz (aktuell med en ny bok om webbsökning - Web Search Garage) gjorde nyligen ett litet sökformulär tillgängligt från en av sina bloggartiklar med vilket formulär man kunde söka specifikt efter träffar bland det tryckta materialet. Om man inte vill göra ett bokmärke till hennes artikel kan man använda lite operatorer i Google:

För att söka bland bokutdrag:
sökord site:print.google.com inurl:isbn
För att söka bland artikelutdrag eller fulltextartiklar:
sökord site:print.google.com inurl:articleid
För att söka bland allt tryckt (ger inte korrekta resultat?):
sökord site:print.google.com inulr:isbn | inurl:articleid

Om man tycker det är besvärligt att skriva |-tecknet går det lika bra med ordet OR. Denna operator påverkar bara orden omedelbart bakom och framför sig.

Hur mycket är egentligen inlagt i Google av tryckt material? Tja, om man gör om den sista sökningen och utlämnar nÃ¥got sökord fÃ¥r man 47 200 träffar fördelade pÃ¥ som det verkar pÃ¥ 39 100 bokutdrag och 28 700 artikelträffar om man söker separat som i de tvÃ¥ övre sökningarna. SÃ¥ det verkar ju inte precis som Googles OR-operator är tillförlitlig. I själva verket är Googles sökning bland “trycksaker” inte nÃ¥got att bry sig om tycker jag med tanke pÃ¥ hur pyttelitet det finns att hämta. För boksökningar är Amazon ojämförligt mycket bättre särskilt via deras söktjänst A9 som vi skrev om nyligen. Här kan man söka och delvis läsa fulltexten av över 100 000 böcker. Är det artiklar man är intresserad av sÃ¥ föreslÃ¥r jag Looksmarts Findarticles. 5,5 miljoner artiklar i fulltext gratis. Har man vägarna förbi nÃ¥got bibliotek (särskilt nÃ¥got akademiskt) kan man utnyttja att de vanligtvis har tillgÃ¥ng till flertalet betaldatabaser med fulltextartiklar frÃ¥n sina publika datorer.

WorldCats boksökning nu i Yahoo

12 Juli 2004 av Lars Iselid

I och med att Google och andra söktjänster på Internet blivit en allt viktigare startpunkt för människor när de söker information, så hamnar bibliotekens datoriserade kataloger lätt i skymundan. Särskilt då de stora sökmotorerna inte brukar indexera de enskilda bibliotekens katalogposter som göms i olika databaser och därmed utgör en del av den osynliga webben.

Att böcker från Amazon, och även andra nätbokhandlare, syns bra i sökmotorerna är inget nytt. Amazon har också gjort sitt för boksökningen genom att även erbjuda sökning i fulltexten, dvs. själva boksidorna, och med söktjänsten A9 har man visat att man tycker böckerna bör lyftas fram på Internet. Även om det naturligtvis ligger strikta kommersiella motiv bakom detta är det ändå en tydlig målinriktnig.

I oktober förra Ã¥ret aviserade Google att man i samarbete med OCLC’s världsomspännande bibliotekskatalog avsÃ¥g att indexera 2 miljoner biblioteksposter av OCLC’s alla 55 miljoner frÃ¥n 9.000 olika bibliotek. Yahoo tog ocksÃ¥ kontakt med OCLC i januari detta Ã¥r och 21 maj skrev man ett avtal som innebar att redan 6 juni (!) fanns alla 2 miljoner poster sökbara i Yahoos index.

En sökning idag på Google visar att endast 368.000 webbsidor från worldcat indexeras av Google. Samma sökning på Yahoo ger 8,7 miljoner webbsidor.
En sökning på Strindberg inferno ger en träff från Worldcat som träff nr 2. Här hittar man boken Strindberg in inferno av Gunnar Brandell. En begränsning till United Kingdom ger svaret att boken bland annat finns vid Edinburgh och Glasgow university library.

Även om det finns mer att önska vad gäller integreringen av biblioteksposter i sökmotorerna sÃ¥ är Yahoos initiativ en bit pÃ¥ väg och kanske fÃ¥r det Google att vakna till och vässa sin indexering av Worldcat. Att göra bibliotekens bokbestÃ¥nd mer synligt via söktjänsterna är strategiskt viktigt, men frÃ¥gan är om det rätta är att gÃ¥ med i OCLC’s gemenskap och göra bestÃ¥ndet synligt där eller hitta förbättrade tekniska metoder för att förmÃ¥ sökmotorerna att indexera och ranka biblioteksposter med samma energi som nätbokhandlarnas bokbestÃ¥nd. En dröm vore att en sökning i Yahoo, Google eller varför inte Gigablast pÃ¥: Vem älskar Yngve Frej Säffle bibliotek ger en träff i Säffles egen OPAC, som man kallar bibliotekskatalogerna pÃ¥ bibliotekariesprÃ¥k.

Läs mer om Yahoo och OCLC i Information Today

Gutenbergsprojektet nu uppe i tio tusen gratis eböcker

11 November 2003 av Lars VÃ¥ge

Arbetet med vad som skulle bli det kända Project Gutenberg började för över trettio år sedan. I förra veckan meddelade man via pressmeddelandetjänsten Ascribe att man nu digitaliserat 10 000 böcker som går att ladda ner gratis. Det blev lagtexten Magna Charta som blev den tiotusende boken. I december kommer man att fira händelsen med många aktiviteter i San Francisco-området. Vi som sitter här hemma kan roa oss t.ex. med Gutenbergsprojektets Best of CD med över 600 boktitlar. Om du hör till de som köpt en av de allt billigare dvd-brännarna kan du plocka ner en DVD-imagefil innehållande hela 9500 böcker! Alla böckerna är i vanligt textformat som kan läsas av den mest antikverade hård- och mjukvara och passar naturligtvis också hand- och fickdatorer. Om man vill delta i projektet kan man bli korrekturläsare på deltid. Då registrerar man sig på The Distributed Proofreader och läser så många sidor man hinner med när man hinner. Om många hjälps åt går det fortare. Det är klart att det kanske är allra trevligast att läsa klassiker i bokform men ska man ta sig igenom t.ex. James Joyce Ulysses eller Tolstojs Krig och fred kan det måhända vara skönt att slippa att hålla i tegelstenen ifråga där man ligger i soffan.

Bloggtoppen.se

Blogglista.se

Global Voices Online - The world is talking. Are you listening?

Creeper

Nowhere North

↑ Grab this Headline Animator



iselid info

↑ Grab this Headline Animator