Arkiv för kategorin ‘Encyklopedier’

Varje djur- och växtart får en egen webbsida

12 Maj 2007 av Lars Våge

EOLI onsdags gick det officiella startskottet för ett fantastiskt projekt kallat The Encyclopedia of Life. Webbplatsen EOL ska inom tio år ha en sida för varje känd djur- och växtart. Initiativet har tagits av ett flertal amerikanska organisationer i samarbete som Smithsonian Institute, Harvarduniversitetet och Chicago’s Field Museum of Natural History. Även brittiska institutioner som Natural History Museum och The Royal Botanical Gardens är med på resan från början. Fler partners lär säkerligen dyka upp framöver.

Biologen James Edwards som är projektledare säger i pressmeddelandet att: “The Encyclopedia of Life will provide valuable biodiversity and conservation information to anyone, anywhere, at any time”. Det tycker jag låter väldigt attraktivt för t.ex. utbildningsändamål. Man kan också tänka sig att EOL kan bli ett politiskt verktyg. Om det finns en klar och tydlig dokumentation på nätet av hotade arter och vilken deras hotade miljö är kan det skapa incitament till påtryckningar på regeringar och företag som bedriver verksamhet som hotar den biologiska mångfalden.

Varje art ska alltså få en egen webbsida med information i form av text, kartor, bild, ljud och video beroende på vad som finns tillgängligt. EOL ska naturligtvis byggas på vetenskaplig grund och många forskare världen över kommer att bidra. Det kommer också att vara möjligt för vem som helst att bidra genom att webbplatsen ska fungera som en slags modererad wiki.

Hur finansieras ett sådant här jätteprojekt? Encyclopedia of Life har lyckan att få ekonomiska bidrag från två penningstinna amerikanska stiftelser, MacArthur Foundation och Sloan Foundation. Den förstnämnda har donerat 10 miljoner dollar och den andra 2,5 miljoner dollar till projektet. Arbetet med att skanna in viktiga publikationer och data påbörjades redan i januari 2006 men tack vare de generösa bidragen har takten nu ökat. Detta görs av ett konsortium kallat Biodiversity Heritage Library som består av tio av de största naturhistoriska och botaniska biblioteken i USA och England.

När kan vi vänta oss att EOL har ett innehåll att erbjuda Internetanvändarna då? Enligt projektets FAQ ska färdiga artsidor börja läggas ut under 2008 men att genomföra hela projektet menar man kan ta tio år. Redan nu finns det demosidor för ett par arter som ger en försmak av hur EOL kommer att se ut. Jag tycker att det ser mycket bra ut, ta gärna en titt på demosidan för isbjörnen eller den nyligen upptäckta yetikrabban. Det finns också en informationsvideo om EOL på YouTube.

Fotnot: Minnesgoda läsare kommer kanske ihåg att vi för fyra år sedan skrev om projektet ARKive. Det är en text- och mediedatabas och söktjänst för information om utrotningshotade arter. De som jobbar med ARKive kommer också att aktivt delta i uppbyggandet av The Encyclopedia of Life.

Sök i Wikipedia med Exaleads gränssnitt

14 April 2007 av Lars Våge

Igår fredagen den 13:e lanserade den franska söktjänsten Exalead en betaversion av sökning mot webbencyklopedin Wikipedia. Hoppas att det går bra med denna trots det illa valda datumet. Jag tycker ju bra om Exaleads gränssnitt med Previews av träffarna och stora möjligigheter att göra begränsningar. I den nya Wikipedia-sökningen är rutan till höger som heter Narrow your search lite annorlunda mot i de andra sökningarna i Exalead. Rutan utgörs nämligen av ett sånt där taggmoln som har varit så populärt sista året.

Exaleads Wikipedia-taggmoln är ganska användbart tycker jag, vilket är mer än vad man kan säga om en del andra taggmoln. Överst visas flaggor som symboliserar begränsningar till engelska, tyska, franska, italienska, spanska och holländska artiklar. Därunder kommer det egentliga taggmolnet där taggarna med störst bokstäver är de som fångar flest träffar. I det här taggmolnet har taggarna olika färger vilket är ganska ovanligt. Färgerna symboliserar följande: rödbrunt - kategorier, mörkblått - relaterade termer, orange - personer, ljusblått - geografiska namn och grått - organisationer.

Under varje träff på en artikel i Wikipedia visas de kategorier som är associerade med artikeln och träffar på personer som är omnämnda i artikeln. Förutom detta visas även länkar till organisationer och geografiska namn som är knutna till artikeln. För det sistnämnda måste man aktivera full visning genom att klicka på ikonen längst till höger vid rubriken View högt upp på träfflistan. Med dessa ikoner kan man också välja ett tråkigt Google-liknande utseende på träfflistan utan Preview-bilderna av webbplatserna men varför skulle man vilja det?

Däremot kan man se att det inte alltid fungerar perfekt med Exaleads urskiljande av vad som är geografiska namn. Söker man på Eric Dolphy t.ex. och kikar bland träffarna så hittar man några fel. Ascension är en skiva med John Coltrane, Point of Departure en med Andrew Hill och Gongs East en med Chico Hamilton - inte geografiska platser. Men det är bara enstaka missar man hittar.

I Exaleads Wikipeidia-sökning finns flera av de avancerade sökfunktioner som finns i vanliga Exalead-sökmotorn men som saknas i Google, Yahoo och Microsofts sökmotorer. Det jag menar är sökning med närhetsoperatorn NEAR, trunkering av ord med asterisk och möjlighet att konstruera booleska sökuttryck med nästlade parenteser. Värdefullast av dessa tycker jag närhetssökningen är. Vad har man för nytta av träffar där sökorden kanske står i helt olika språkliga och innehållsmässiga sammanhang?

Wikipedias grundare Jimmy Wales i Tokyo

9 Mars 2007 av Lars Iselid

Jimmy Wales Wikipedia“Uppfattningen att Google har ett övertag för att de har superba ‘raketforskare’ är nog lite föråldrad numer”, sa en av männen bakom Wikipedia, Jimmy Wales, på en konferens i Tokyo nyligen.

Genom bolaget Wikia har Jimmy Wales ambitionen att skapa en sökmotor som kan konkurrera med Googles och Yahoos s.k. svarta lådor, där de döljer rankingalgoritmen. Wales tror att användarna tillsammans kan skapa en bättre sökmotor, precis om användarna tillsammans skapat Wikipedia. Det kommer också att lösa problemet med manipuleringen av sökmotorer. Vi har ju tidigare varit inne på detta på Internetbrus när Jimmy Wales i december förra året i The Times lanserade sitt koncept på sökmotor under namnet Wikiasari.

Enligt Japan Times är Jimmy Wales på rundresa för att träffa Wikipedias communities. Nyligen var han i Indien och nästa månad bär det iväg till Australien. Stora ord om att bygga en Google-killer har vi hört tidigare. Frågan är om det någon gång kommer att vara realiserbart.

Japan Times aviserar att en längre intervju med Jimmy Wales kommer att publiceras i söndagens nummer. Förhoppningsvis på nätet då.

Google Video finns en föreläsning upplagd som han höll 31 Januari vid New York University där han bland annat häpnar över hur många i publiken som någon gång lagt in information på Wikipedia. Han slår också ett slag för open source.

På YouTube kan man se wikipediadokumentärer gjorda av Nick Hill m.fl. som han kallar “Truth and numbers”. Reserutten går via Peking, Seoul, Taipei, Djakarta för att sedan sluta upp med Jimmy Wales i Indien.

Här kan du se Jimmy Wales på resa i Varanasi när han jagas av apor.

Jimmy pratade i Chennai, Indien på en wiki camp-konferens och han sov två nätter hos indiern Kiruba Shankar som gjorde en 22 minuter lång podcast-intervju med Jimmy Wales. En Wiki Camp definieras så här (enligt Wikipedia, såklart):

“Wikicamp is all about harnessing and understanding the power of Wikis. It is a one day event aimed to bring together the best minds from the Wiki/Internet space to talk about issues, opportunities and what the future and evolution of this valuable tool looks like”.

Här finns också en annan variant av Jimmy Wales presentation i Chennai från Indiainteracts.com.

Här ser du också Jimmy Wales variant av Unconference. Till sist en förklaring av begreppet unconference från Wikipedia men via Answers.com som snyltar ;-) på Wikipedia. När får vi se det första exemplet på en unconference i Sverige? Eller har det redan skett?

Ny sökmotor för Wikipediasidor och sidor refererade i Wikipedia

17 Januari 2007 av Lars Våge

wikiseek
Under devisen “a better way to search Wikipedia” lanserades igår en ny sökmotor kallad Wikiseek. Denna sökmotor är tänkt att användas för att söka fram artiklar inne i Wikipedia och webbsidor som är länkade från artiklar i Wikipedia. På det här sättet menar man att den genomsnittliga kvaliteten på träffarna blir betydligt högre än i en generell sökmotor. Wikiseek har förresten inget att göra med Jimmy Wales sökmotorprojekt Wikiasari eller som det också kallas The Wikia Search Project som vi skrev om nyligen.

Wikiseek använder en kategoriseringsteknik utvecklad av Searchme för att ge tips på liknande eller mer precisa sökord. Dessa förslag syns som ett ordmoln mot en lite gråare bakgrund överst i träfflistan. Orden eller uttrycken hämtas från Wikipedias egen kategorisering eller användares taggar. I träfflistan är artiklar från själva Wikipedia markerade med stort W. De som bedömts som allra relevantast av dessa W-markerade är högst upp och har fått en ljusblå bakgrund för att framhäva dem. Alla Wikipedia-artiklar i träfflistorna har en Edit article-länk i sann Web2.0-anda.

Jimmy Wales planer för en Wiki-inspirerad sökmotor stavas Wikiasari

4 Januari 2007 av Lars Iselid

Lagom innan jul 23 december, dan före dopparedan, intervjuades en av grundarna till Wikipedia Jimmy Wales av The Times där han lanserade sina planer om en sökmotor inspirerad av wiki-tekniken. Sökmotorn går under namnet Wikiasari och drivs av Wales eget företag Wikia. Enligt The Times är Amazon en av finansiärerna.

Beteckningar som nämns är “people-powered” och “community-driven”. Liknande tankar som öppen relevansranking har vi skrivit om tidigare på Internetbrus där vi bl a nämnde Objectssearch och Openindex, men även Nutch.

Jimmy Wales säger en hel del intressanta saker i intervjun:

“Google is very good at many types of search, but in many instances it produces nothing but spam and useless crap. Try searching for the term ‘Tampa hotels’, for example, and you will not get any useful results.”

Jag är böjd att hålla med. Google är överraskande bra på att hitta guldkorn i stora mängder information men fortfarande finns det många specialisearde resurser som ger betydligt bättre svar på många frågor. Jimmy Wales menar också att så många lärt sig att manipulera Google att svarens kvalitet sänks. Han menar att algoritmisk styrd stökning är dömd att misslyckas.

“Essentially, if you consider one of the basic tasks of a search engine, it is to make a decision: ‘this page is good, this page sucks’. Computers are notoriously bad at making such judgments, so algorithmic search has to go about it in a roundabout way”.

Han menar följdaktligen att Wikia har svaret på problemet:

“But we have a really great method for doing that ourselves. We just look at the page. It usually only takes a second to figure out if the page is good, so the key here is building a community of trust that can do that.”

Visst är det en intressant tanke (även om den inte är helt ny), men att denna “community of trust” bara ska behöva använda en sekund för att avgöra om en sida är bra eller dålig är en naiv tanke. Det finns ju sökmotorer som redan har låtit användare bedöma om en webbsida i en träfflista är bra eller dålig och någon succé har inte rapporterats.

Jimmy Wales har också intervjuats av Danny Sullivan på Search Engine Land.

Jimmy Wales hävdar i intervjun, i motsats till vad The Times artikel påstår, att Amazons inblandning i Wikiasari enbart är finansiell. Intresssant är att de hävdar att Wikiasari kommer att visas upp redan under första kvartalet 2007 och att de använder Nucth och Lucene. Men han förtydligar:

“We’re not producing a Google killing search engine in three months”.

Vem hade trott det? Han menar också att andra som försökt med samma tankegångar om användarstyrd ranking som t ex Open Directory har varit för stängda. Han förklarar inte exakt hur användarna ska delta i rankingsystemet men påpekar att det är flera parametrar och att det inte enbart handlar om att bedöma länkar. Jimmy och Danny diskuterar vidare om bl a query refinement och jag tycker mig se en ansats från Jimmy där Wikiasari kanske kommer att låta användarna vara med och föreslå relaterade termer och liknande saker. Läs mer om hur Microsoft jobbade t ex med disambiguering i Danny Sullivans inlägg från oktober 2005. Disambiguering betyder attt man försöker förstå dubbeltydiga ords betydelse genom att se det i sin kontext. Är det en bok som man läser som åsyftas eller trädet bok. Ingen ny problematik med andra ord.

Danny frågar också om öppna relevankriterier verkligen är bra och Wales kontrar med att ha dolda relevanskriterier som man hoppas ingen kan avslöja inte är någon bättre lösning.

Sullivan skriver i sin slutsummering att han tror Wales undervärderar arbetet med att indexera webben och jag är böjd att hålla med. Däremot är han positiv till att se hur Wales kommer att bygga upp en pålitlig “användarbas” (eng. user community). Kanske bibliotekarierna ska vara en del av denna användarbas? Kanske man kan bygga flera olika användarbaser och välja olika när man vill sortera träffarna? Nu vill jag se vad bibliotekarierna tycker är bäst svar för denna fråga och nu vill jag se vad lärarna tycker och nu vill jag se vad sportjournalisterna tycker och rörmokarna, sjuksköterskorna? Grundproblemet är dock hur man får dessa användare att vara aktiva och att de mest aktiva är de mest pålitliga och mest kunniga. Kanske ska bibliotekarier mer och mer se som sitt samhällsuppdrag att bedöma information på Internet åt sina användare än att bara organisera böcker i en bokhylla? Visst görs det redan men det kanske måste tas till nästa nivå, vilket Jimmy Wales idéer kanske är ett prov på. Vi får se första steget senast 31 mars 2007 om han håller vad han lovar.

Baidupedia - censurerad kinesisk webbencyklopedi

16 Maj 2006 av Lars Våge

baidupediaDen dominerande kinesiska sökmotorn Baidu har lanserat en webbencyklopedi kallad Baidupedia. Namnet skall naturligtvis påminna om Wikipedia men uppenbarligen finns det skillnader i projekten. Enligt källor som FT, AFP, BBC och NewScientist ska det visserligen vara möjligt att som frivillig anmäla sig och skriva artiklar i Baidupedia men alla texter passerar genom ett filter där det kollas att de inte innehåller något som inte passar sig. NewScientist räknar upp följande som inte går för sig: “malicious evaluation of the current national system”, “attacks on government institutions”, “the promotion of a dispirited or negative view of life”. Man kan fråga sig vad som kan stoppas in under den sistnämnda formuleringen.

Generellt sett är det naturligtvis inget fel med en Wikipedia-liknande encyklopedi i Kina. Att de som ansvarar för tjänsten måste bedriva självcensur är inget konstigt, det måste alla som tillhandahåller tjänster via Internet i Kina. Därför reagerar åtminstone jag mer på att man ska ha “lånat” en hel del material från Wikipedia. I en artikel från den kinesiska nyhetsbyrån Xinhua bemöter en av cheferna på Baidu kritiken angående lånen med orden:

“the sharing of information is instrumental in the development and the continuity of knowledge.”

Will Moss, den västerländske bloggaren som kallar sig ImageThief, kommenterar mycket träffande:

“But usually the small matter of attribution is also considered important. If they’re unclear on the concept, perhaps they can look it up in an encyclopedia.”

Fast inte i Wikipedia förstås för den är blockerad i Kina sedan förra året.

Wikipedia inte långt efter Britannica i kvalitet enligt Nature

18 December 2005 av Lars Våge

Det har varit en dramatisk vecka för den fria webbencyklopedin Wikipedia. Det verkar dock som att projektet går stärkt ur de senaste händelserna. Tidigare i veckan har den person som förfalskat uppgifter angående Kennedymordet givit sig till känna. John Siegenthaler hade hittat i Wikipedia att han hade varit en trolig misstänkt i fallet. Detta anmälde han och Wikipedia plockade omedelbart bort uppgifterna. Men Wikipedia fick sig en rejäl törn och överväger nu att strama upp kontrollen. I USA Today frågade sig Siegenthaler vems sjuka hjärna som kokat ihop de här anklagelserna mot honom. Det visade sig vara Brian Chase i Nashville som hade velat göra ett practical joke. Enligt honom hade hade han ingen aning att Wikipedia var så använd världen över. Chase tog kontakt med Siegenthaler och bad om ursäkt för sitt tilltag.

I det senaste numret av den ärevördiga vetenskapliga tidskriften Nature publicerades en artikel där Wikipedia hade jämförts med den mest kända och statustyngda encyklopedin av alla nämligen Encyclopedia Britannica. Jag har inte läst artikeln än men enligt AFP så blev utfallet bara en knapp fördel Britannica. 42 artikelpar i varje encyklopedi skärskådades av ämnesexperter och Wikipedia gjorde verkligen oväntat bra ifrån sig. Åtta allvarliga fel (misinterpretations of important concepts) upptäcktes och dessa fördelades helt jämnt mellan encyklopedierna. Mindre fel som faktauppgifter, utelämnanden och missledande formuleringar fanns det 162 i Wikipedia och 123 i Britannica. Det blir ca 32% fördel Britannica vad gäller mindre fel, men alltså helt jämnt vad gäller allvarliga fel. Den viktigaste kritiken mot Wikipedia från forskarna var däremot att artiklarna var mindre väl strukturerade och ibland gav för mycket utrymme åt kontroversiella teorier.

Det mest frapperande är väl ändå att man i Nature talar om Wikipedia och Britannica i samma andetag. Är det då OK att citera Wikipedia? Till BusinessWeek har Wikipedias Jimmy Whales nyligen sagt: “Don’t quote us”, men å andra sidan tyckte han inte man skulle citera encyklopedier överhuvudtaget. Han tyckte att encyklopedier skulle ge “good, solid background information to inform your studies for a deeper level”. Det kan jag köpa.

Läs mer här:
Internet encyclopaedias go head to head (webbversion av Nature-artikeln)
Wikipedia becomes Internet force, faces crisis
Author of fake Wikipedia bio admits joke
Don’t quote us
Wikipedia rivals Encyclopaedia Britannica on science

Answers.com och folkbiblioteken i New York lanserar HomeworkNYC.org

12 December 2005 av Lars Iselid

Homework New York CityAnswers.com har i samarbete med New York Public Library, the Brooklyn Public Library and the Queens Public Library lanserat webbplatsen HomeworkNYC.org. Här kan man söka i Answers.com fria ordböcker och uppslagsverk. Här finns tjänster som miniräknare, fråga en bibliotekarie, ring en lärare, chatta med någon som hjälper dig med läxan, låna e-böcker och mycket annat. Det bästa av allt är dock att man integrerat bibliotekens alla betaldatabaser, t.ex. Academic search elite, Contemporary Authors, Gale Virtual Reference Library. För en del av tidigare nämnda tjänster och naturligtvis för att söka i betaldatabaser krävs lånekort vid något av de nämnda biblioteken. Det verkar däremot inte som det finns någon form av samsökning av betaldatabaserna.

Ett lovvärt initiativ som med rätt marknadsföring kan få googlande studenter i New York att upptäcka bibliotekets fantastiska resurser. Fler liknande webbplatser behövs även i Europa där man inte bara sammankopplar flera biblioteks bibliotekskataloger utan även databaser och e-böcker.

Det ska också nämnas att sedan augusti finns också Answers.com Teacher Toolkit.

Answers.com köper frågetjänsten Brainboost

7 December 2005 av Lars Iselid

Answers.comAnswers.com, tidigare Gurunet, har köpt frågetjänsten Brainboost med ambitionen att integrera söktjänsten i Answers egna produkter. Brainboost bygger sin sökmotor på natural language processing (NLP) och presenterar sökresultatet genom att extrahera korta utdrag från webbsidorna i själva träfflistan. Ungefär som är fallet i söksyntaxen define: i Google.

I motsats till Gary Price på Search Engine Watch har jag varit mycket positiv till Brainboost och tycker att det är den bästa sökmotorn hittills med ambitionen att vara en maskinell frågetjänst. Betydligt bättre än Ask Jeeves som en gång i tiden försökte sig på att vara en frågetjänst (vilket ju också hörs i namnet), men istället har Ask Jeeves utvecklats bl.a. genom uppköpet av Teoma till en fullfjädrad sökmotor.

Gary Price kritiserar Brainboosts urval av källor, vilket det ligger mycket sanning i, men genom att integrera tekniken från Brainboost på de källor Answers valt ut kan sammanslagningen bli en riktig hit. Skulle Answers sedan på ett effektivt sätt kunna koppla betalkällor (ungefär som tanken är med Yahoo Subscriptions) till Answers gränssnitt vore det ett utmärkt sätt att förbättra tjänsten och att även kunna finansiera Answers.com. Man ska dock komma ihåg att Answers.com bara inriktar sig på att svara på engelska från källor författade på det engelska språket? Får vi se en svensk mostvarighet någon gång månntro?

Gary Price exemplifierar också med frågor han inte får något bra svar på. Självklart får man inte bra svar på allt men förvånansvärt många bra svar får man på inte allt för svåra frågor (om vi bortser från källkritiken). T.ex. When did Frank Zappa die and Why? och Who invented the light bulb?

Läs mer om köpet i ett pressmeddelande från Answers.com.

Nya sökkällor i Answers.com

10 November 2005 av Lars Iselid

Answers.comAnswers.com, som är en söktjänst som integrerat flera olika faktabaserade källor (ordböcker, encyklopedier m.m.) i sin webbplats och metasöker dessa samtidigt, har nu lagt till ytterligare källor.

Answers.com har lagt till The Devil’s Dictionary som är en gammal ordbok som först publicerades i tidningsform mellan 1888 och 1906 och senare 1911 kom ut i bokform och har sedan kommit i fler versioner. Devil’s dictionary är inte en ordbok som håller sig till objektiv fakta utan snarare beskriver ord på ett cyniskt, subjektivt men samtidigt humoristiskt sätt. Vissa liknande ordböcker har snott konceptet och överfört det på nutida språkbruk t.ex. The Devil’s Dictionary X. Här har vi t.ex. beskrivningen av ordet Weaknesses (i Devil’s dictionary via Answers): “Certain primal powers of Tyrant Woman wherewith she holds dominion over the male of her species, binding him to the service of her will and paralyzing his rebellious energies”.
Man kan ju fråga sig varför Answers valt ut denna källa? För att roa eller förvirra?

Jacker är en annan källa som är detsamma som den tryckta källan av The Hacker’s dictionary och innehåller datatermer.

Answersnotes verkar vara Answers egna blandade faktaartiklar om olika ämnen, men tyvärr hittar jag inga uppgifter om vem som skrivit detta. Kanske är det någon därute som kan säga något mer ingående om dessa nya källor.

I övrigt är Answers.com en fantastisk källa får oss som vill ha fakta gratis men samtidigt vilka väga fakta från olika källor mot varandra. När får vi se en liknande söktjänst för svenska faktabaserade källor eller är de svenska källorna för få?

Bloggtoppen.se

Blogglista.se

Global Voices Online - The world is talking. Are you listening?

Creeper

Nowhere North

↑ Grab this Headline Animator



iselid info

↑ Grab this Headline Animator