Arkiv för kategorin ‘Faktasöktjänster och databaser’

Klotter på Wikipedia uppmärksammat av Travronden

9 Oktober 2007 av Lars Iselid

Det finns många exempel under Wikipedias historia på s.k. klotter när det gäller uppslagsord för biografier. Den siste i raden av drabbade, som uppmärksammats av Travronden, är travkusken Lutfi Kolgjini som fick följande beskrivning 18 september:

“Som kusk har han för länge sedan visat sin begränsning då det nästan alltid “kokar över” under hjälmen då det vankas travlopp. Lutfi har även en benägenhet att alltid döma ut underlaget på de travbanor han besöker. Det sägs att han kan få en traktor att galoppera…”

Sidan är dock återställd. Ett av de mest omtalade klottren är det som hände journalisten John Seigenthaler, Sr. när han anklagades för att vara inblandad i mordet på John F. Kennedy. Det lär inte vara sista gången klotter upptäcks i biografier. I fallet Lutfi var det ju tydligt “klotter”, men i andra fall när det gäller ändringar eller om man vill kalla det “klotter” i biografier kan de vara betydligt mer sofistikerade. Ett bra exempel var när Adam Curry ändrade i uppslagsordet Podcasting.

Wikidashboard visualiserar informationsflödet i Wikipedia

23 September 2007 av Lars Iselid

Om man bl.a. vill se vem (användare, IP-nr) som har ändrat ett uppslagsord i Wikipedia och i vilket omfattning (i %) kan man använda sig av Wikidashboard från Palo Alto Research Center. Här har du deras FAQ och här har du deras blogg. Wikidashboard påstår sig: “Providing social transparency to Wikipedia”.

Låt oss titta på t.ex. uppslagsordet för konstnären Chaim Soutine via Wikidashboard. I en visuell graf strax ovanför uppslagsordet kan vi se de mest aktiva wikipedianerna med IP-nr och användare. Om man klickar på användaren kan man se vilka mer uppdateringar samma användare gjort. Till höger om användaren kan man se hur många ändringar respektive wikipedian gjort och en procentsiffra över totalen av alla ändringar. Klickar man på denna information kan man få upp alla ändringar för just denna användare.

Ytterligare längre bort till höger kan se en graf över ändringsfrekvensen över tiden för respektive användare. Om man väljer en tidpunkt i grafen och klickar högst upp kommer man till editeringshistoriken för just den tidpunkten. Från Wikidashboard FAQ finns en bra bild som förklarar funktionerna.

Först Wikiscanner och nu Wikidashboard. Båda utmärkta utvärderingsverktyg för den som vill dyka djupare i hur kunskapen skapas i Wikipedia.

Jag kan inte låta bli att citera en inte helt okänd TV-figur från amerikanska NBC’s version av “The office”, nämligen Michael Scott (brittisk motsvarighet David Brent), som enligt bloggen Newcommbiz påstås i femte avsnittet sagt följande:

“Wikipedia is the best thing ever. Anyone in the world, can write anything they want about any subject. So you know you are getting the best possible information.”

Gränsen mellan ironi och sanning kan ibland vara hårfin.

New York Times artikelarkiv delvis gratis

19 September 2007 av Lars Iselid

Att på ett enkelt och kostnadseffektivt sätt rekvirera artiklar från utländska nyhetstidningar har alltid varit ett mer eller mindre komplicerat projekt för biblioteken när låntagarna efterfrågat detta. Därför bockar och niger man varje gång det lanseras tjänster på Nätet som underlättar detta. New York Times annonserade i veckan att de släpper stora delar av sitt arkiv gratis. Enligt AFP via Yahoo News rör det sig om följande:

Now, the entire site will be accessible for free, including archives from 1987 to the present as well as those from 1851 to 1922. Some charges will remain for archival work between 1923 to 1986, and some will be free, it said.

Tydligen har New York Times insett att man får in tillräckligt via annonser för att kunna släppa stora delar av arkivet fritt. Det är bara att hoppas att fler större aktörer inser att gratis kan innebära trafik=annonser=pengar. Jag söker på aids och New York Times i Google News Archive som visar att artikeln “Ignored AIDS Drug Shows Promise in Small Tests” skulle kosta 4,95 USD att rekvirera:

New York Times

…men klickar man på länken är den gratis. Tack för det, Old Grey Lady! Undrar när Google News också upptäcker detta ;-)

Nya funktioner och ny design i Uppsatser.se

14 September 2007 av Lars Iselid

Ted Valentins webbplats Uppsatser.se har fräschats upp ytterligare. Designen är mer koncentrerad och sparsmakad än tidigare, men framför allt har man lagt till ett avancerat sökformulär. Formuläret är detsamma som i Libris Uppsök.

Uppsatser.se har också lagt till en bevakningsfunktion där man kan få påminnelser via e-post när nya uppsatser skrivs i det ämne man är intresserad av. Tyvärr finns ingen möjlighet att bläddra sig fram till nyckelorden i det avancerade sökformuläret (t.ex. via index), utan man måste gissa sig fram genom att skriva in ett nyckelord. De breda ämneskategorierna går naturligtvis att välja men det funkar inte på mer preciserade termer.

Man har också lagt till en uppsatsguide som säkert kommer att användas av många studenter som undrar hur man mer formellt går till väga för att skriva uppsats, men det skulle vara intressant att veta vem som skrivit texten. Är det Ted själv eller är den norpad, remixad eller köpt från annat ställe?

Tillkommit har också en lista över exjobbförslag hämtade från Nationella Exjobb-poolen.

Ted meddelar också att Uppsatser.se har 70.000 unika besökare i veckan. Hur många unika besökare har månde Uppsök? Kanske kan Uppsatser.se sporra Libris att fräscha upp sin tjänst uppsök ytterligare. Viss uppfräschning kommer i och med att Libris webbsök beta går skarpt, förhoppningsvis innan jul.

Wikiscanner bevakar ändringar i Wikipedia

30 Augusti 2007 av Lars Iselid

14 august lanserade den amerikanske hackaren Virgil Griffith bevakningstjänsten Wikiscanner som länkar ihop anonyma ändringar i Wikipedia med organisationer, myndigheter, företag etc. via IP-igenkänning. Ändringshistoriken för Wikipedia-artiklar finns naturligtvis fritt på Wikipedia.org, men Virgil har skapat en tjänst som gör det lättare sökbart.

Man kan söka på organisationens namn, plats, IP range och förvalda organisationsnamn. Wikiscanner söker mot 34,417,493 ändringar i wikipedia från 7 february 2002 till 4 augusti.

Wired har också en lista över spektakulära ändringar i Wikipedia av olika organisationer och företag som de kallar Wikidgame, där man länkar vidare till Wikiscanner.
Exempelvis: “Israelian Embassy makes dead palestinians disappear“. Man kan också anmäla till Wired egna intressanta Wikipedia-ändringar som man hittar.

Lanseringen av Wikiscanner har på kort tid skapat en ny uppblossad debatt om Wikipedias vara eller icke vara. Var och varannan journalist hänvisar idag till Wikipedia. En sökning på källa:wikipedia på Eniros nyhetssök avslöjar en del. T.ex. när TV4 30 juli skriver om “Fakta: Ingmar Bergman” hänvisar man enbart till Wikipedia. Det finns naturligtvis inget exakt fel eller rätt i detta. I många fall är Wikipedia mycket mer djupgående och samtidigt intressant spekulerande. Men många flagranta exempel på felaktigehter finns också, särskilt i personers biografier. Men detta eviga källhänvisande till wikipedia i pressen tror jag snarare visar på en mentalitet på dagens tidnigsredaktioner där man lider under tidspress och då ligger Wikipedia “närmare” än NE, dvs. gratis på nätet.

I TV4:s fall borde man kunna hänvisa både till wikipedia och NE eller åtminstone både till Wikipedia och Ingermarbergman.se (som nog anses som minst likvärdig, om än inte mer pålitlig än både Wikipedia och NE). Det handlar om att komma ifrån det slentrianmässiga användandet av enbart en källa som är en journalistisk odygd.

Visst är inte heller NE utan fel och NE speglar oftast vad en expert anser och inte som med Wikipedia: förhoppningsvis några experter och många entusiaster. Att NE inte alltid lyckas visar detta blogginläg från Lotten Bergman: Wikipedia och NE i kökets mörker.

Exalead ger sig in i sökning av vetenskapliga artiklar

18 Juli 2007 av Lars Våge

Den franska sökmotorn Exalead ska också börja indexera vetenskapliga artiklar liksom söktjänster som t.ex. Scirus, Google Scholar och Windows Live Academic. Det är L’Institut de l’Information Scientifique et Techniques databas med 13 miljoner artiklar på engelska, franska, italienska och spanska som framöver kommer att bli sökbar via Exalead.

Om man läser Exaleads blogg får man nästan intrycket att man skulle få tillgång till själva artiklarna också. Så är det nu inte vilket man lätt konstaterar om man tittar på INISTs eget pressmeddelande. Det är alltså bara de bibliografiska posterna, dvs referenserna som man kommer åt. Det ska trots allt bli intressant att se hur Exaleads verktyg för modifiering av sökningar och sortering av träffar fungerar på det här materialet.

En annan Exalead-nyhet är att det nyligen blev möjligt att söka i Exalead inifrån Netvibes. Det här är ju min favorit bland webb-baserade RSS-läsare m.m. så jag blir ju glad för det i alla fall. Om du är Netvibes-användare så är vägen Add content->Widgets->Search->Web Search. I rutan du får upp klicka på pilen vid den förvalda sökmotorn (förmodligen Google) och välj Manage Search Engines så får du möjlighet att välja Exalead.

Vad heter sökmotor på de andra europeiska språken?

1 Juli 2007 av Lars Våge

Nu är det semestertider och vi bloggare slår också av på takten. Inte så många djupgående analyser men kanske lite praktiska tips kan det bli så här under juli. Vi börjar med en ordsökmotor eller översättningstjänst för begrepp. Den här borde jag ha känt till för länge sedan men det krävdes en artikel på den tyska sökbloggen @-web för att jag skulle få upp ögonen.

Inter Active Terminology for Europe eller kort och gott IATE är en söktjänst med vilken man kan mata in ett ord eller begrepp och få reda på vad det heter på andra europeiska språk. Det finns 23 språk sammanlagt men det är sällan att man får träff på alla. IATE är en centraliserad resurs för EU:s olika institutioner och är tänkt att vara ett översättningsstöd. 1,4 miljoner ord eller begrepp finns inlagda med uppgifter om vad de heter på olika språk. Vad jag kan förstå har IATE funnits sedan 2004 men projektet påbörjades redan 1999.

När man söker i IATE ska man ange vilket språk man utgår ifrån och, om man vill, vilka språk man vill ha svar på. Man kan också begränsa sökningen till en tematisk domän (se EU:s thesaurus EUROVOC) och ange om sökuttrycket är en fras, en förkortning eller en term. Jag sökte på sökmotor på svenska och fick veta vad det heter på nio andra språk. “Motor de busca” heter det t.ex. på portugisiska och “motor di ricerca” på italienska. På vilket språk det heter “hakumoottori” tänker jag inte berätta.

Pipl hittar information om personer

30 Maj 2007 av Lars Iselid

PiplPipl heter en nyligen lanserad sökmotor som hittar information om dig och andra människor genom att söka igenom webbsidor på nätet. Vi har ju sedan tidigare söktjänsten Zoominfo som gör liknande saker. Pipl är i motsats till Zoominfo väldigt Google-likt i sin presentation av sökresultatet.

Pipl hävdar att de kan hitta information från djupa webben som inte Google och andra sökmotorer kan. När jag söker på mitt eget namn får jag som första träff mitt MySpace-konto med en liten ikon i form av en snöflinga som indikerar att träffen kommer från “Deep web page, cannot be found on regular search engines”. En sökning på både Google och Yahoo visar att det stämmer. Däremot hittar inte Pipl, men både Google och Yahoo, mitt konto på Flickr fastän Pipl hävdar att de indexerar Flickr.

Under den första träffen får jag träffar från olika webbsidor där det finns biografisk information om mig som Pipl extraherar och visar några rader från. Sedan kommer träffar från Zoominfo via A9, från Linkedin, träffar på mitt namn från Google Scholar, Google Groups, Google Blogsearch och Icerocket blog posts. Därefter kommer ytterligare webbträffar som även de stora sökmotorerna har indexerat.

Samma sökning på min kompanjon Lars Våge ger inga träffar från djupa webben men däremot visas texten från Search Engine Wath då han blev omnämnd tack vare ett översatt blogginlägg om Quaero på Pandia. Zoominfo ger betydligt mer biografisk information om Våge än Pipl.

Om vi provar ett mer vanligt namn än Våge och Iselid och testar sökexperten Gary Price. Quick Facts ger biografisk information till den Gary Price vi söker. Om det hade varit någon annan Gary Price hade vi kunnat leta efter namnar under Contact Details som hämtar adress- och telefoninformation från Yahoo People och Infospace. Under Publications och Public records får Pipl desto svårare att särskilja mellan olika Gary Price. Här lyckas Zoominfo betydligt bättre. Nu hör det ju till saken att den Gary Price vi söker förmodligen är den mesta omskrivna av alla Gary Price på internet, vilket gör det enklare.

Pipl söker mer spritt och gissar sig fram, men en av fördelarna är att den anstränger sig mer för att hitta personers användarkonton än vad Zoominfo gör. Gör de då skäl för sin slogan:”The most comprehensive people search on the web”. Tja, delvis men inte alltid den mest organiserade sökningen på nätet. Vi kan absolut rekommendera både Pipl och Zoominfo för att hitta personinformation istället för att bara tokgoogla.

Kunde inte låta bli att testa följande frågeställningar i Brainboost: Who is Lars Våge?, Who is Lars Iselid?, Who is Gary Price? Fungerar riktigt bra förutom att Brainboost inte klarar å:et i Våge. Ajabaja, Brainboost!!

Varje djur- och växtart får en egen webbsida

12 Maj 2007 av Lars Våge

EOLI onsdags gick det officiella startskottet för ett fantastiskt projekt kallat The Encyclopedia of Life. Webbplatsen EOL ska inom tio år ha en sida för varje känd djur- och växtart. Initiativet har tagits av ett flertal amerikanska organisationer i samarbete som Smithsonian Institute, Harvarduniversitetet och Chicago’s Field Museum of Natural History. Även brittiska institutioner som Natural History Museum och The Royal Botanical Gardens är med på resan från början. Fler partners lär säkerligen dyka upp framöver.

Biologen James Edwards som är projektledare säger i pressmeddelandet att: “The Encyclopedia of Life will provide valuable biodiversity and conservation information to anyone, anywhere, at any time”. Det tycker jag låter väldigt attraktivt för t.ex. utbildningsändamål. Man kan också tänka sig att EOL kan bli ett politiskt verktyg. Om det finns en klar och tydlig dokumentation på nätet av hotade arter och vilken deras hotade miljö är kan det skapa incitament till påtryckningar på regeringar och företag som bedriver verksamhet som hotar den biologiska mångfalden.

Varje art ska alltså få en egen webbsida med information i form av text, kartor, bild, ljud och video beroende på vad som finns tillgängligt. EOL ska naturligtvis byggas på vetenskaplig grund och många forskare världen över kommer att bidra. Det kommer också att vara möjligt för vem som helst att bidra genom att webbplatsen ska fungera som en slags modererad wiki.

Hur finansieras ett sådant här jätteprojekt? Encyclopedia of Life har lyckan att få ekonomiska bidrag från två penningstinna amerikanska stiftelser, MacArthur Foundation och Sloan Foundation. Den förstnämnda har donerat 10 miljoner dollar och den andra 2,5 miljoner dollar till projektet. Arbetet med att skanna in viktiga publikationer och data påbörjades redan i januari 2006 men tack vare de generösa bidragen har takten nu ökat. Detta görs av ett konsortium kallat Biodiversity Heritage Library som består av tio av de största naturhistoriska och botaniska biblioteken i USA och England.

När kan vi vänta oss att EOL har ett innehåll att erbjuda Internetanvändarna då? Enligt projektets FAQ ska färdiga artsidor börja läggas ut under 2008 men att genomföra hela projektet menar man kan ta tio år. Redan nu finns det demosidor för ett par arter som ger en försmak av hur EOL kommer att se ut. Jag tycker att det ser mycket bra ut, ta gärna en titt på demosidan för isbjörnen eller den nyligen upptäckta yetikrabban. Det finns också en informationsvideo om EOL på YouTube.

Fotnot: Minnesgoda läsare kommer kanske ihåg att vi för fyra år sedan skrev om projektet ARKive. Det är en text- och mediedatabas och söktjänst för information om utrotningshotade arter. De som jobbar med ARKive kommer också att aktivt delta i uppbyggandet av The Encyclopedia of Life.

Sök i Wikipedia med Exaleads gränssnitt

14 April 2007 av Lars Våge

Igår fredagen den 13:e lanserade den franska söktjänsten Exalead en betaversion av sökning mot webbencyklopedin Wikipedia. Hoppas att det går bra med denna trots det illa valda datumet. Jag tycker ju bra om Exaleads gränssnitt med Previews av träffarna och stora möjligigheter att göra begränsningar. I den nya Wikipedia-sökningen är rutan till höger som heter Narrow your search lite annorlunda mot i de andra sökningarna i Exalead. Rutan utgörs nämligen av ett sånt där taggmoln som har varit så populärt sista året.

Exaleads Wikipedia-taggmoln är ganska användbart tycker jag, vilket är mer än vad man kan säga om en del andra taggmoln. Överst visas flaggor som symboliserar begränsningar till engelska, tyska, franska, italienska, spanska och holländska artiklar. Därunder kommer det egentliga taggmolnet där taggarna med störst bokstäver är de som fångar flest träffar. I det här taggmolnet har taggarna olika färger vilket är ganska ovanligt. Färgerna symboliserar följande: rödbrunt - kategorier, mörkblått - relaterade termer, orange - personer, ljusblått - geografiska namn och grått - organisationer.

Under varje träff på en artikel i Wikipedia visas de kategorier som är associerade med artikeln och träffar på personer som är omnämnda i artikeln. Förutom detta visas även länkar till organisationer och geografiska namn som är knutna till artikeln. För det sistnämnda måste man aktivera full visning genom att klicka på ikonen längst till höger vid rubriken View högt upp på träfflistan. Med dessa ikoner kan man också välja ett tråkigt Google-liknande utseende på träfflistan utan Preview-bilderna av webbplatserna men varför skulle man vilja det?

Däremot kan man se att det inte alltid fungerar perfekt med Exaleads urskiljande av vad som är geografiska namn. Söker man på Eric Dolphy t.ex. och kikar bland träffarna så hittar man några fel. Ascension är en skiva med John Coltrane, Point of Departure en med Andrew Hill och Gongs East en med Chico Hamilton - inte geografiska platser. Men det är bara enstaka missar man hittar.

I Exaleads Wikipeidia-sökning finns flera av de avancerade sökfunktioner som finns i vanliga Exalead-sökmotorn men som saknas i Google, Yahoo och Microsofts sökmotorer. Det jag menar är sökning med närhetsoperatorn NEAR, trunkering av ord med asterisk och möjlighet att konstruera booleska sökuttryck med nästlade parenteser. Värdefullast av dessa tycker jag närhetssökningen är. Vad har man för nytta av träffar där sökorden kanske står i helt olika språkliga och innehållsmässiga sammanhang?

Bloggtoppen.se

Blogglista.se

Global Voices Online - The world is talking. Are you listening?

Creeper

Nowhere North

↑ Grab this Headline Animator



iselid info

↑ Grab this Headline Animator