Arkiv för kategorin ‘Wikipedia’

Lars Våge intervjuad i DIK-forum nr 9-2007

14 December 2007 av Lars Iselid

Min bloggarvän här på Internetbrus Lars Våge intervjuas i en artikel i senaste DIK-forum: “Research på Internet: Tre vanligaste misstagen” [PDF].

De tre vanligaste misstagen enligt Våge äro:

1. Googlefixering - många missar att det finns sökmotorer som är bättre lämpade för specifika ämnesområden än vad Google är.

2. Få känner fortfarande inte till RSS och dess betydelse som sökbevakare.

3. Varning för svenska Wikipedia som inte har nått upp till en kritisk mängd skribenter och redaktörer för att källkritiken ska fungera tillfredställande.

Jag läser just boken Cult of the Amateur av Andrew Keen som får mig att dra på smilbanden många gånger. Keen tar i så det bara sjunger av det när han kritiserar wikipedia, bloggar, användargenererat innehåll och annat kring web 2.0. Ibland har han en viss poäng i det han säger men allt för ofta lägger han mer krut på att vara dräpande än att vara nyanserad. Hans kritik mot Wikipedia är inte nådig:

“It’s the blind leading the blind - infinite monkeys providing infinite information for infinite readers, perpetuating the cycle of misinformation and ignorance”.

Men det ligger ändå något i den kritik Andrew Keen framför mot web 2.0:

“…the more self-created content that gets dumped onto the Internet, the harder it becomes to distinguish the good from the bad - and make money of any of it”.

Klotter på Wikipedia uppmärksammat av Travronden

9 Oktober 2007 av Lars Iselid

Det finns många exempel under Wikipedias historia på s.k. klotter när det gäller uppslagsord för biografier. Den siste i raden av drabbade, som uppmärksammats av Travronden, är travkusken Lutfi Kolgjini som fick följande beskrivning 18 september:

“Som kusk har han för länge sedan visat sin begränsning då det nästan alltid “kokar över” under hjälmen då det vankas travlopp. Lutfi har även en benägenhet att alltid döma ut underlaget på de travbanor han besöker. Det sägs att han kan få en traktor att galoppera…”

Sidan är dock återställd. Ett av de mest omtalade klottren är det som hände journalisten John Seigenthaler, Sr. när han anklagades för att vara inblandad i mordet på John F. Kennedy. Det lär inte vara sista gången klotter upptäcks i biografier. I fallet Lutfi var det ju tydligt “klotter”, men i andra fall när det gäller ändringar eller om man vill kalla det “klotter” i biografier kan de vara betydligt mer sofistikerade. Ett bra exempel var när Adam Curry ändrade i uppslagsordet Podcasting.

Wikidashboard visualiserar informationsflödet i Wikipedia

23 September 2007 av Lars Iselid

Om man bl.a. vill se vem (användare, IP-nr) som har ändrat ett uppslagsord i Wikipedia och i vilket omfattning (i %) kan man använda sig av Wikidashboard från Palo Alto Research Center. Här har du deras FAQ och här har du deras blogg. Wikidashboard påstår sig: “Providing social transparency to Wikipedia”.

Låt oss titta på t.ex. uppslagsordet för konstnären Chaim Soutine via Wikidashboard. I en visuell graf strax ovanför uppslagsordet kan vi se de mest aktiva wikipedianerna med IP-nr och användare. Om man klickar på användaren kan man se vilka mer uppdateringar samma användare gjort. Till höger om användaren kan man se hur många ändringar respektive wikipedian gjort och en procentsiffra över totalen av alla ändringar. Klickar man på denna information kan man få upp alla ändringar för just denna användare.

Ytterligare längre bort till höger kan se en graf över ändringsfrekvensen över tiden för respektive användare. Om man väljer en tidpunkt i grafen och klickar högst upp kommer man till editeringshistoriken för just den tidpunkten. Från Wikidashboard FAQ finns en bra bild som förklarar funktionerna.

Först Wikiscanner och nu Wikidashboard. Båda utmärkta utvärderingsverktyg för den som vill dyka djupare i hur kunskapen skapas i Wikipedia.

Jag kan inte låta bli att citera en inte helt okänd TV-figur från amerikanska NBC’s version av “The office”, nämligen Michael Scott (brittisk motsvarighet David Brent), som enligt bloggen Newcommbiz påstås i femte avsnittet sagt följande:

“Wikipedia is the best thing ever. Anyone in the world, can write anything they want about any subject. So you know you are getting the best possible information.”

Gränsen mellan ironi och sanning kan ibland vara hårfin.

Wikiscanner bevakar ändringar i Wikipedia

30 Augusti 2007 av Lars Iselid

14 august lanserade den amerikanske hackaren Virgil Griffith bevakningstjänsten Wikiscanner som länkar ihop anonyma ändringar i Wikipedia med organisationer, myndigheter, företag etc. via IP-igenkänning. Ändringshistoriken för Wikipedia-artiklar finns naturligtvis fritt på Wikipedia.org, men Virgil har skapat en tjänst som gör det lättare sökbart.

Man kan söka på organisationens namn, plats, IP range och förvalda organisationsnamn. Wikiscanner söker mot 34,417,493 ändringar i wikipedia från 7 february 2002 till 4 augusti.

Wired har också en lista över spektakulära ändringar i Wikipedia av olika organisationer och företag som de kallar Wikidgame, där man länkar vidare till Wikiscanner.
Exempelvis: “Israelian Embassy makes dead palestinians disappear“. Man kan också anmäla till Wired egna intressanta Wikipedia-ändringar som man hittar.

Lanseringen av Wikiscanner har på kort tid skapat en ny uppblossad debatt om Wikipedias vara eller icke vara. Var och varannan journalist hänvisar idag till Wikipedia. En sökning på källa:wikipedia på Eniros nyhetssök avslöjar en del. T.ex. när TV4 30 juli skriver om “Fakta: Ingmar Bergman” hänvisar man enbart till Wikipedia. Det finns naturligtvis inget exakt fel eller rätt i detta. I många fall är Wikipedia mycket mer djupgående och samtidigt intressant spekulerande. Men många flagranta exempel på felaktigehter finns också, särskilt i personers biografier. Men detta eviga källhänvisande till wikipedia i pressen tror jag snarare visar på en mentalitet på dagens tidnigsredaktioner där man lider under tidspress och då ligger Wikipedia “närmare” än NE, dvs. gratis på nätet.

I TV4:s fall borde man kunna hänvisa både till wikipedia och NE eller åtminstone både till Wikipedia och Ingermarbergman.se (som nog anses som minst likvärdig, om än inte mer pålitlig än både Wikipedia och NE). Det handlar om att komma ifrån det slentrianmässiga användandet av enbart en källa som är en journalistisk odygd.

Visst är inte heller NE utan fel och NE speglar oftast vad en expert anser och inte som med Wikipedia: förhoppningsvis några experter och många entusiaster. Att NE inte alltid lyckas visar detta blogginläg från Lotten Bergman: Wikipedia och NE i kökets mörker.

Sök i Wikipedia med Exaleads gränssnitt

14 April 2007 av Lars Våge

Igår fredagen den 13:e lanserade den franska söktjänsten Exalead en betaversion av sökning mot webbencyklopedin Wikipedia. Hoppas att det går bra med denna trots det illa valda datumet. Jag tycker ju bra om Exaleads gränssnitt med Previews av träffarna och stora möjligigheter att göra begränsningar. I den nya Wikipedia-sökningen är rutan till höger som heter Narrow your search lite annorlunda mot i de andra sökningarna i Exalead. Rutan utgörs nämligen av ett sånt där taggmoln som har varit så populärt sista året.

Exaleads Wikipedia-taggmoln är ganska användbart tycker jag, vilket är mer än vad man kan säga om en del andra taggmoln. Överst visas flaggor som symboliserar begränsningar till engelska, tyska, franska, italienska, spanska och holländska artiklar. Därunder kommer det egentliga taggmolnet där taggarna med störst bokstäver är de som fångar flest träffar. I det här taggmolnet har taggarna olika färger vilket är ganska ovanligt. Färgerna symboliserar följande: rödbrunt - kategorier, mörkblått - relaterade termer, orange - personer, ljusblått - geografiska namn och grått - organisationer.

Under varje träff på en artikel i Wikipedia visas de kategorier som är associerade med artikeln och träffar på personer som är omnämnda i artikeln. Förutom detta visas även länkar till organisationer och geografiska namn som är knutna till artikeln. För det sistnämnda måste man aktivera full visning genom att klicka på ikonen längst till höger vid rubriken View högt upp på träfflistan. Med dessa ikoner kan man också välja ett tråkigt Google-liknande utseende på träfflistan utan Preview-bilderna av webbplatserna men varför skulle man vilja det?

Däremot kan man se att det inte alltid fungerar perfekt med Exaleads urskiljande av vad som är geografiska namn. Söker man på Eric Dolphy t.ex. och kikar bland träffarna så hittar man några fel. Ascension är en skiva med John Coltrane, Point of Departure en med Andrew Hill och Gongs East en med Chico Hamilton - inte geografiska platser. Men det är bara enstaka missar man hittar.

I Exaleads Wikipeidia-sökning finns flera av de avancerade sökfunktioner som finns i vanliga Exalead-sökmotorn men som saknas i Google, Yahoo och Microsofts sökmotorer. Det jag menar är sökning med närhetsoperatorn NEAR, trunkering av ord med asterisk och möjlighet att konstruera booleska sökuttryck med nästlade parenteser. Värdefullast av dessa tycker jag närhetssökningen är. Vad har man för nytta av träffar där sökorden kanske står i helt olika språkliga och innehållsmässiga sammanhang?

Wikipedias grundare Jimmy Wales i Tokyo

9 Mars 2007 av Lars Iselid

Jimmy Wales Wikipedia“Uppfattningen att Google har ett övertag för att de har superba ‘raketforskare’ är nog lite föråldrad numer”, sa en av männen bakom Wikipedia, Jimmy Wales, på en konferens i Tokyo nyligen.

Genom bolaget Wikia har Jimmy Wales ambitionen att skapa en sökmotor som kan konkurrera med Googles och Yahoos s.k. svarta lådor, där de döljer rankingalgoritmen. Wales tror att användarna tillsammans kan skapa en bättre sökmotor, precis om användarna tillsammans skapat Wikipedia. Det kommer också att lösa problemet med manipuleringen av sökmotorer. Vi har ju tidigare varit inne på detta på Internetbrus när Jimmy Wales i december förra året i The Times lanserade sitt koncept på sökmotor under namnet Wikiasari.

Enligt Japan Times är Jimmy Wales på rundresa för att träffa Wikipedias communities. Nyligen var han i Indien och nästa månad bär det iväg till Australien. Stora ord om att bygga en Google-killer har vi hört tidigare. Frågan är om det någon gång kommer att vara realiserbart.

Japan Times aviserar att en längre intervju med Jimmy Wales kommer att publiceras i söndagens nummer. Förhoppningsvis på nätet då.

Google Video finns en föreläsning upplagd som han höll 31 Januari vid New York University där han bland annat häpnar över hur många i publiken som någon gång lagt in information på Wikipedia. Han slår också ett slag för open source.

På YouTube kan man se wikipediadokumentärer gjorda av Nick Hill m.fl. som han kallar “Truth and numbers”. Reserutten går via Peking, Seoul, Taipei, Djakarta för att sedan sluta upp med Jimmy Wales i Indien.

Här kan du se Jimmy Wales på resa i Varanasi när han jagas av apor.

Jimmy pratade i Chennai, Indien på en wiki camp-konferens och han sov två nätter hos indiern Kiruba Shankar som gjorde en 22 minuter lång podcast-intervju med Jimmy Wales. En Wiki Camp definieras så här (enligt Wikipedia, såklart):

“Wikicamp is all about harnessing and understanding the power of Wikis. It is a one day event aimed to bring together the best minds from the Wiki/Internet space to talk about issues, opportunities and what the future and evolution of this valuable tool looks like”.

Här finns också en annan variant av Jimmy Wales presentation i Chennai från Indiainteracts.com.

Här ser du också Jimmy Wales variant av Unconference. Till sist en förklaring av begreppet unconference från Wikipedia men via Answers.com som snyltar ;-) på Wikipedia. När får vi se det första exemplet på en unconference i Sverige? Eller har det redan skett?

Ny sökmotor för Wikipediasidor och sidor refererade i Wikipedia

17 Januari 2007 av Lars Våge

wikiseek
Under devisen “a better way to search Wikipedia” lanserades igår en ny sökmotor kallad Wikiseek. Denna sökmotor är tänkt att användas för att söka fram artiklar inne i Wikipedia och webbsidor som är länkade från artiklar i Wikipedia. På det här sättet menar man att den genomsnittliga kvaliteten på träffarna blir betydligt högre än i en generell sökmotor. Wikiseek har förresten inget att göra med Jimmy Wales sökmotorprojekt Wikiasari eller som det också kallas The Wikia Search Project som vi skrev om nyligen.

Wikiseek använder en kategoriseringsteknik utvecklad av Searchme för att ge tips på liknande eller mer precisa sökord. Dessa förslag syns som ett ordmoln mot en lite gråare bakgrund överst i träfflistan. Orden eller uttrycken hämtas från Wikipedias egen kategorisering eller användares taggar. I träfflistan är artiklar från själva Wikipedia markerade med stort W. De som bedömts som allra relevantast av dessa W-markerade är högst upp och har fått en ljusblå bakgrund för att framhäva dem. Alla Wikipedia-artiklar i träfflistorna har en Edit article-länk i sann Web2.0-anda.

Jimmy Wales planer för en Wiki-inspirerad sökmotor stavas Wikiasari

4 Januari 2007 av Lars Iselid

Lagom innan jul 23 december, dan före dopparedan, intervjuades en av grundarna till Wikipedia Jimmy Wales av The Times där han lanserade sina planer om en sökmotor inspirerad av wiki-tekniken. Sökmotorn går under namnet Wikiasari och drivs av Wales eget företag Wikia. Enligt The Times är Amazon en av finansiärerna.

Beteckningar som nämns är “people-powered” och “community-driven”. Liknande tankar som öppen relevansranking har vi skrivit om tidigare på Internetbrus där vi bl a nämnde Objectssearch och Openindex, men även Nutch.

Jimmy Wales säger en hel del intressanta saker i intervjun:

“Google is very good at many types of search, but in many instances it produces nothing but spam and useless crap. Try searching for the term ‘Tampa hotels’, for example, and you will not get any useful results.”

Jag är böjd att hålla med. Google är överraskande bra på att hitta guldkorn i stora mängder information men fortfarande finns det många specialisearde resurser som ger betydligt bättre svar på många frågor. Jimmy Wales menar också att så många lärt sig att manipulera Google att svarens kvalitet sänks. Han menar att algoritmisk styrd stökning är dömd att misslyckas.

“Essentially, if you consider one of the basic tasks of a search engine, it is to make a decision: ‘this page is good, this page sucks’. Computers are notoriously bad at making such judgments, so algorithmic search has to go about it in a roundabout way”.

Han menar följdaktligen att Wikia har svaret på problemet:

“But we have a really great method for doing that ourselves. We just look at the page. It usually only takes a second to figure out if the page is good, so the key here is building a community of trust that can do that.”

Visst är det en intressant tanke (även om den inte är helt ny), men att denna “community of trust” bara ska behöva använda en sekund för att avgöra om en sida är bra eller dålig är en naiv tanke. Det finns ju sökmotorer som redan har låtit användare bedöma om en webbsida i en träfflista är bra eller dålig och någon succé har inte rapporterats.

Jimmy Wales har också intervjuats av Danny Sullivan på Search Engine Land.

Jimmy Wales hävdar i intervjun, i motsats till vad The Times artikel påstår, att Amazons inblandning i Wikiasari enbart är finansiell. Intresssant är att de hävdar att Wikiasari kommer att visas upp redan under första kvartalet 2007 och att de använder Nucth och Lucene. Men han förtydligar:

“We’re not producing a Google killing search engine in three months”.

Vem hade trott det? Han menar också att andra som försökt med samma tankegångar om användarstyrd ranking som t ex Open Directory har varit för stängda. Han förklarar inte exakt hur användarna ska delta i rankingsystemet men påpekar att det är flera parametrar och att det inte enbart handlar om att bedöma länkar. Jimmy och Danny diskuterar vidare om bl a query refinement och jag tycker mig se en ansats från Jimmy där Wikiasari kanske kommer att låta användarna vara med och föreslå relaterade termer och liknande saker. Läs mer om hur Microsoft jobbade t ex med disambiguering i Danny Sullivans inlägg från oktober 2005. Disambiguering betyder attt man försöker förstå dubbeltydiga ords betydelse genom att se det i sin kontext. Är det en bok som man läser som åsyftas eller trädet bok. Ingen ny problematik med andra ord.

Danny frågar också om öppna relevankriterier verkligen är bra och Wales kontrar med att ha dolda relevanskriterier som man hoppas ingen kan avslöja inte är någon bättre lösning.

Sullivan skriver i sin slutsummering att han tror Wales undervärderar arbetet med att indexera webben och jag är böjd att hålla med. Däremot är han positiv till att se hur Wales kommer att bygga upp en pålitlig “användarbas” (eng. user community). Kanske bibliotekarierna ska vara en del av denna användarbas? Kanske man kan bygga flera olika användarbaser och välja olika när man vill sortera träffarna? Nu vill jag se vad bibliotekarierna tycker är bäst svar för denna fråga och nu vill jag se vad lärarna tycker och nu vill jag se vad sportjournalisterna tycker och rörmokarna, sjuksköterskorna? Grundproblemet är dock hur man får dessa användare att vara aktiva och att de mest aktiva är de mest pålitliga och mest kunniga. Kanske ska bibliotekarier mer och mer se som sitt samhällsuppdrag att bedöma information på Internet åt sina användare än att bara organisera böcker i en bokhylla? Visst görs det redan men det kanske måste tas till nästa nivå, vilket Jimmy Wales idéer kanske är ett prov på. Vi får se första steget senast 31 mars 2007 om han håller vad han lovar.

Wikipedia inte långt efter Britannica i kvalitet enligt Nature

18 December 2005 av Lars Våge

Det har varit en dramatisk vecka för den fria webbencyklopedin Wikipedia. Det verkar dock som att projektet går stärkt ur de senaste händelserna. Tidigare i veckan har den person som förfalskat uppgifter angående Kennedymordet givit sig till känna. John Siegenthaler hade hittat i Wikipedia att han hade varit en trolig misstänkt i fallet. Detta anmälde han och Wikipedia plockade omedelbart bort uppgifterna. Men Wikipedia fick sig en rejäl törn och överväger nu att strama upp kontrollen. I USA Today frågade sig Siegenthaler vems sjuka hjärna som kokat ihop de här anklagelserna mot honom. Det visade sig vara Brian Chase i Nashville som hade velat göra ett practical joke. Enligt honom hade hade han ingen aning att Wikipedia var så använd världen över. Chase tog kontakt med Siegenthaler och bad om ursäkt för sitt tilltag.

I det senaste numret av den ärevördiga vetenskapliga tidskriften Nature publicerades en artikel där Wikipedia hade jämförts med den mest kända och statustyngda encyklopedin av alla nämligen Encyclopedia Britannica. Jag har inte läst artikeln än men enligt AFP så blev utfallet bara en knapp fördel Britannica. 42 artikelpar i varje encyklopedi skärskådades av ämnesexperter och Wikipedia gjorde verkligen oväntat bra ifrån sig. Åtta allvarliga fel (misinterpretations of important concepts) upptäcktes och dessa fördelades helt jämnt mellan encyklopedierna. Mindre fel som faktauppgifter, utelämnanden och missledande formuleringar fanns det 162 i Wikipedia och 123 i Britannica. Det blir ca 32% fördel Britannica vad gäller mindre fel, men alltså helt jämnt vad gäller allvarliga fel. Den viktigaste kritiken mot Wikipedia från forskarna var däremot att artiklarna var mindre väl strukturerade och ibland gav för mycket utrymme åt kontroversiella teorier.

Det mest frapperande är väl ändå att man i Nature talar om Wikipedia och Britannica i samma andetag. Är det då OK att citera Wikipedia? Till BusinessWeek har Wikipedias Jimmy Whales nyligen sagt: “Don’t quote us”, men å andra sidan tyckte han inte man skulle citera encyklopedier överhuvudtaget. Han tyckte att encyklopedier skulle ge “good, solid background information to inform your studies for a deeper level”. Det kan jag köpa.

Läs mer här:
Internet encyclopaedias go head to head (webbversion av Nature-artikeln)
Wikipedia becomes Internet force, faces crisis
Author of fake Wikipedia bio admits joke
Don’t quote us
Wikipedia rivals Encyclopaedia Britannica on science

Wikipedia har nu artikel om bomberna i London

11 Juli 2005 av Lars Våge

wikipedia
Säga vad man vill om de nya publiceringsformerna på Internet men snabba är de. Dramatiska händelser lämnar avtryck i många bloggar och bilder, filmer och berättelser sprids snabbt utan medias eller myndigheters kontroll. Ovanligare är det när det på bara ett par dagar ger upphov till nya omfattande artiklar i en uppslagsbok. Men så snabb kan publiceringstakten vara i den ännu inte helt “rumsrena” nätencyklopedin Wikipedia där internetanvändare skriver tillsammans. Inom en timme efter explosionerna påbörjades artikeln 7 July 2005 London bombings och har nu expanderat till en mycket informativ och välskriven text. Där finns också bra externa länkar liksom länkar till nyhetsartiklar från Wikinews - Wikipedias “nyhetstjänst” som också är en intressant utveckling. Artikeln i Wikipedia innehar redan förstaplatsen vid en sökning på uttrycket “London bombings” i Google före artiklar från BBC och CNN. Det säger något om den växande tilltron till Wikipedia. En bra resurs för bloggartiklar om tragedin i London är förresten bloggsöktjänsten Technoratis sida London Bombings som också redan är på Googles tio-i-topp-lista för nämnda sökning.

Bloggtoppen.se

Blogglista.se

Global Voices Online - The world is talking. Are you listening?

Creeper

Nowhere North

↑ Grab this Headline Animator



iselid info

↑ Grab this Headline Animator