Arkiv för Augusti 2007

Wikiscanner bevakar ändringar i Wikipedia

30 Augusti 2007 av Lars Iselid

14 august lanserade den amerikanske hackaren Virgil Griffith bevakningstjänsten Wikiscanner som länkar ihop anonyma ändringar i Wikipedia med organisationer, myndigheter, företag etc. via IP-igenkänning. Ändringshistoriken för Wikipedia-artiklar finns naturligtvis fritt på Wikipedia.org, men Virgil har skapat en tjänst som gör det lättare sökbart.

Man kan söka på organisationens namn, plats, IP range och förvalda organisationsnamn. Wikiscanner söker mot 34,417,493 ändringar i wikipedia från 7 february 2002 till 4 augusti.

Wired har också en lista över spektakulära ändringar i Wikipedia av olika organisationer och företag som de kallar Wikidgame, där man länkar vidare till Wikiscanner.
Exempelvis: “Israelian Embassy makes dead palestinians disappear“. Man kan ocksÃ¥ anmäla till Wired egna intressanta Wikipedia-ändringar som man hittar.

Lanseringen av Wikiscanner har pÃ¥ kort tid skapat en ny uppblossad debatt om Wikipedias vara eller icke vara. Var och varannan journalist hänvisar idag till Wikipedia. En sökning pÃ¥ källa:wikipedia pÃ¥ Eniros nyhetssök avslöjar en del. T.ex. när TV4 30 juli skriver om “Fakta: Ingmar Bergman” hänvisar man enbart till Wikipedia. Det finns naturligtvis inget exakt fel eller rätt i detta. I mÃ¥nga fall är Wikipedia mycket mer djupgÃ¥ende och samtidigt intressant spekulerande. Men mÃ¥nga flagranta exempel pÃ¥ felaktigehter finns ocksÃ¥, särskilt i personers biografier. Men detta eviga källhänvisande till wikipedia i pressen tror jag snarare visar pÃ¥ en mentalitet pÃ¥ dagens tidnigsredaktioner där man lider under tidspress och dÃ¥ ligger Wikipedia “närmare” än NE, dvs. gratis pÃ¥ nätet.

I TV4:s fall borde man kunna hänvisa både till wikipedia och NE eller åtminstone både till Wikipedia och Ingermarbergman.se (som nog anses som minst likvärdig, om än inte mer pålitlig än både Wikipedia och NE). Det handlar om att komma ifrån det slentrianmässiga användandet av enbart en källa som är en journalistisk odygd.

Visst är inte heller NE utan fel och NE speglar oftast vad en expert anser och inte som med Wikipedia: förhoppningsvis några experter och många entusiaster. Att NE inte alltid lyckas visar detta blogginläg från Lotten Bergman: Wikipedia och NE i kökets mörker.

ACAP ska styra vad sökmotorerna gör med webbinnehållet

29 Augusti 2007 av Lars VÃ¥ge

Den franska sökmotorn Exalead har gått med som en partner i samarbetet om ACAP-protokollet. Akronymen utläses Automated Content Access Protocol och initiativet till projektet ligger hos stora medieproducenter som nyhetsbyråer, förlag, tidningsorganisationer men även copyrightorganisationer.

Vad handlar då detta om? Jo, vad man vill är att utveckla en ersättning eller komplettering till det gamla Robots Exclusion Protocol eller Robots.txt. Med det äldre protokollet kan man bara ange om sökmotorer överhuvudtaget ska få indexera olika kataloger och filer på en webbplats. Med ACAP ska man kunna göra mycket mer. Man ska kunna ange hur sökmotorern ska få indexera och hur de ska få använda texter, under vilka villkor och annat liknande. Kort sagt, innehållsägaren ska kunna ha kontroll på vad sökmotorerna gör med deras innehåll.

Frågorna som ställs i FAQ:en är lite tillspetsade: Isn’t ACAP focused entirely on publishers’ recent disagreements with Google? eller Isn’t this all about money? Man medger att det delvis har med pengar att göra och att frågan aktualiserats av copyrighttvisterna som Google hamnat i under de sista åren. Men detta är bara symptom på att det behövs en robustare lösning rent generellt än vad det tolv år gamla Robots Exclusion Protocol har kunnat ge. Enkelt uttryckt vill man kunna låta sökmotorerna indexera innehåll men kunna ange villkor för hur.

Jag tycker att det är ett viktigt steg i utvecklingen av hur sökmotorer och webbplatsägare kan interagera under ordnade former. En sådan mekanism som det föreslagna ACAP kan bara vara bra. Mer innehåll kommer att komma ut på webben när ACAP har realiserats. Det kan med andra ord gagna både producenter och konsumenter. Att Exalead nu deltar i pilotprojektet är också bra och jag hoppas att de stora amerikanska sökmotorerna också kommer med.

ACAP har förutsättningar att bli en industristandard som alla sökmotorer förväntas respektera om inte Google vägrar. Det skulle vara ungefär som att USA inte vill skriva under Kyotoprotokollet. En lite ansträngd liknelse men det är svårt att implementera något som den mäktigaste vägrar vara med på.

Iconlet - sökmotor för fria ikonfiler

28 Augusti 2007 av Lars VÃ¥ge

Under sommaren har det dykt upp en ny sökmotor för ikonbilder som heter Iconlet. Det trevliga med Iconlet är det rena och lättanvända gränssnittet och att alla ikonfiler man hittar ska vara fria att använda. Det senare innebär att alla ikonerna har någon variant av antingen GNU:s General Public License, Creative Commons-licens eller Eclipse Public License. Vem som står bakom Iconlet går inte att lista ut med hjälp av informationen på webbplatsen, bara att den första versionen av Incolet kom i början av juni.

Det går både att söka och att bläddra sig fram i Iconlet. Vill man söka så kan man antingen använda hemsidans sökruta eller det avancerade sökformuläret. Med det senare kan man ange om man vill ha filformatet png eller gif, hur stor ikonen ska vara och vilken form av licens som ikonen tillgängliggörs med. Det svåraste med att söka efter bildfiler är ju att man ofta är hänvisad till att gissa sig till vad bildfilen har för namn. Därför är det praktiskt att också kunna bläddra bland ikonerna. Fast man kan ju bara bläddra efter filformat, dimensioner och licens så det blir tämligen klumpigt det med. Inte desto mindre kan Iconlet kanske vara något för den som letar efter nya ikoner till sitt skrivbord.

Tafiti - nytt grafiskt gränssnitt mot Microsofts sökmotor

22 Augusti 2007 av Lars VÃ¥ge

Det finns nÃ¥got som heter Microsoft Silverlight som är en plug-in för webbläsare. Med Silverlight installerat kan man köra webbaserade applikationer som utnyttjar Silverlights programmeringsgränssnitt. Nu finns det en beta-version av ett nytt grafiskt gränssnitt mot Live.com dvs Microsofts egen sökmotor. Denna är ännu pÃ¥ experimentstadiet och kallas Tafiti som ska vara Swahili för “att forska”.

När man söker upp Tafiti får man besked om att man måste installera Silverlight för att det ska fungera. Det är snabbt gjort och Silverlight fungerar med de mest kända webbläsarna IE, Firefox och Safari. Efter att ha startat om webbläsaren är vi redo att återigen besöka Tafiti och nu målas ett elegant grafiskt gränssnitt upp.

tafiti1.jpg

Mitt på webbsidan finns ett lite slitet oskrivet katalogkort där man kan skriva in sökuttryck. Katalogkortet lägger sig sedan till vänster i bilden. Träffarna kommer i mittenområdet vars övre del ser ut som en trälåda med en skylt som innehåller sökorden.

tafiti2.jpg

Under katalogkortet till vänster finns en slags karusell med visuella symboler för sökning efter webbsidor, nyhetsartiklar, bilder, böcker och RSS-strömmar. Webbsidor är standard vill man se t.ex. nyhetsartiklar klickar man på symbolen och karusellen snurrar så att denna kommer i fokus och träffarna ändras i mittenlådan.

tafiti3.jpg

Det mest användbara man kan göra med Tafiti är väl egentligen att utnyttja flikarna till höger som mittenlådan. I FAQ-dokumentet kallas dessa shelves eller hyllor på svenska. Hit kan man dra träffar som hör ihop och ge hyllan ett namn som gör att man kommer ihåg vad man stoppat där. Praktiskt och nästa gång man kommer tillbaka till Tafiti med samma webbläsare så finns hyllorna kvar.

Så vad är det nya eller nyttan med det här förutom att hyllorna är praktiska. Jag tycker att gränssnittet är inbjudande och lättsamt att arbeta med. Webbapplikationer blir allt intressantare och ger en trevligare upplevelse än t.ex. Googles gamla trista sökruta. Den var ju en relevant nostalgitripp år 2000 som såg tillbaka på hur det var 1993-1994 på webben innan portaliseringen tagit fart och t.ex. förstört Altavista. Idag tycker jag vi ska kräva mer av ett webbgrässnitt oavsett hur sökmotorn som använder det presterar vad gäller relevans, funktioner, indexstorlek och interaktiva verktyg. Ask3D har visat vägen. Google lägger ju ner mycket krut på Google Docs-applikationerna så varför inte göra något åt sökmotorn?

Center for Democracy & Technology rankar sökmotorernas skydd av ditt privatliv

16 Augusti 2007 av Lars VÃ¥ge

Som läsare av den här bloggen säkert märkt har sökmotorerna börjat tävla om vem som är bäst på att skydda användarnas privatliv. Vi har tyvärr inte hunnit med att skriva om alla turerna under sommaren. Därför är det bra att Center for Democracy & Technology i Washington i USA har analyserat nuläget i en kort rapport. Det är med glädje som organisationen ifråga noterar förändringen i attityd hos sökmotorföretagen och de har också gjort ett pressmeddelande i samband med att rapporten lades ut på nätet.

Själva rapporten heter Search Privcacy Practices: a work in progress och kom i förra veckan. I denna sex-sidiga rapport finns en lättläst tabell som sammanfattar läget och vad som utlovats i framtiden. De sökmotorer som har undersökts är Google, Yahoo!, Microsoft, Ask och AOL. De huvudsakliga frågorna som tas upp är:

  • Hur lÃ¥ngt efter att sökdata samlats in raderas dessa?
  • PÃ¥ vilket sätt sker raderingen av sökdata?
  • FÃ¥r nÃ¥gon tredje part ta del av sökdata fortlöpande?

Det två första frågorna är uppdelade på IP-adress, cookie-ID och sökuttryck. Angående de företag som låter tredje part ta del av sina data är dessa just nu Ask och AOL. Detta beror på att de inte producerar sina egna sponsrade länkar. I deras fall är den tredje parten Google.

Innehåll viktigare än sök, kommunikation och shopping

15 Augusti 2007 av Lars Iselid

Enligt en undersökning initierad av Online Publishers Association (OPA), utförd i samarbete med Nielsen/NetRatings, besöker internetanvändare innehållsrelaterade webbplatser (t.ex. cnn.com) hälften av sin tid online i jämförelse med kommunikationsrelaterade (webbtjänster med syfte att underlätta utbyte av tankar, meddelanden eller information direkt mellan individer eller grupper, t.ex. Yahoo mail), sökrelaterade (webbtjänster som spindlar webben för att visa rankade träfflistor utifrån användarens sökord, t.ex. Google) och shoppingrelaterade sidor (webbtjänster med syfte att underlätta handlade via nätet, t.ex. Amazon).

Summering av en fyraårig uppföljning av internetanvändning utförd av OPA:

Innehåll
34%(2003) 47%(2007)

Sök
3%(2003) 5%(2007)

Shopping
16%(2003) 15%(2007)

Kommunikation
46%(2003) 33%(2007)

Innehållsrelaterad internetanvändning (med syfte på den totala tiden användaren är online) har ökat de senaste fyra åren med 37% och sökrelaterad med 35% och komminkationsrelaterad minskat med hela 28%.

Men statistik är ju alltid statistik och detta är bara en enskild studie. Om man tittar mer på metoderna för undersökningen Internet Activity Index (IAI) kan man läsa hur urvalet gjorts:

“The IAI is derived from a categorization of Web properties accounting for more than 90%, on average, of active Web users and approximately 55% of total usage time*. For Web properties that cross over into multiple categories, various site segments are classified individually. (For example, Yahoo! Mail is classified under Communications, while Yahoo! Sports is classified under Content.) The total amount of time spent by consumers in each category is then captured by Nielsen/NetRatings and reported monthly by the OPA”.

Asterisken (*) syftar pÃ¥ att .gov och .edu-sajter och prorrnografiska sajter inte ingÃ¥r i beräkningen. FrÃ¥gan är om den metod Pew Internet använder, där man tar ett begränsat urval användare (tyvärr alltid geografiskt baserat till USA) och med mjukvara bevakar deras användande, kan ge en mer nyanserad och bredare uppfattning om användningen. Man undrar verkligen i denna web 2.0-värld om kommunikationsrelaterad internetanvändning ska ha tappat sÃ¥ mycket i betydelse i jämförelse med dessa andra aktiviteter. Ev. skulle skillnaderna vara större om man tittade pÃ¥ olika Ã¥ldrar och kön särskilt med tanke pÃ¥ studien “Social Networking Websites and Teens” frÃ¥n Pew Internet.

Å andra sidan kan nyhetsläsandet på nätet (och eventuellt bloggandet) var den stora faktorn i innehållets ökade betydelse.

Längst ned på sidan som visar IAI-metoderna kan man också se olika typer av statistik: share of time, total time, pages per person, unique visitors, page views och reach. Det fina i kråksången är ju att vana användare ofta öppnar sidor (företrädevis flera sidor i olika webbläsarfönster eller -flikar) och lämnar dessa öppna för att avbrytas av telefonsamtal, fika, läsa andra sidor, använda andra program på datorn osv. Att mäta tiden som man har en sida öppen kan bli väldigt missvisande med andra ord eftersom den inte mäter tiden du aktivt tar del av sidans innehåll och tjänster. Kanske är då statistik om sidvisningar (page views) eller unika besökare (unique visitors) åtminstone viktiga för ge en bättre helhetsbild.

Intervjustudier om internetanvändning borde också finnas med som ett komplement, men vi vet ju att det kan vara svårt att uppskatta hur mycket vi använder ditt och datt på internet om vi skulle bli tillfrågade.

Nya filter i Windows Live Searchs bildsökning

9 Augusti 2007 av Lars VÃ¥ge

Det här med att erbjuda möjlighet att begränsa träffar i en bildsökning till ansikten har ju blivit på modet. Först ut var Exalead, sedan kände sig Google tvungna att haka på och nu är det Windows Live Searchs tur. För någon vecka sedan beskrevs de nya filtren i utvecklarbloggen och man fick exempel utifrån Jimi Hendrix. Dessa fungerade förstås utmärkt som sådana brukar.

Vi gjorde ett litet test och använde en mycket mindre känd musiker som exempel, den makalöse pianisten Cecil Taylor som kan sägas vara det ena benet som free jazz står på. Ornette Coleman skulle då vara det andra men nu kommer vi ifrån ämnet.

Än så länge är det inte så lätt att använda de nya filtren utan man måste manuellt skriva in vissa strängar i sökfältet. Det är nu möjligt att begränsa till ansikten, porträtt och svartvitt. Det sista är ju egentligen ingen nyhet för de stora sökmotorerna så det struntar vi i.

“cecil taylor” filter:face - den här sökningen ska alltsÃ¥ returnera ansiktsbilder av Cecil Taylor. Ansiktsbilder är ocksÃ¥ alla de träffar man fÃ¥r pÃ¥ första sidan. De flesta är av den kände Cecil Taylor och nÃ¥gra av mindre kända. Men här finns ocksÃ¥ ansikten som tillhör Charles Mingus, Paul Bley och Andrew Hill. Det här har med brister i indexeringen att göra inte ansiktsigenkänningen i sig sÃ¥ det är OK.

“cecil taylor” filter:portrait - här kommer nÃ¥got som är lite nytt. Detta filter ska begränsa till porträtt vilket inte finns hos nÃ¥gon annan sökmotor för ögonblicket. Det verkar fungera som sÃ¥ att i bilden ska det finnas ett ansikte men det ska inte uppta sÃ¥ stor del av bilden. Hur gick det med Cecil dÃ¥? JodÃ¥ det är bilder som kan kallas porträtt eftersom ansiktena är mindre. De flesta är pianisten med pÃ¥ men andliga kusiner som John Coltrane och Frank Zappa har ocksÃ¥ slunkit med.

Mycket brus om Wales och Wikia

1 Augusti 2007 av Lars VÃ¥ge

Det har skrivits en hel del om Wikipedias starke man Jimmy Wales och hans sökmotorprojekt Search Wikia i media och bloggar de senaste dagarna. Återigen kommer snacket om att en ny Google-dödare på gång. Men vad är det som har hänt som är nytt? Egentligen bara det att Wales har köpt ett spindelprogram. Är det någon som minns Grub som vi skrev om 2002?

Grub var ett open source-baserat program för att spindla webben som köptes för flera år sedan av Looksmart. Det sker ju alltid mycket uppköp i den här branschen och somliga bara för att hindra konkurrenter från att köpa. Nu säger Wales att Grub-programmet åter ska bli open source-baserat och det är ju bra. Man kan faktiskt redan ladda ner källkoden från Grub-projektets egen hemsida. Vi får se hur Wales kan använda Grub i sin egen sökmotor som än så länge bara är på planeringsstadiet.

Bloggtoppen.se

Blogglista.se

Global Voices Online - The world is talking. Are you listening?

Creeper

Nowhere North

↑ Grab this Headline Animator



iselid info

↑ Grab this Headline Animator