Arkiv för kategorin ‘Informationshantering’

Bestäm vilket slags träffar du vill ha med Yahoo! Mindset

2 Juni 2005 av Lars VÃ¥ge

midset
Blir inte ni ocksÃ¥ trötta pÃ¥ att ständigt behöva bläddra igenom träffsida efter träffsida med länkar till webbplatser som vill att ni ska köpa varor när ni egentligen sökte information? Detta är nÃ¥got som sökmotorteknikerna pÃ¥ Yahoo Research Labs försöker göra nÃ¥got Ã¥t i sin nya betademo Yahoo! Mindset. Man kallar konceptet “intent-driven search” och här används tillämpningar av automatisk textklassifikation och maskininlärning. Det hela gÃ¥r till sÃ¥ att efter att användaren sökt pÃ¥ vanligt sätt har denne möjligheten att sortera om träffarna genom att dra i ett slags skjutreglage pÃ¥ träffsidan. Drar man Ã¥t höger (researching) ska träffarna bli mer informativa och drar man Ã¥t vänster (shopping) blir de mer kommersiella. Avgörande för hur precist detta fungerar är, skriver man i sin FAQ, antalet och lämpligheten hos de “seed documents” som definierar vad som är mer informativt respektive kommersiellt. Även om detta är en tidig demo sÃ¥ tycker jag man har hittat nÃ¥got verkligt intressant här. Prova t.ex. att söka pÃ¥ chocolate eller dvd eller nÃ¥got sÃ¥dant och dra i skjutreglaget Ã¥t de olika hÃ¥llen. Att pÃ¥ detta sätt kunna styra relevansrankingen ger stora fördelar för sökaren. I själva verket skulle man kunna tänka sig mÃ¥nga fler typer än de tvÃ¥ i demon men de är en bra utgÃ¥ngspunkt eftersom folk ofta använder sökmotorer pÃ¥ Internet antingen för att söka information eller för att shoppa.

Framtidens sökmotorteknik finner “gömd” information?

25 Maj 2005 av Lars VÃ¥ge

hidden informationVid universitetet i Buffalo har man nyligen färdigställt en prototyp till en ny sökmotorteknik som ska kunna hitta “dold” information pÃ¥ vanliga webbplatser. Forskningen fÃ¥r stöd av Federal Aviation Adminstration och National Science Foundation och i prototypen har man inriktat sig pÃ¥ att kunna fÃ¥ fram information som man inte hittar med vanlig sökteknik ur den amerikanska 9/11-kommissionens rapport . I framtiden menar man att tekniken man utvecklar kan komma att användas i sökmotorer som allmänheten har tillgÃ¥ng till. Konceptet kallas Unintended Information Revelation eller UIR. Pressreleasen om forskningen har fÃ¥tt titeln In War on Terrorism, New Search Engine Seeks Hidden Vulnerabilities och här sägs det t.ex. att “A concept chain graph will show you what’s common between two seemingly unconnected things”. Jag tycker att det hela lÃ¥ter mycket spännande men man kan undra om vi vanliga användare verkligen kommer att kunna dra nytta av en teknik som tagits fram med offentliga medel i USA specifikt för att kunna användas i kriget mot terrorismen. Hur som helst är det fascinerande att läsa det professor Rohini Srihari säger om den nya tekniken som t.ex. “It is designed to find the best path, the best chain of associations between two or more ideas. It returns to you an evidence trail that says ‘This is how these pieces are connected’”.

CiteULike organiserar och utbyter vetenskapliga artiklar

13 December 2004 av Lars Iselid

CiteULike är en helt fri tjänst på Internet där man kan spara referenser och länkar till artiklar och utbyta dessa med andra användare. Jag ska tacka Henrik Åkerfelt som har bloggen Bloggrik för att jag fick nys om denna tjänst härom veckan. Genom att använda en s.k. bookmarklet, dvs. ett litet javascriptprogram sparat som en länk i bokmärkesfunktionen i webbläsaren, kan man när man är inne på en viss artikel (på abstract-nivå) klicka på denna bookmarklet och referensen med eventuell länk till artikeln sparas automatiskt i CiteULike.

Det är främst fria tidskriftsarkiv och referensdatabaser på Internet som har stöd i CiteUlike som t ex PubMed, arxiv.org, CiteSeer, men även kända dyra tidskriftsarkiv som Ingenta och ScienceDirect som många svenska universitet och högskolor har tillgång till. Dessutom har man en lista över främst biomedicinska tidskrifter med stöd i CiteULike.

När man sparar en referens med eventuellt tillhörande artikel kan man lägga in egna ämnesord och även skriva kommentarer. Sparar man t ex en referens från ScienceDirect och sitter vid en universitetsdator med tillgång till denna betaltjänst sparas artikelns unika nummer som kallas DOI. Genom att klicka på DOI-nr kommer man direkt till hela artikeln. För de som använder referenshanteringsprogrammet EndNote finns en funktion för att exportera referenser till EndNote och för LaTex-användare finns BibTex-formatet. Det går även att exportera i RSS-format. Tyvärr finns ingen importfunktion från EndNote till CiteULike.

På det hela är CiteULike en fantastisk tjänst. Mannen bakom tjänsten heter uppenbarligen Richard någonting enligt den utvecklingsblogg han startade 11 november och CiteULike sattes upp ett dygn tidigare. På webbplatsen konstateras att CiteULike är en gratistjänst och kommer så att förbli. Kanske till den dag herrarna bakom Google knackar på dörren och gärna vill integrera CiteULike med Google Scholar.

Looksmart köper Furl

25 September 2004 av Lars Iselid

Looksmart, som äger sökmotorn WiseNut och artikeldatabasen Findarticles, har köpt personaliserings- och bokmärkestjänsten Furl som erbjuder liknande funktioner som Spurl, My Jeeves, Simpy, A9.com, Nextaris etc. Precis som i Spurl går det i Furl att spara en kopia av den webbsida man besökt. Looksmart lovar att man kommer att erbjuda upp till 5GB(!) utrymme per användare. Frågan är bara i vilken form Furl kommer att integreras i Looksmart eller om Furl kommer att fortsätta som en helt fristående tjänst? Nu väntar vi bara på att Google börjar erbjuda liknande tjänster. MSN har ju sin My MSN och Yahoo My Yahoo som båda är mer inriktade på innehåll och portalpersonalisering än inriktade på tjänster för informationshantering.

Läs mer från Looksmart pressmeddelande

Nextaris har nu stöd för svenska bokstäver (och ryska, kinesiska, grekiska…)

12 September 2004 av Lars VÃ¥ge

För ett tag sedan skrev jag en längre artikel här på Internetbrus om Nextaris, en smart sökrelaterad webbapplikation från SurfWax. Det enda verkligt negativa jag egentligen hittade hos Nextaris var att applikationen inte kunde hantera svenska bokstäver. Nu slumpade det sig så att Tom Holt som är chef på SurfWax läste min artikel i den engelska version som senare publicerades på norska Pandia. Oväntat nog tog Mr Holt även kontakt med mig och lovade att han skulle se till att problemet blev åtgärdat. Det har det nu blivit och nu kan man även arbeta med andra icke-engelska texter som t.ex. ryska, kinesiska, koreanska och grekiska. De svenska tecknen fungerar oavsett om man klipper ut text från någon webbsida eller om man skapar egna dokument eller bloggar. Stort tack till Tom! Samtidigt har också den viktigaste webbplatsen som skriver om söktjänster på nätet SearchEngine Watch uppmärksammat Nextaris i sitt nyhetsbrev SearchDay. Chris Sherman (ni vet han som var med och skrev boken The Invisible Web) skriver på det hela taget mycket positivt om Nextaris som trots allt fortfarande är i beta-version.

Nextaris - smart sökrelaterad webbapplikation från SurfWax

22 Augusti 2004 av Lars VÃ¥ge

Företaget bakom den avancerade metasöktjänsten SurfWax har presenterat ett gratis webb-baserat sökrelaterat verktyg som man kallar Nextaris. En del av funktionerna har med sökning att göra medan andra är mer för informationshantering. Det går till så att man registerar sig genom att fylla i lite uppgifter och får ett användar-ID och lösenord som man kan logga in med på Nextaris startsida. Väl inloggad i det diskret ljusblå och vita gränssnittet får man tillgång till 8 flikar under vilka de olika funktionerna döljer sig.

Under fliken Search finns det en sökruta som man kan använda för att söka i ett trettiotal söktjänster som indelats i olika grupper. Överst finns de största av de vanliga sökmotorerna, sedan kommer nyhetstjänster, shoppingsökningar, sport, underhållning, ekonomi, hälsa och sist en referensavdelning. Urvalet är helt OK och inkluderar förutom Google och de andra sökmotorerna t.ex. Amazon, eBay, Internet Movie Database, ESPN, BBC, CNN, Encyclopedia.com, About.com och inte minst Internet Archive. Sökningarna öppnas i nya fönster.

Under nästa flik Newstracker ges möjligheten att skapa s.k. news alerts liknande de som finns i Google News. Man kan alltså konstruera sökfrågor (flera olika om man vill) och sedan få epost så fort det dyker upp några nya artiklar som svarar mot sökningen. Nyhetssöktjänsten som Newstracker jobbar mot är SurfWax egna News Accumulator som indexerar 4000 nyhetskällor. News Accumulator som man kan användas separat är faktiskt en kategoriserande nyhetssöktjänst på samma sätt som Topix.net är även om antalet kategorier ännu så länge inte är lika många.

När vi kommer till fliken Folders börjar det bli riktigt roligt. Här kan vi skapa ett valfritt antal mappar under vilka vi kan skapa tre typer av objekt. För det första kan vi spara bokmärken eller URLar här (Add URL). Dessa kan utgöras av cachade kopior även om stöd för alla filtyper inte finns och bildelement inte kan cachas. För det andra kan vi spara vilka filer vi vill här från vår egen hårddisk (Add File) även om gratisutrymmet inte är mer än 20 MB. För det tredje kan vi skapa en eller flera bloggar i varje mapp (New Blog). Till sist kan vi också skapa egna webbsidor och lägga här (New Web Page). Alla typer av objekt som URLar, filer, bloggar, webbsidor och själva mapparna kan vi lägga in kommentarer till genom funktionen Annotate. Objekt som vi vill ha undanstoppade men inte behöver tillgång till så ofta kan läggas i en särskild arkivmapp. Praktiskt är att det är enkelt att byta namn på, flytta, kopiera, radera och kommentera objekten.

En del av mapparna kanske får ett innehåll som vi vill ha tillgång till utan att behöva logga in till Nextaris. Det kan vi göra under fliken Publish där vi väljer ut vilka mappar som skall bli publicerade och vilken sida som skall vara startsida. Sedan kan vi lätt komma åt dessa genom en webbadress som består av www.nextaris.com/användarnamn. Funktionerna i de två därpå följande flikarna, Messages och Address Book, har med Nextaris interna mailsystem att göra. Om man är flera som använder Nextaris kan man eposta mellan varandra och dela mappar så att man kommer åt varandras. Under Account-fliken slutligen kan man göra saker som att byta lösenord och timeout-tid för inloggningen mot Nextaris.

Som inte allt detta vore nog finns ytterligare två mycket bra saker att ta upp. Man kan nämligen installera två Bookmarklets i sin webbläsare som förenklar användandet av Nextaris avsevärt. Dessa är Nextaris Pages och Nextaris Clippings. Den första använder man när man surfat till en webbsida som man vill komma ihåg eller kanske spara en cachad kopia av. Genom att klicka på knappen Nextaris Pages aktiverar man ett popup-fönster i vilket man efter att loggat in kan välja i en rullgardinsmeny i vilken av ens mappar man vill spara sidan. Om man å andra sidan bara vill spara några meningar text som man markerat med musen kan man klicka på Nextaris Clippings. Då får man upp val på i vilken blogg i vilken mapp som man vill klippa in texten man markerat. Mycket praktiska funktioner bägge två och de fungerar inte bara i Internet Explorer under Windows, det går lika bra med t.ex. någon Mozilla-variant under Linux.

Nextaris är en tämligen fullfjädrad webbapplikation för informationshantering av flera slag. Något annat är egentligen inte att vänta sig från SurfWax som under ett antal år utmärkt sig för sin intelligenta metasöktjänst som använder lingvistiska verktyg för att ge förslag på alternativa sökord (Focus-funktionen) och som skapar ett slags abstract eller Site Snaps för sökträffarna med automatisk textsammanfattning. Egentligen finns det bara ett fel med Nextaris och det är lite synd. Svenska bokstäver som å,ä och ö fungerar inte alls när man skall skapa webbsidor och bloggar. Jag vet att det finns andra applikationer (inte gratis) som kan göra snarlika saker som Nextaris men jag är mer än nöjd med vad som bjuds. Namnet Nextaris är en förvrängning av next terrace. Först tyckte jag det var lite pretentiöst men jag håller definitivt på att ändra mig.

Ramana Rao skriver om informationssökningens historia

26 Maj 2004 av Lars VÃ¥ge

Förra Ã¥ret hade jag nöjet att höra Ramana Rao tala vid ett seminarium i Birmingham. Rao är chefsteknolog pÃ¥ företaget Inxight som sysslar med söklösningar för intranät (enterprise search) och knowledge management. I det aktuella numret av tidskriften ACM Queue, vol 2. nr 3, har han skrivit en kort historik över informationssökningen frÃ¥n 60-talet och framÃ¥t och det är en intressant och tänkvärd läsning. Artikeln heter From IR to Search and Beyond och finns tillgänglig gratis i fulltext. I artikeln siar Ramana ocksÃ¥ om framtiden och gör fyra förutsägelser om hur det kommer att se ut Ã¥r 2020 i vÃ¥rt informationsuniversum. Bland annat menar han att det kommer att krävas en bättre informationskompetens (information literacy) hos oss för att vi ska fungera och lyckas i “the new networked information urbanity of the future”. En annan tes är att 2020 kommer processande av texter med naturligt sprÃ¥k, text mining, vara viktigare än processandet av data lagrade i strukturerade databaser. Ramana Rao har ocksÃ¥ en egen webbplats som kallas Ramana Rao’s Informationflow där han skriver om informationssökning ur mÃ¥nga aspekter. Han publicerar dessutom nyhetsbrev och har självfallet en egen blogg. För de som är intresserade av blogging finns ett roligt stjärnträd med artiklar och resurser runt bloggar. Detta stjärnträd eller star tree har namnet BlogWorld och är en Java-applet med vilken man kan navigera Raos utvalda länkar om blogging.

Bli en vassare vägvisare till webben

29 Januari 2004 av Lars VÃ¥ge

Nu finns det en ny kursserie i fördjupad webbsökning kallad “Ständigt detta nät” - skräddarsydd för bibliotekarier som arbetar inom folk- och gymnasiebiblioteken. Kurserna arrangeras av Bibliotekstjänst, ett service- och kunskapsföretag för biblioteksmarknaden.

Kursupplägget är flexibelt och medger individuell anpassning. Kursdeltagarna kan välja mellan många olika inriktningar och man kan lära sig mer om t.ex. bloggar, ämnesportaler, metadata och e-tidskrifter. Den ena kursen erbjuder dessutom en kontinuerlig uppföljning under ett helt år från kursstart. På så sätt finns det möjlighet att hålla sig uppdaterad och lära sig mer, även efter det att kursen är slut.

Undervisarna på de olika kurserna kommer från högskolor och universitet, samt från företagsvärlden. En av redaktörerna på Internetbrus deltar också som lärare.

Sista anmälningsdag är den 20 februari 2004.

Läs mer om kursen

Missuppfattningar om sökning på internet

15 Januari 2003 av Lars Iselid

Det är alltid lika intressant att läsa artiklar i allmänpressen där ämnet är sökning på internet. Dessvärre så sprids allt för ofta myter och missuppfattningar om både det ena och det andra.

En mycket vanlig missuppfattning är man tror att man kan rankas högt i sökmotorerna bara genom att ange rätt sökord i HTML-koden. MÃ¥nga har upptäckt den meta-information som ligger i meta-taggarna mellan head-taggarna. I meta name=”keywords” kan man ange passande sökord. Sökmotorerna vet sedan länge att mÃ¥nga manipulerar meta-taggarna och skriver in t ex britney spears istället för de ord som webbsidan egentligen handlar om. Därför har sökmotorerna sedan länge helt bortsett frÃ¥n alla meta-taggar(eller Ã¥tminstone lÃ¥gprioriterat de som ett rankingkriterium) med undantag för title-taggen. Trots denna gamla, men inte för alla lika kända, sanning sÃ¥ skrev självaste New York Times en artikel förra Ã¥ret som spädde pÃ¥ denna myt ytterligare. Företagswebbplatser som bara med hjälp av att välja rätt ord i meta-taggarna klättrat i träfflistorna.

En annan minst lika vanlig missuppfattning är den om Googles patenterade ranking-teknik som fått namnet PageRank. Egentligen är det ingen som exakt kan veta hur deras teknik att rangordna träffar fungerar och de själva hävdar att de har minst 100 olika rankingkriterier. Vad många missförstår är att det inte handlar om kriteriet hur många inkommande länkar en webbsida har utan värdet på dessa länkar. Anders Mildner skriver på Expressens kultursida den 26 november 2002 att Googles idé är att lita på människorna. Genom att räkna antalet länkar till respektive webbsida avgör människorna vilka webbsidor som är mest relevanta. Människor är i Mildners bemärkelse följaktligen de som gör webbsidor och lägger länkar, inte nödvändigtvis de som bara surfar.

Att flest inkommande länkar vinner stämmer inte. Ett sÃ¥nt system skulle var enkelt att manipulera. Det handlar om värdet i respektive länk, inte antalet! Hur värdet sen exakt beräknas är en gÃ¥ta som webmastrar över hela cyberspace sliter sitt hÃ¥r för att försöka avslöja och det kan ibland vara svÃ¥rt att veta vad som är sanning och inte sanning. Men om man gÃ¥r tillbaka ett antal Ã¥r och analyserar det dokument som grundarna till Google, Sergey Brin och Larry Page, publicerade 1998 sÃ¥ vet man grundtanken. Google tittar pÃ¥ den webbsida varifrÃ¥n länken kommer och gör en beräkning av ut- och inlänkar pÃ¥ den sidan för att beräkna värdet pÃ¥ inlänken. Mildner är inte ensam om att sprida myten om att flest länkar vinner. Det har t o m missuppfattats i svenska böcker som “Research pÃ¥ internet” som givits ut pÃ¥ ett kvalitetsförlag och författats av bibliotekarier som borde ha varit mer insatta. Men varken Mildner eller förlaget Liber är ensamma om att sprida dessa missuppfattningar och visst, i det stora hela finns väl större världsproblem? Eller är det ett större problem än man tror om webbansvariga börjar lägga onödiga länkar för att de tror att de avslöjat en rankingteknik? Döm själva!

“Den förste[Läs: Microsoft] fÃ¥r kritik, den andre blir älskad. NÃ¥got stämmer inte. Och i det här fallet lär man inte fÃ¥ nÃ¥gon hjälp av att söka pÃ¥ internet”, avslutar Mildner sin artikel i Expressen. Liknelsen mellan Microsofts dominans pÃ¥ mjukvarumarknaden och Google vad gäller världens informationsflöde är inte helt tagen frÃ¥n luften. Men att Google skulle stÃ¥ där okritiserat är inte sant. En av Googles största kritiker är en herre vid namn Daniel Brandt som t o m förfäktat idén om att tvÃ¥ngsförstatliga Google!

Läs mer om Mr. Anti-Google i Salon.com eller besök hans egen webbplats: Google-watch.org. Visst kan man få hjälp av internet och varför inte självaste Google. Sök på orden: Anti Google. Hittar du inget negativt om Google kanske det betyder att de har börjat filtrera :-)

Gör kommandosökningar i adressfältet i Internet Explorer

29 Augusti 2002 av Lars Iselid

Med hjälp av det lilla programmet Quick Search kan man i Internet Explorer version 5.x söka med hjälp av kommandon direkt i webbläsarens adressfält. Istället för att skriva in Altavistas URL och därefter göra sin sökning i sökmotorn för Altavista kan man använda kommandon. Av springsteen betyder att man söker direkt i Altavista efter sidor om Springsteen.

Quick Search ingår när man installerar Web Accessories for Internet Explorer 5 (134 KB). I bokmärkena i webbläsaren finns (välj menyn favoriter) efter installationen programmet Quick Search. Där finns fördefinierade kortkommandon för olika söktjänster men man kan lägga in egna, nya kommandon och ta bort eller ändra gamla. Öppna Quick Search och välj knappen New. Skriv in ett valfritt kortkommando t ex aw i fältet Shortcut. I fältet Search väljer du Custom URL om du ska lägga in ett nytt kommando och i fältet URL skriver du in adressen till söktjänsten. I detta fall: http://www.alltheweb.com.

Quick Search kan vara ett alternativt till alla verktygsfält som var och varannan söktjänst erbjuder numer. Tyvärr fungerar Quick Search inte helt tillfredställande i IE version 6.x.

Bloggtoppen.se

Blogglista.se

Global Voices Online - The world is talking. Are you listening?

Creeper

Nowhere North

↑ Grab this Headline Animator



iselid info

↑ Grab this Headline Animator