Arkiv för Juli 2007

Tyska sökmotorprojektet THESEUS får EU-pengar

26 Juli 2007 av Lars VÃ¥ge

Som en del läsare kanske minns så splittrades det fransk-tyska samarbetet om den planerade sökmotorn Quaero i december förra året. Den franska kontingenten behöll namnet Quaero medan tyskarna började planera ett eget sökmotorprojekt med arbetsnamnet THESEUS. Nu har det hänt att Europeiska Kommissionen i förra veckan beviljade THESEUS sammanlagt 120 miljoner euro fram till år 2011.

Inledningsvis går pengarna tilll ett mindre antal större företag som Siemens, SAP, Empolis m.fl. för att dessa ska starta upp projektet. I ett senare skede ska små- och medelstora företag få pengar för att bygga vidare på resultaten av den initiella satsningen. Målet med THESEUS är alltså att utveckla och testa nya söktekniker för att skapa fungerande verktyg, tjänster och affärsmodeller som så småningom kan ge ekonomisk utdelning.

THESEUS ska drivas som ett konsortium med intressenter både från industriföretag och forskningsinstitutioner. Bland de senare finns flertalet större tyska universitet och inte mindre än nio institut inom det kända Fraunhofersällskapet. Mer information om vilka som deltar i samarbetet finns i THESEUS pressmeddelande, se nedan.

Vad ska man då försöka åstadkomma inom ramen för det här samarbetet mellan näring och forskning? Fokus är i första hand på semantiska tekniker som ska möjliggöra automatiskt upptäckande av innehåll som sedan kan automatklassificeras. Avgörande är komponenter som ska kunna förstå meningen av innehållet i den förekommande språkliga kontexten. Men även bilder och andra medieobjekt ska kunna analyseras på samma sätt och systemet ska kunna länka textobjekt till dessa när det finns relevanta kopplingar emellan dem. Om man vill läsa mer om visionerna ska man besöka projektets hemsida.

Jag undrar när det kommer ut något av allt detta som vi kan ta del av? Det lär säkert dröja. Under tiden söker även det franska Quaero-projektet EU-pengar på samma sätt som THESEUS. Det finns ju dessutom ett tredje sökmotorprojekt med EU-anknytning som är inriktat på audiovisella objekt - PHAROS.

Läs mer:

Pressmeddelandet från Europeiska Kommissionen
THESEUS-konsortiets pressmeddelande
Artikel i FORBES från AP
Ekonominyheternas artikel
VÃ¥r artikel om Quaero-projektets splittrande

Ask ska ge användarna total kontroll över sina sökdata

21 Juli 2007 av Lars VÃ¥ge

Det rör sig i frågan om användarnas sökdata. Google har ju nyligen valt att i viss mån anpassa sig till EU:s önskningar om att sökdata ska anonymiseras efter kortare tid och att cookiefiler ska inaktiveras efter en rimlig tid. Nu går den fjärde största amerikanska sökmotorn Ask.com ett eller snarare flera steg längre. De jobbar nämligen på ett verktyg kallat AskEraser som ska ge användarna mer eller mindre total kontroll över sina sökdata.

Med AskEraser ska man kunna försäkra sig om att ens sökhistorik inte lagras av Ask. För att förenkla det hela ska man när man valt att aktivera AskEraser alltid kunna se sina inställningar för skydd av sökdata på Asks träfflistor. Det låter ju strålande och skall bli mycket intressant att se i praktiken när AskEraser lanseras. En talesman för Center for Democracy & Technology i Washington uttalar sig på det här sättet i pressmeddelandet om AskEraser:

With today’s announcement, Ask.com has taken an important step toward giving Internet users choice in how they control sensitive information about their online activities.

Time-out för Googles cookies efter två år - inte år 2038

19 Juli 2007 av Lars VÃ¥ge

Inom de närmaste månaderna kommer det att ske en förändring i hur Googles cookiefiler fungerar. Som det är nu så är de aktiva fram till år 2038 oavsett om man slutat använda Google eller inte. Detta har nyligen kritiserats av EU:s Article 29 Data Protection Working Party som uttryckt tydliga önskemål om att Google skulle göra något åt detta.

I Googles officiella blogg berättade för ett par dagar sedan Peter Fleischer som är Global Privacy Counsel på företaget att man nu jobbade på att genomföra just en sådan förändring. I framtiden kommer Googles cookiefiler att bli inaktiva efter två år om man inte fortsätter att använda Google. Om man å andra sidan gör det ska man inte behöva förnya sin cookiefil genom att fylla i sina preferenser på nytt. Cookiefilerna kommer istället att förnya sig själva.

Exalead ger sig in i sökning av vetenskapliga artiklar

18 Juli 2007 av Lars VÃ¥ge

Den franska sökmotorn Exalead ska ocksÃ¥ börja indexera vetenskapliga artiklar liksom söktjänster som t.ex. Scirus, Google Scholar och Windows Live Academic. Det är L’Institut de l’Information Scientifique et Techniques databas med 13 miljoner artiklar pÃ¥ engelska, franska, italienska och spanska som framöver kommer att bli sökbar via Exalead.

Om man läser Exaleads blogg får man nästan intrycket att man skulle få tillgång till själva artiklarna också. Så är det nu inte vilket man lätt konstaterar om man tittar på INISTs eget pressmeddelande. Det är alltså bara de bibliografiska posterna, dvs referenserna som man kommer åt. Det ska trots allt bli intressant att se hur Exaleads verktyg för modifiering av sökningar och sortering av träffar fungerar på det här materialet.

En annan Exalead-nyhet är att det nyligen blev möjligt att söka i Exalead inifrån Netvibes. Det här är ju min favorit bland webb-baserade RSS-läsare m.m. så jag blir ju glad för det i alla fall. Om du är Netvibes-användare så är vägen Add content->Widgets->Search->Web Search. I rutan du får upp klicka på pilen vid den förvalda sökmotorn (förmodligen Google) och välj Manage Search Engines så får du möjlighet att välja Exalead.

Google Book Search - nu med PDF-nedladdning

10 Juli 2007 av Lars VÃ¥ge

Nu erbjuder Google Book Search inte bara möjlighet att läsa hela böcker på webbplatsen utan också att ladda ned vissa av dem i PDF-format. Det rör sig om inskannade böcker som det inte längre finns någon som äger copyright till. Vilket man är noga med att poängtera i Google Book Search utvecklarblogg och inte utan anledning med tanke på all kritik man fått utstå.

Hur ska man då hitta böcker som finns i PDF-format? Störst chans har man om man använder det avancerade sökformuläret och klickar i Full view innan man söker. Nu är det här långt ifrån någon garanti eftersom det mesta som finns i fulltext inte finns i PDF-version än. Så det är bara att söka och hoppas.

I utvecklarbloggen finns några länkar med exempel men bara vissa av länkarna leder verkligen till böcker med PDF-nedladdning. Märkligt slarvigt av Google. I alla fall fungerar länken till en utgåva av Dantes Inferno som skannats in vid Harvarduniversitetets bibliotek. Ett annat exempel är en utgåva av Simon Bolivars tal.

Jajja i nytt blåsväder

6 Juli 2007 av Lars Iselid

Vi kommenterade i maj på Internetbrus misstänkt manipulering från Jajjas sida. Nu har Jajja hamnat i nytt blåsväder med manuellt bloggkommentarsspam som länkar till deras kataloger. Malin Sandström på bloggen Vetenskapsnytt har sammanfattat sina upptäckter av kommentarsspam. Jajjas kommenterar till händelserna finns i kommentarsspåret på Nikkes Index. Där kan vi läsa hur Malin Sandström fått ett mejl från teknikchefen Tommy Pettersson på Jajja som säger:

“Vi pÃ¥ Jajja tar fullständigt avstÃ¥nd frÃ¥n detta sätt att arbeta!”

Vice VD Samuel Sylander fyller på:

“Vi har, som Tommy skriver, ett antal samarbetspartners runt om i världen som har en rad olika uppdrag frÃ¥n oss, bl a att anskaffa länkar. I det här fallet har samarbetet resulterat i detta, vilket vi givetvis är olyckliga för. Det här samarbetet har stoppats.. VÃ¥r ambition pÃ¥ Jajja är att bedriva sÃ¥ kallad ‘white hat’ SEO och att inte ens vara ute i grÃ¥zonen”.

Än en gång kan jag inte annat än hålla med Nikke Lindqvist i sin analys:

“Att över huvud taget satsa krut pÃ¥ att köpa in externa länkbyggartjänster känns dock väldigt främmande för ren white-hat (reko) SEO”.

Vill man inte ens befinna sig i en gråzon så bör man nog helt tänka om på Jajja och skrota sina s.k. kataloger. Det är liksom helt fel väg att satsa krutet på i mina ögon. Jag tycker man rör sig i en gråzons-SEO.

Nikke lanserar en teori om att Jajja försöka övertyga sökmotorerna om sajternas svenskhet, snarare än topplaceringar i träfflistorna. Låter som att gå över ån efter vatten. Men kan ju undra hur många kronor som Jajja satsat på dessa kommentarsspammare. Sitter de på en bakgård i Saigon och hackar?

Förresten, har du också blivit Jajjad?

Internetbrus uppgraderar Wordpress

5 Juli 2007 av Lars Iselid

Som en del kanske redan har listat ut använder Internetbrus det utmärkta bloggverktyget Wordpress. Tyvärr har vi länge suttit på en äldre version av Wordpress som gör att många av de nya funktioner som finns bl.a. via plugins inte går att använda. Därför tänkte vi till slut få ändan ur vagnen och uppgradera Wordpress ikväll. Så till er som inte är ute och solar ikväll (åtminstone här i Umeå är det kanonväder, kanske har morgonregnet avtagit i Skåne nu) och får anledning att läsa våran blogg. Till er vill vi varna att sidan kommer kanske att vara nere tidvis vid uppgraderingen. Håll tummarna att allt går vägen! Det gör Lars och Lars i varje fall.

UPDATE: Det går inte så lysande. Vi har stora problem med svenska bokstäver och mycket annat. Vi kommer att jobba med detta de närmaste dagarna. Ha tålamod med oss, vi var tvungna att uppdatera även om vi visste att det skulle bli problem.

Vad heter sökmotor på de andra europeiska språken?

1 Juli 2007 av Lars VÃ¥ge

Nu är det semestertider och vi bloggare slår också av på takten. Inte så många djupgående analyser men kanske lite praktiska tips kan det bli så här under juli. Vi börjar med en ordsökmotor eller översättningstjänst för begrepp. Den här borde jag ha känt till för länge sedan men det krävdes en artikel på den tyska sökbloggen @-web för att jag skulle få upp ögonen.

Inter Active Terminology for Europe eller kort och gott IATE är en söktjänst med vilken man kan mata in ett ord eller begrepp och få reda på vad det heter på andra europeiska språk. Det finns 23 språk sammanlagt men det är sällan att man får träff på alla. IATE är en centraliserad resurs för EU:s olika institutioner och är tänkt att vara ett översättningsstöd. 1,4 miljoner ord eller begrepp finns inlagda med uppgifter om vad de heter på olika språk. Vad jag kan förstå har IATE funnits sedan 2004 men projektet påbörjades redan 1999.

När man söker i IATE ska man ange vilket sprÃ¥k man utgÃ¥r ifrÃ¥n och, om man vill, vilka sprÃ¥k man vill ha svar pÃ¥. Man kan ocksÃ¥ begränsa sökningen till en tematisk domän (se EU:s thesaurus EUROVOC) och ange om sökuttrycket är en fras, en förkortning eller en term. Jag sökte pÃ¥ sökmotor pÃ¥ svenska och fick veta vad det heter pÃ¥ nio andra sprÃ¥k. “Motor de busca” heter det t.ex. pÃ¥ portugisiska och “motor di ricerca” pÃ¥ italienska. PÃ¥ vilket sprÃ¥k det heter “hakumoottori” tänker jag inte berätta.

Bloggtoppen.se

Blogglista.se

Global Voices Online - The world is talking. Are you listening?

Creeper

Nowhere North

↑ Grab this Headline Animator



iselid info

↑ Grab this Headline Animator