Arkiv för kategorin ‘SprÃ¥ktekniker’

Google och Yahoo tävlar med automatisk översättning

1 Maj 2006 av Lars VÃ¥ge

SandlÃ¥dekriget fortsätter mellan de tvÃ¥ giganterna bland söktjänster - Google och Yahoo. I veckan introducerade Yahoo för första gÃ¥ngen möjligheten till automatisk översättning av texter och webbsidor. Det är Babel Fish som nu stÃ¥r för översättningstjänsterna i Yahoo liksom det varit i Altavista ända sedan december 1997. Det är i princip samma sprÃ¥k som erbjuds i Yahoo Babel Fish som i Altavistaversionen. Som ett svar pÃ¥ Yahoos initiativ har Google utvidgat sina Google Language Tools att nu inkludera översättningar mellan arabiska och engelska vilket faktiskt inte erbjuds av Babel Fish. Med Google kan man nu “hjälpligt förstÃ¥” texter genom automatiska översättningar frÃ¥n tyska, spanska, franska, italienska, portugisiska, japanska, koreanska, förenklad kinesiska och nu alltsÃ¥ arabiska. Babel Fish hos Yahoo och Altavista klarar alltsÃ¥ inte arabiska men i övrigt alla sprÃ¥k som Google erbjuder och dessutom holländska, grekiska, ryska och traditionell kinesiska! Vad gäller arabiskan kan man ju t.ex. testa pÃ¥ Al-Jazeera för att jämföra innehÃ¥llet med den engelsksprÃ¥kiga versionen.

Ny version av Quintura Search

9 Mars 2006 av Lars VÃ¥ge

En uppdatering av det visuella och språkkunniga sökverktyget Quintura kom i förra veckan. Jag beskrev detta spännande program i slutet av januari och var då även i kontakt med skaparen av programmet. När nu version 1.5 av Quintura kommit märker jag några trevliga förbättringar.
Först och främst har det tillkommit ett flertal nya söktjänster att köra Quintura mot. Bland dessa finns t.ex. Yahoo News, Wikipedia, Ask.com, Scirus och Amazon. En annan bra förändring är att verktygen för att ta bort oönskade träffar har utökats. Nu finns det en ikon som man kan klicka på för att få se förslag på sökord som kan exkluderas i sökningen för att få bort träffar av det här slaget. Mycket smart. Heja på, Quintura!

Quintura - the way people search : visuellt sökverktyg

26 Januari 2006 av Lars VÃ¥ge

Ibland skickar utvecklare av söktjänster och sökverktyg e-post till oss när de lanserar en ny produkt eller kommer med en ny version. Nyligen fick vi veta från Yakov Sadchikov att programmet Quintura nu till slut hade blivit klart i skarp version. Yakov var också vänlig nog att svara på lite frågor som jag hade om som det visade sig det mycket spännande programmet.

Quintura är ett sökverktyg som ska hjälpa användare att automatiskt hitta nya ord och infallsvinklar i sin webbsökning. Därför erbjuder Quintura en karta över ord där förutom själva sökorden även andra ord som förekommer i träffdokumenten visas. För att kunna använda detta mycket trevliga verktyg måste man först ladda ner och installera det. Det krävs att man använder Windows som operativsystem och att man har IE version 5.5 eller högre. När man väl har gjort detta och öppnar programmet finns det två huvudfönster som man jobbar i. Det till vänster kallas Map och det till höger Results. I vänsterrutan syns också sökrutan mitt i och med den söker man i den söktjänst som är vald i rullgardinsmenyn ovanför. De alternativ som finns med i start är Google, Google News, Yahoo och MSN Search. Från Quinturas webbplats kan man dock ladda ner plug-ins för Technorati och Google Blog Search om man vill.

När man skickat iväg en sökning fylls efter en stund utrymmet till vänster med en mängd ord förutom sökuttrycket självt, som finns mitt i markerat med rött. Runtom syns alltså andra ord som förekommer i större mängd i träffarna. Till höger finns den vanliga linjära träfflistan. Nu kommer det fina i kråksången: genom att föra musen över ord i kartan, som man tycker verkar intressanta att kombinera det ursprungliga sökuttrycket med, uppdateras listan till höger temporärt med de träffar man skulle fått om man lade till ordet ifråga. Samtidigt dyker nya ord upp på ordkartan och andra som redan fanns där kan bli tydligare markerade.

Om man nu tycker att träffarna blev mycket intressantare ska man klicka på ordet och därmed lägger man det till sökuttrycket och förändringarna i träfflistan till höger stannar. Om man tyckte att ordet gav bara skräpträffar kan man klicka på det röda krysset för att uttryckligen exkludera sökordet från sökningen. Om man slutligen tyckte att det gjorde varken från eller till kan man föra undan musen från ordet så återkommer träfflistan som den var utan att man lade till ordet och den ursprungliga ordkartbilden återkommer. På det här sättet kan man på ett smidigt sätt manipulera med sitt sökuttryck tills man kommit fram till det som ger de bästa träffarna.

Det finns mycket mer att göra med Quintura och bland det bästa är att man också kan manipulera inifrån träfflistan till höger. Här finns nämligen under varje träff alternativen Remove link och Hide site. Det senare är verkligt bra för med det kan man exkludera alla träffar från webbplatsen ifråga, med det tidigare bara en viss webbsida. Mycket praktiskt för att rensa ut skräp som trots allt kommer med efter jobbet med ordkartan. Notera att även detta uppdaterar ordkartan. Slutligen kan man efter allt jobb spara sitt arbete. Då får man ge sökningen ett namn och med detta kan man sedan kalla fram sin sökning igen med alla de förändringar och tillägg man gjort.

Jag tycker att Quintura är ett fantastisk roligt verktyg och ett pedagogiskt sätt att utveckla sitt sökande. Emellertid kunde jag ju notera att det fungerade bäst med engelska sökord. Jag skrev till Yakov och frÃ¥gade om detta och han bekräftade att det var beroende pÃ¥ om det fanns ett lexikon knutet till sprÃ¥ket ifrÃ¥ga. I Quintura finns ett engelskt lexikon installerat frÃ¥n början men det gÃ¥r att ladda ner lexikon även för tyska och ryska. Yakov skrev ocksÃ¥ att Quintura använde “natural associative principals and builds word associations intuitively” och att “it indexes word associations or relationships between words”. Därför blir det ungefär som när man söker i en klustrande söktjänst som Clusty att klustren blir lite lustiga för svenska ord.

PÃ¥ frÃ¥gan om varför Quintura inte gjorde metasökningar svarade han att det skulle ge längre svarstider och kräva avtal med söktjänsterna ifrÃ¥ga som annars inte tillÃ¥ter att deras sökträffar blandas med varandra. Dessutom skrev Yakov att det skulle komma en webbversion av Quintura och att de planerade att bygga upp en liten community där man skulle kunna ladda upp sina sparade sökningar (”mini search enigines”) och/eller kanske ha dem som en sökruta kopplad till en blogg. Vi fÃ¥r se vad som händer men för alla som är intresserade av att jobba med sina sökuttryck och hitta nya vägar rekommenderar jag varmt Quintura.

Danska radion intervjuar Hercules Dalianis om TvärSöksprojektet

10 Januari 2006 av Lars VÃ¥ge

I helgen sände den danska radion en intervju med Hercules Dalianis på KTH som arbetar med TvärSök. Internetbrus skrev i augusti om detta nordiska samsökningsprojekt där målet är att skapa en sökmotor där man kan söka på valfritt nordiskt språk men få träffar på alla språk. Intervjun gjordes i november av Carsten Nielsen som är redaktör för programmet Harddisken i danska P1. Det finns en streamad version av radioprogrammet att lyssna på och den är en kvart lång. Ljudkvaliteten är utmärkt även om det inte alltid hjälper att förstå vad Carsten säger. Det är Nordiska Ministerrådet som finansierar TvärSök och framtiden får utvisa vad som händer med tekniken efter att projektet förhoppningsvis är färdigt till sommaren. Hercules berättar också en del om sökmotorföretaget Euroling och deras sökmotor Siteseeker.

Answers.com köper frågetjänsten Brainboost

7 December 2005 av Lars Iselid

Answers.comAnswers.com, tidigare Gurunet, har köpt frågetjänsten Brainboost med ambitionen att integrera söktjänsten i Answers egna produkter. Brainboost bygger sin sökmotor på natural language processing (NLP) och presenterar sökresultatet genom att extrahera korta utdrag från webbsidorna i själva träfflistan. Ungefär som är fallet i söksyntaxen define: i Google.

I motsats till Gary Price på Search Engine Watch har jag varit mycket positiv till Brainboost och tycker att det är den bästa sökmotorn hittills med ambitionen att vara en maskinell frågetjänst. Betydligt bättre än Ask Jeeves som en gång i tiden försökte sig på att vara en frågetjänst (vilket ju också hörs i namnet), men istället har Ask Jeeves utvecklats bl.a. genom uppköpet av Teoma till en fullfjädrad sökmotor.

Gary Price kritiserar Brainboosts urval av källor, vilket det ligger mycket sanning i, men genom att integrera tekniken från Brainboost på de källor Answers valt ut kan sammanslagningen bli en riktig hit. Skulle Answers sedan på ett effektivt sätt kunna koppla betalkällor (ungefär som tanken är med Yahoo Subscriptions) till Answers gränssnitt vore det ett utmärkt sätt att förbättra tjänsten och att även kunna finansiera Answers.com. Man ska dock komma ihåg att Answers.com bara inriktar sig på att svara på engelska från källor författade på det engelska språket? Får vi se en svensk mostvarighet någon gång månntro?

Gary Price exemplifierar också med frågor han inte får något bra svar på. Självklart får man inte bra svar på allt men förvånansvärt många bra svar får man på inte allt för svåra frågor (om vi bortser från källkritiken). T.ex. When did Frank Zappa die and Why? och Who invented the light bulb?

Läs mer om köpet i ett pressmeddelande från Answers.com.

TvärSök - sökmotorprojekt för sökning tvärs över de nordiska språken

23 Augusti 2005 av Lars VÃ¥ge

Vi som bor i Sverige kan ofta hjälpligt förstå dansk eller norsk text och vice versa för de som bor i Danmark eller Norge. Däremot har vi ytterst sällan en aktiv språkkunskap så att vi t.ex. skulle kunna skriva in rätt sökord i en norskspråkig sökmotor. Nordiska Ministerrådet har nu beviljat 2,5 miljoner kronor till ett sökmotorprojekt för att råda bot på detta. Projektet kallas TvärSök och kommer att bygga på det svenska företaget Euroling AB:s SiteSeeker-sökmotor. Inblandad är naturligtvis Hercules Dalianis på KTH som trogna läsare av Internetbrus kanske drar sig till minnes är mannen som tillsammans med oss skrev boken Informationssökning på Internet som kom ut hösten 2003. En annan del av projektet är att skapa ett gratis tillgängligt tvärlexikon kallat TvärSlå för de nordiska språken. Detta kommer också att användas av TvärSök om jag fattat det hela rätt. Idén är alltså i korthet att man ska kunna söka på det egna språket men kunna få träffar på webbplatser med text på alla de nordiska språken. Det här tycker jag låter väldigt spännande och vi skickar våra varmaste välgångsönskningar till Hercules och de andra med det här projektet! (Källa: Newsdesk.se)

Sökning på homografer nu också i engelska Seekport

6 Juni 2005 av Lars Iselid

seekportSeekport, som vi skrivit om tidigare, har en funktion för sökning på homografer, dvs. ord med samma stavning men mer än en betydelse. T.ex. blad för blad på en blomma eller i en bok. Homografsökningen har sedan mars funnits på den tyska versionen, men finns nu också i den engelska. Prova en sökning på bar som ger förslag på chocolate bar, cocktail bar och gold bar.

Nackdelen med denna lösning är att Seekport bara kan skilja mellan sidor där bara den aktuella homografen nämns i ett sammanhang med tillhörande ledord t.ex. blommans blad eller bokens blad etc. StÃ¥r det t.ex. “Petunians blad…” men aldrig blomma eller kanske växt sÃ¥ mÃ¥ste ju en lista över alla tänkbara blommor upprättas eller stÃ¥r det “PÃ¥ nästa blad i boken syns en blomma…”, sÃ¥ blir det ännu mer komplicerat, men Ã¥ andra sidan ett extremt exempel.

Seekport försöker lösa det mödosamma arbetet med att upprätta listor över homografer genom att locka användarna att delta i en tävling där man kan vinna en iPod bland annat om användarna själva bidrar med förslag på homografer .

Bloggtoppen.se

Blogglista.se

Global Voices Online - The world is talking. Are you listening?

Creeper

Nowhere North

↑ Grab this Headline Animator



iselid info

↑ Grab this Headline Animator