Google Universal Search del två - tvärsökning mellan språk
Förra veckan beklagade jag mig över en del av Googles satsning mot vad de kallar Universal Search. Den andra delen som kom några dagar senare tycker jag är klart intressantare. Allt har väl att göra med vilken inställning man har till maskinöversättning. För det är vad det handlar om i den här delen. Att sökmotorer gör automatöversättningar av webbsidor är i och för sig inget nytt, det började ju Altavista med i samarbete med Babelfish för mer än tio år sedan.
Att söka på ett språk och få träffar på andra språk är däremot inte så många som gjort och inga av de stora sökmotorerna. Däremot finns det ett nordiskt projekt med en sökmotor där man kan söka på ett nordiskt språk och få träffar på alla de nordiska språken. Det är Tvärsök som vi skrivit om tidigare och sedan hösten 2006 finns en demo av Tvärsökmotorn på Nordiska Ministerrådets webbplats. Hercules Dalianis på KTH har en sida med förslag på sökuttryck som illustrerar tvärsökningen. Prova t.ex. att tvärsöka på hållbar utveckling.
Åter till Google då som nu gjort en egen tvärsökning. Denna hittar man under Google Translate och har rubriken Search websites in another language. Fast hur man ska hitta till Google Translate kan man fråga sig. Inte från hemsidan, inte under Language Tools, inte under Google Labs. Hur som helst finns det tolv språk att utgå ifrån och förutom engelska är det europeiska språk som tyska, franska, spanska, portugisiska och italienska. Därutöver finns ryska, arabiska, kinesiska, japanska och koreanska. Tyvärr inte svenska alltså. Utgår man från engelska kan man få träff på vilket som helst av de tolv språken. Om man däremot utgår från något av de andra kan man bara få träffar på engelska och i två fall franska eller tyska också.
Maskinöversättning är inte en felsäker teknik, mycket långt därifrån. Inte så sällan får man helt oläsliga texter men ibland blir det ganska hyggligt. Det viktigaste är att tekniken är som Googles tekniker skriver i utvecklarbloggen:
usually good enough for you to obtain the gist of information in a language you might otherwise be unable to access
Ibland kan det räcka, ibland inte.
