ELEKTRONINIO PAŠTO PROGRAMŲ PALYGINIMAS LIETUVIŠKŲ RAŠMENŲ PERSIUNTIMO POŽIŪRIU

Gintautas Grigas
Rimas Misevičius

Straipsnyje analizuojama, kaip Lietuvoje daugiau paplitę elektroninio pašto programos tvarkosi su įvairiomis ženklų kodavimo lentelėmis. Pateikiamas programų sąrašas surikiuotas pagal tinkamumą siųsti lietuviškiems rašmenims.

1. Kodų lentelės naudojamos siunčiant lietuviškus rašmenis

Elektroninio pašto programų yra daug. Todėl iškyla jų pasirinkimo klausimas. Savaime aišku, kad pirmasis atrankos kriterijus yra reikalavimas, kad programa galėtų persiųsti rašto ženklus, mūsų atveju – lietuviškus.

Visuotinai priimtas elektroninių laiškų persiuntimo protokolas MIME nustato taisykles, kaip turi būti persiunčiami laiškai, parašyti įvairiomis kalbomis nepriklausomai nuo siuntėjo bei gavėjo kompiuteriuose vartojamų ženklų kodavimų. Laiškų persiuntimui pirmenybė teikiama tarptautinių standartų (ISO) reglamentuojamoms kodų lentelėms, nors gali būti vartojamos ir kitos daugiau žinomos kodų lentelės užregistruotos IANA registre [RFC2278]. Laiško siuntėjo programa turi laišką perkoduoti iš kompiuteryje vartojamo kodo į laiškų siuntimui priimtą kodą ir laiško antraštėje užrašyti kodų lentelės pavadinimą. Laiško gavėjo pašto programa turi atpažinti laiško antraštėje pateiktą informaciją ir pagal ją laišką perkoduoti į gavėjo kompiuteryje vartojamą kodą.

Vienintelė kodų lentelė, kurią nustato ir Lietuvos standartai, ir tarptautiniai standartai yra ISO/IEC 8859-13. Todėl ji naudotina laiškams persiųsti.

Šiuo metu Lietuvoje daugiausiai paplitusioje „Windows“ terpėje vartojama kodų lentelė 1257. Joje visų raidžių kodai sutampa su standartinės lentelės kodais. Skiriasi tik keturių specialiųjų ženklų kodai, tarp jų ir lietuviškų kabučių. Be to lentelėje 1257 yra daugiau ženklų, tarp jų ir brūkšnys. Jeigu šie specialieji ženklai laiške nevartojami, tai tada perkodavimo tarp šiomis lentelėmis parašytų tekstų nereikia.

Tarptautinio standarto ISO/IEC 8859-4 kodų lentelėje taip pat yra visos lietuviškos raidės. Tačiau jį atitinkantis Lietuvos standartas nuo 1993 m. nebegalioja [1] . Dėl to jis nevartotinas. Bet dar pasitaiko jį naudojančių pašto programų.

Priklausomai nuo naudojamos ženklų kodavimo lentelės laiško antraštėje gali būti viena iš šių eilučių:

Content-type: text/plain; charset=iso-8859-13

Content-type: text/plain; charset=windows-1257

Content-type: text/plain; charset=iso-8859-4

2. Elektroninio pašto programų analizė

Elektroninio pašto programų atitikimas MIME protokolo reikalavimams bei jų darbas persiunčiant nacionalinių abėcėlių rašmenis buvo atliktas jas testuojant. Testavimo metodika ir rezultatai pateikti straipsnyje [2]. Šiame darbe pasinaudojant testavimo rezultatais bandoma išskirti svarbiausius pašto programų parametrus jų tinkamumo lietuviškiems rašmenims persiųsti požiūriu ir pagal tai jas surikiuoti į eilę. Tai galėtų pasitarnauti pasirenkant pašto programas.

Su panašiomis problemomis susiduriama ir persiunčiant laiškus kitomis kalbomis. Daugiausia problemų turi Vidurio Europos bei kirilicos abėcėlę vartojančios kalbos. Šių kalbų kodų lentelės, vartojamos „Windows“ terpėje daugiau skiriasi nuo tarptautinių standartų bei kitų elektroniniame pašte naudojamų kodų lentelių [1]. Jų problemos sprendžiamos tarptautiniame projekte TERENA [3].

Daugiau paplitusių pašto programų analizės rezultatai pateikti 1 lentelėje. Joje programų parametrai vertinami penkių balų skale nuo 0 (blogiausias įvertis) iki 4 (geriausias įvertis). Pateikiami vertinimai trims minėtoms kodų lentelėms. Tačiau programų rikiavimui į tinkamumo eilę imama tik ISO ir Lietuvos standartais pripažinta kodų lentelė ISO 8859-13.

1 lentelė

Elektroninio pašto programa Kompiuterio kodų lentelė Laiškų siuntimas Laiškų gavimas
    ISO 8859–13 1257 ISO 8859–4 ISO 8859–13 1257 ISO 8859–4
    a b a b a b c d c d c d
Demos Mail 770, 771, 772, 774, 775 4 4 1 1 1 1 4 4 4 4 4 4
Pegasus Mail 1257 4 3 4 2 4 3 3 3 2 (4) 3 3
Eudora Light (Windows) 1257 0 0 0 0 0 0 0 0* 0 (4*) 0 0*
Eudora Light (Mac Os) 90029 3 3 3 3 0 0 3 3 3 3 0 0
The Bat 1257 2 2 4 4 2 2 2 2 4 4 2 2
Microsoft Outlook Express 1257 1 1 4 4 4 4 1 1 4 4 4 4
Pine – 4 0 4 0 4 0 4 0 4 0 4 0
Netscape Communicator 1257 0 0 0 0 0 0 0 0* 0 (4*) 0 0
Tango 1257 0 0 4 4 4 4 4 0 4 4 4 4

Stulpelių reikšmės:

a - kodų lentelę galima nurodyti laiško antraštėje,

b - siunčiamo laiško tekstą perkoduoja iš kompiuterio kodų lentelės į nurodytą lentelę,

c - programa atpažįsta laiško antraštėje nurodytą kodų lentelę ir reaguoja į tai (jeigu negali perkoduoti - neperkoduoja ir apie tai informuoja laiško gavėją),

d - gauto laiško tekstą perkoduoja iš nurodytos kodų lentelės į kompiuterio kodų lentelę.

Skaičių reikšmės:

4 – programa šią savybę turi,

3 - oficialia platinama programa šios savybės neturi, bet egzistuoja laisvai platinami papildymai, programai suteikiantys šią savybę,

2 - programa šios savybės neturi, bet galima ja papildyti keičiant tekstines resursų bylas,

1 - programa šios savybės neturi, bet galima ja papildyti keičiant koduotas resursų bylas,

0 - programa šios savybės neturi ir negalima ja papildyti išorinėmis priemonėmis.

Skaičiai skliaustuose rodo, kad tokia galimybė gaunama be perkodavimo, kai gauto laiško kodas sutampa su kompiuteryje vartojamu kodu.

Žvaigždutė * rodo, jog programa neatkoduoja laiško antraštės laukų, koduotų QP arba B64 kodu.

Naudojantis lentelėje pateiktais rezultatais pašto programas galima sugrupuoti į keturias grupes pagal jų tinkamumą darbui Lietuvoje.

1. Tinka. Programa gali siųsti ir gauti laiškus koduotus standartiniu kodu ISO 8859-13 (įverčiai 3 arba 4): Demos Mail 2.06, Pegasus Mail, Eudora Lihgt (Mac OS).

2. Tinka su išlygomis. Programa gali siųsti ir gauti laiškus koduotus standartiniu kodu, tačiau laiškų neperkoduoja iš vienos lentelės į kitą: Pine.

3. Netinka. Tačiau yra galimybę programą nesunkiai papildyti išorinėmis priemonėmis taip, kad tiktų (įvertis 2): The Bat.

4. Netinka. Papildyti išorinėmis priemonėmis sudėtinga (įverčiai 0 arba 1): Eudora Light (Windows), Netscape Communicator, Microsoft Outlook Express ir Tango (dvi paskutinės neveikia su ISO 8859–13 kodu, tačiau veikia su kitais kodais).

Vertinimo kriterijus galima sugriežtinti pareikalavus, kad programa galėtų priimti laiškus, koduotus 1257 ir ISO 8859–4 kodais. Tai natūralu: programa turi išsiųsti laiškus absoliučiai tvarkingus, bet pageidautina, kad su gautais laiškais elgtųsi tolerantiškiau – priimtų ir kitaip koduotus. Tačiau paanalizavus lentelę matome, kad vertinimo sugriežtinimas programų rikiavimui į eilę pagal tinkamumą esminės reikšmės neturėtų.

 

Literatūros sąrašas

[1] G. Grigas. Kodų lentelių, vartojamų elektroniniame pašte, analizė. Informacijos mokslai. 9, p. 68–75.

[2] R. Misevičius. Elektroninio pašto programų analizė nacionalinių rašmenų persiuntimo požiūriu. Informacijos mokslai. 9, p. 76–86.

[3] Y. Demchenko, K. Chuguev, J. Faganel, J. Stefan. Multilingual Email Client Testing. TERENA Technical Report, September, 1998.

THE COMPARISION OF ELECTRONIC MAIL SOFTWARE FROM THE POINT OF VIEW OF SENDING LITHUANIAN CHARACTERS

Summary

The most popular in Lithuania electronic mail software is analyzed. Three code tables: ISO 8859-13, ISO 8859-4 and Windows-1257 relevant for sending Lithuanian texts are analyzed. The preferred table is ISO 8859-13. The results of testing various electronic mail programs are presented. They show which programs are best suitable for sending Lithuanian characters.

Anotacija

Straipsnyje analizuojamos Lietuvoje labiau paplitę elektroninio pašto programos. Nagrinėjamos trys kodų lentelės tinkamos Lietuviškiems rašmenims siųsti: ISO 8859-13, ISO 8859-4 ir Windows-1257. Pirmenybė teikiama ISO 8859-13 lentelei. Pateikiami įvairių pašto programų testavimo rezultatai iš kurių matyti kurios programos geriausiai tinka lietuviškiems rašmenims siųsti. Pagal tinkamumą programos surikiuojamos į eilę.