Блогчетање

Данилово блогче

Sun, 28 Sep 2003

Ћирилица, као основно писмо српског језика, је далеко од заступљене у рачунарској примени. Основни разлог тога је постојање довољно доброг (тј. употребљивог) писма за српскохрватски језик, тзв. латиничног писма, или, у одређеним круговима, „хрватске латинице“.

Разлог зашто је ћирилица заиста боља од латинице, и за српски и за хрватски језик, је у томе што је у потпуности фонетско писмо. У неком погледу ово је мала предност, а у другом, веома значајна. У сваком случају, не може се оспорити да је ово предност, те и један закључак у прилог употреби ћирилице.

Разлог против ћирилице којем је најтеже доскочити је лакоћа употребе ћирилице на рачунарима. Свакако, последњих година се отишло веома далеко, и није проблематично добити основну подршку за унос и читање ћириличног текста у модерним радним окружењима (као што су Гном, КДЕ, и Windows).

И, ово је дало повода многима да тврде да су техничке тешкоће у употреби ћирилице ишчезле. Ипак, поведен закључцима које је Зомби извео у вези са Уникодом, размислио сам да ли је заиста тако.

Наиме, већина ствари „на Интернету“ се данас догађа на вебу. И мада ППНТ садржи одличну подршку за већи број језика, скупова знакова, кодирања још од 1997. године, не може се лако избећи чињеница да је већина садржаја енглеског, немачког или француског порекла — укратко, 1. ИСО латинични скуп знакова ISO-8859-1 их сасвим лепо покрива.

Шта ово заправо значи за употребу ћирилице на вебу? Као прво, то значи да је највећи део свега прилагођен управо ограниченом латиничном скупу знакова, и да је немогуће унети ћирилични знак у, на пример, обрасцу за наручивање ЦД-а на страници Задужбине за слободни софтвер. Свакако, ово можемо приписати самовољи Американаца, Енглеза, Немаца или кога год, али ова могућност отпада када схватимо да и већина руских, јапанских и кинеских страница такође користи скупове знакова који су употребљиви само за један језик — њихов.

Да се још ради само о Русима, могли бисмо да закључимо да је у питању уштеда простора. Ипак, примери јапанског и кинеског језика нам говоре да о уштеди нема ни говора, пошто је број „осталих“ знакова разних језика знатно мањи од знакова потребних за запис неког од ова два језика. Свакако, ту постоји и додатни проблем тзв. „Хан сједињавања“, где се слични (у неком чудном смислу) знаци из кинеског и јапанског писма смештају на једно место, те Уникод и није претерано користан.

Значи, уобичајена је појава да се користи скуп знакова који се најлакше добија на рачунарима: у Америци, Енглеској, Немачкој, Француској и другим земљама, то је ISO-8859-1, у Русији је то КОИ8-Р или CP-1251 (једино је монопол Микрософта могао да прогура и неки други скуп знакова поред КОИ8-Р-а), у Азији многи међу собом неусаглашени скупови знакова и кодирања, а код нас, АСКРИ, ЈУСКРИ или CP-1251.

Мој коначан закључак је: свет није спреман за вишејезичност.

Поред свих разматрања, тек сада долазим до суштине. Нови корисник Интернета (па самим тим и веба), жели што пре да ускочи у све модерне токове, и да постане равноправни учесник ове глобалне селендре, и тиме допринесе њеном срозавању на што више начина. Тако, пожелеће да се укључи у рад „форума“: стручне или необавезне расправе у којима учествују људи разних позадина; затим, пожелеће да направи своју страницу, своје блогче, или да шаље е-пошту.

Све то ће урадити онако како би сваки почетник урадио — да уложи што мање труда, и да што пре стигне до резултата (не бринући о квалитету истог). То значи да ће највероватније користити постојећа решења, а њих је највише пореклом из неког од једнојезичних извора.

Такође, поменућу и врло конкретне примере и решења потребна да би се добила подршка за ћирилицу у постојећим решењима.

Наиме, када сам желео да поставим своју Вики страницу, налетео сам на неколико проблема. Као прво, дефиниција једнообразних ознака ресурса (URI) не допушта употребу знакова ван АСКРИ скупа, па ћирилица аутоматски отпада. Ипак, у српском језику се ћирилица може веома пристојно представити и помоћу АСКРИ знакова, и то тако да адресе испуне своју сврху: лаке за памћење, и не ремете организацију страница. Софтвер који сам изабрао је Квики, писан у Перлу, веома једноставан и лако проширив. Наравно, да би се обезбедила и сама подршка за 8-битну трансформацију Уникода (УТФ-8) потребно је познавати Перл и његов рад са Уникод нискама — свакако не ствар који горепоменути почетник зна. Да би се постигло да ћириличне везе показују на АСКРИ адресе, потребно је и знатно више познавати Перл.

Другом приликом сам пожелео да започнем своје блогче (ово, наравно, под притиском Зомбија ;-), уз свакако неопходну подршку и за српски, и за све остале језике. Опет УТФ8. Како сам велики заљубљеник у прогамски језик Питон, то сам желео искључиво да користим софтвер написан у њему. Како је то сјајан језик, нисам ни сумњао да ћу наићи на гомилу квалитетних, постојећих програма за вођење веб дневника. Ипак, убрзо сам наишао на проблем подршке за УТФ8. Што је најгоре од свега, Питон и сам подржава Уникод веома природно и квалитетно, те заиста не постоји ниједан технички разлог који би спречио писце програма да га користе. Ипак, испоставило се да сам погрешио.

Софтвер који сам поставио, Pybloxsom, је лепо написан, квалитетан и нуди све модерне могућности (уз мало труда, наравно). Да бих добио најосновнију подршку за приказ ћириличних знакова, довољно је поставити скуп знакова на УТФ8. Али, када је на ред дошао унос ћирилице преко XML-RPC протокола (очекује се да ће свако на овај начин слати уносе у своје блогче, пошто је најбржи и најлакши начин), испоставило се да он не ради са УТФ-8 баш сјајно. И опет, једино је чињеница да Питон познајем мени омогућила да све то средим. Са насловима страница се појавио исти проблем као и са ВикиВезама у Квикију — оне се користе и у адресама те је незгодно користити ћирилицу, и пожељно је превести их у АСКРИ.

И у овом случају, почетник би се највероватније задовољио употребом енглеске латинице, посве недовољном за српски, или већину светских језика.

На ово се може додати и безброј других проблема који прате човека који жели да користи ћирилицу (или било које друго писмо — није ово питање које се тиче искључиво ћирилице), а не чини ми се да се претерано брзо иде ка бољем решењу.

Чак, занимљива је појава да се „клијентски“ програми, они намењени раду у највероватније једнојезичном окружењу, брже припремају за рад у вишејезичним окружењима (Уникод интерно користе радна окружења Гном, КДЕ и Windows, највероватније и MacOS/X) него Интернет и веб — својевремено симболи вишенародности, вишејезичности и многих разлика — рекао бих, потпуно супротно од очекиваног.

Увек се сетим зашто сам и почео да користим ћирилицу у знатно већој мери: желео сам да савладам техничке изазове у том погледу. Мислим да је и даље употреба ћирилице на сваком месту, заиста технички изазов.

(Најчешће критике на рачун „ћириличара“ су да покушавају да наметну ћирилицу и другима; мада постоје и такви, то је још једно лоше уопштавање — свакако да су они који покушавају да латиницу наметну и другима [можда ће се препознати понеко :] једнако лоше усмерени као и ови).

[15:57] | [] | # | G | | TB
Contact
Danilo Segan

This is blog (web log) of Danilo Šegan (or Данило Шеган).

Archives
2017-Jan
2013-Dec
2011-Nov
2011-Oct
2011-Aug
2011-Jul
2011-Jun
2011-May
2010-Oct
2010-Aug
2010-Jul
2010-Apr
2010-Mar
2010-Feb
2010-Jan
2009-Dec
2009-Oct
2009-Aug
2009-Jun
2008-Oct
2008-Aug
2008-Jul
2008-Jun
2008-May
2008-Apr
2008-Mar
2008-Feb
2007-Dec
2007-Oct
2007-Aug
2007-Jul
2007-May
2007-Apr
2007-Feb
2007-Jan
2006-Nov
2006-Oct
2006-Aug
2006-Jul
2006-Apr
2006-Mar
2006-Feb
2006-Jan
2005-Sep
2005-Jun
2005-May
2005-Apr
2005-Mar
2005-Feb
2004-Dec
2004-Nov
2004-Oct
2004-Sep
2004-Aug
2004-Jul
2004-May
2004-Apr
2004-Mar
2004-Feb
2004-Jan
2003-Dec
2003-Nov
2003-Oct
2003-Sep
1983-Mar

< September 2003 >
MoTuWeThFrSaSu
1 2 3 4 5 6 7
8 91011121314
15161718192021
22232425262728
2930     
Categories

Links
Kvota.net
Prevod.org
My study page
Srpski.org
GNOME
Friends' Blogs
alex (en)
bc (en)
Bojan Živanović (sr)
Carlos (en)
Goran (sr)
imp (sr)
lilit (sr)
Oskuro (en)
Zombie (sr/en)
Feeds
RSS