Блогчетање

Данилово блогче

Sun, 28 Sep 2003

Ћирилица, као основно писмо српског језика, је далеко од заступљене у рачунарској примени. Основни разлог тога је постојање довољно доброг (тј. употребљивог) писма за српскохрватски језик, тзв. латиничног писма, или, у одређеним круговима, „хрватске латинице“.

Разлог зашто је ћирилица заиста боља од латинице, и за српски и за хрватски језик, је у томе што је у потпуности фонетско писмо. У неком погледу ово је мала предност, а у другом, веома значајна. У сваком случају, не може се оспорити да је ово предност, те и један закључак у прилог употреби ћирилице.

Разлог против ћирилице којем је најтеже доскочити је лакоћа употребе ћирилице на рачунарима. Свакако, последњих година се отишло веома далеко, и није проблематично добити основну подршку за унос и читање ћириличног текста у модерним радним окружењима (као што су Гном, КДЕ, и Windows).

И, ово је дало повода многима да тврде да су техничке тешкоће у употреби ћирилице ишчезле. Ипак, поведен закључцима које је Зомби извео у вези са Уникодом, размислио сам да ли је заиста тако.

Наиме, већина ствари „на Интернету“ се данас догађа на вебу. И мада ППНТ садржи одличну подршку за већи број језика, скупова знакова, кодирања још од 1997. године, не може се лако избећи чињеница да је већина садржаја енглеског, немачког или француског порекла — укратко, 1. ИСО латинични скуп знакова ISO-8859-1 их сасвим лепо покрива.

Шта ово заправо значи за употребу ћирилице на вебу? Као прво, то значи да је највећи део свега прилагођен управо ограниченом латиничном скупу знакова, и да је немогуће унети ћирилични знак у, на пример, обрасцу за наручивање ЦД-а на страници Задужбине за слободни софтвер. Свакако, ово можемо приписати самовољи Американаца, Енглеза, Немаца или кога год, али ова могућност отпада када схватимо да и већина руских, јапанских и кинеских страница такође користи скупове знакова који су употребљиви само за један језик — њихов.

Да се још ради само о Русима, могли бисмо да закључимо да је у питању уштеда простора. Ипак, примери јапанског и кинеског језика нам говоре да о уштеди нема ни говора, пошто је број „осталих“ знакова разних језика знатно мањи од знакова потребних за запис неког од ова два језика. Свакако, ту постоји и додатни проблем тзв. „Хан сједињавања“, где се слични (у неком чудном смислу) знаци из кинеског и јапанског писма смештају на једно место, те Уникод и није претерано користан.

Значи, уобичајена је појава да се користи скуп знакова који се најлакше добија на рачунарима: у Америци, Енглеској, Немачкој, Француској и другим земљама, то је ISO-8859-1, у Русији је то КОИ8-Р или CP-1251 (једино је монопол Микрософта могао да прогура и неки други скуп знакова поред КОИ8-Р-а), у Азији многи међу собом неусаглашени скупови знакова и кодирања, а код нас, АСКРИ, ЈУСКРИ или CP-1251.

Мој коначан закључак је: свет није спреман за вишејезичност.

Поред свих разматрања, тек сада долазим до суштине. Нови корисник Интернета (па самим тим и веба), жели што пре да ускочи у све модерне токове, и да постане равноправни учесник ове глобалне селендре, и тиме допринесе њеном срозавању на што више начина. Тако, пожелеће да се укључи у рад „форума“: стручне или необавезне расправе у којима учествују људи разних позадина; затим, пожелеће да направи своју страницу, своје блогче, или да шаље е-пошту.

Све то ће урадити онако како би сваки почетник урадио — да уложи што мање труда, и да што пре стигне до резултата (не бринући о квалитету истог). То значи да ће највероватније користити постојећа решења, а њих је највише пореклом из неког од једнојезичних извора.

Такође, поменућу и врло конкретне примере и решења потребна да би се добила подршка за ћирилицу у постојећим решењима.

Наиме, када сам желео да поставим своју Вики страницу, налетео сам на неколико проблема. Као прво, дефиниција једнообразних ознака ресурса (URI) не допушта употребу знакова ван АСКРИ скупа, па ћирилица аутоматски отпада. Ипак, у српском језику се ћирилица може веома пристојно представити и помоћу АСКРИ знакова, и то тако да адресе испуне своју сврху: лаке за памћење, и не ремете организацију страница. Софтвер који сам изабрао је Квики, писан у Перлу, веома једноставан и лако проширив. Наравно, да би се обезбедила и сама подршка за 8-битну трансформацију Уникода (УТФ-8) потребно је познавати Перл и његов рад са Уникод нискама — свакако не ствар који горепоменути почетник зна. Да би се постигло да ћириличне везе показују на АСКРИ адресе, потребно је и знатно више познавати Перл.

Другом приликом сам пожелео да започнем своје блогче (ово, наравно, под притиском Зомбија ;-), уз свакако неопходну подршку и за српски, и за све остале језике. Опет УТФ8. Како сам велики заљубљеник у прогамски језик Питон, то сам желео искључиво да користим софтвер написан у њему. Како је то сјајан језик, нисам ни сумњао да ћу наићи на гомилу квалитетних, постојећих програма за вођење веб дневника. Ипак, убрзо сам наишао на проблем подршке за УТФ8. Што је најгоре од свега, Питон и сам подржава Уникод веома природно и квалитетно, те заиста не постоји ниједан технички разлог који би спречио писце програма да га користе. Ипак, испоставило се да сам погрешио.

Софтвер који сам поставио, Pybloxsom, је лепо написан, квалитетан и нуди све модерне могућности (уз мало труда, наравно). Да бих добио најосновнију подршку за приказ ћириличних знакова, довољно је поставити скуп знакова на УТФ8. Али, када је на ред дошао унос ћирилице преко XML-RPC протокола (очекује се да ће свако на овај начин слати уносе у своје блогче, пошто је најбржи и најлакши начин), испоставило се да он не ради са УТФ-8 баш сјајно. И опет, једино је чињеница да Питон познајем мени омогућила да све то средим. Са насловима страница се појавио исти проблем као и са ВикиВезама у Квикију — оне се користе и у адресама те је незгодно користити ћирилицу, и пожељно је превести их у АСКРИ.

И у овом случају, почетник би се највероватније задовољио употребом енглеске латинице, посве недовољном за српски, или већину светских језика.

На ово се може додати и безброј других проблема који прате човека који жели да користи ћирилицу (или било које друго писмо — није ово питање које се тиче искључиво ћирилице), а не чини ми се да се претерано брзо иде ка бољем решењу.

Чак, занимљива је појава да се „клијентски“ програми, они намењени раду у највероватније једнојезичном окружењу, брже припремају за рад у вишејезичним окружењима (Уникод интерно користе радна окружења Гном, КДЕ и Windows, највероватније и MacOS/X) него Интернет и веб — својевремено симболи вишенародности, вишејезичности и многих разлика — рекао бих, потпуно супротно од очекиваног.

Увек се сетим зашто сам и почео да користим ћирилицу у знатно већој мери: желео сам да савладам техничке изазове у том погледу. Мислим да је и даље употреба ћирилице на сваком месту, заиста технички изазов.

(Најчешће критике на рачун „ћириличара“ су да покушавају да наметну ћирилицу и другима; мада постоје и такви, то је још једно лоше уопштавање — свакако да су они који покушавају да латиницу наметну и другима [можда ће се препознати понеко :] једнако лоше усмерени као и ови).

[15:57] | [] | # | G | | TB

Wed, 24 Sep 2003

Ово је само пробни примерак уноса да видим да ли ради унос ћирилице у насловима (треба да буде пребачено у АСКРИ — Амерички Стандардни Кôд за Размену Информација :-).

Уз то, средио сам и самооткривање (autodiscovery) трекбек адреса, па нпр. када дам директну адресу до једног уноса у блогче, у том уносу очекујем примедбу.

Зомбијева страница користи МуваблТајп софтвер, па ћемо и то да искористимо за проверу самооткривања.

[22:21] | [] | # | G | | TB

Sat, 20 Sep 2003

Прошла је прва година од како користим програмски језик Питон.

Први пут сам га употребио за израду моје студентске странице, како већ сведочи следећи дневник измена:

#   2002-09-21 09:48 -- verzija 1.0.3
#      Osnovno obrazovanje stranica završeno, treba srediti rad
#      sa entitetima
#   2002-09-21 00:54 -- verzija 1.0.2
#      Ispravljen DTD, i dodata propuštena vrsta taga: samostalan
#      (kakav je npr. BR tag u HTML)
#   2002-09-18 23:02 -- verzija 1.0.1
#      Učitavanje SGML saja u memoriju izvedeno, validacija
#      dobro radi, dozvoljeni implicitno zatvoreni tagovi
#      - Preostalo još izraditi generisanje sajta
#
#   2002-09-18 20:00 -- verzija 1.0.0
#      Završena incijalizacija DTD-a, strukture za razne tipove
#      tagova, i obrazovan okvir za dalji rad
#
#   2002-09-16 17:32 -- verzija 0.0.0
#      Počeo rad na Piton programu, a kako prvi put koristim
#      Piton, brzina izrade je mala
#

Сретна ми и будућа употреба овог програмског језика :-)

Успут, баш сам данас сачинио и један мали Питон програм који чисти поруке на ПОП3 серверу актуелног спама. Како можете приметити да је програм веома кратак, ето доброг разлога да почнете да користите овај програмски језик.

#!/usr/bin/python

import poplib, getpass, re, os, string, sys

server=sys.argv[1]
korisnik = sys.argv[2]
lozinka = sys.argv[3] 

veza=poplib.POP3(server)

print veza.getwelcome()

veza.user(korisnik)
veza.pass_(lozinka) #getpass.getpass('Lozinka za %s:' % (korisnik)))

broj=len(veza.list()[1])

regex = re.compile('^SUBJECT:[ ]*(.*)$',re.MULTILINE)
tema = re.compile('subject',re.I)
poslao = re.compile('^from:(.*)$',re.M+re.I)

for i in range(broj):
    j = string.join(veza.top(i+1,0)[1], "\n")
    nasao = regex.search(j)
    imatemu = tema.search(j)
    nematemu = not(imatemu)
    if nasao or nematemu:
        if nasao:
            naslov=nasao.group(1)
        else:
            naslov='No title'

        ime=poslao.search(j)
        if ime:
            adresa=ime.group(1)
        else:
            adresa='unknown'
        print "no. %d from '%s': '%s'" % (i+1, adresa, naslov)
        if os.environ.has_key("REMOVE_VIRUSES") and os.environ["REMOVE_VIRUSES"]=='1':
            veza.dele(i+1)
    else:
        pass
            

veza.quit()
[13:56] | [/python] | # | G | | TB

Wed, 17 Sep 2003

Okay, I have the fully translated Gnome 2.4. But what's it worth when there are a bunch of problems which make it look... well, less translated, and less usable.

One of them is that gnome-panel and nautilus do some crappy .desktop file handling — they strip off the modifier part of "locale" in .desktop files, and thereby, sr@Latn overrides sr translation if it's latter in the file, or vice versa if sr is latter. There's also similar problem in libgnome-desktop (part of module gnome-desktop), which, I believe, is easily solved.

The other is that Gtk+ has it's own Compose and XKB handling. It is great because it provides some stuff that is wonderful for working with both (at the same time) cyrillic and latin keyboard (like smart shortcut handling), but it sucks because one cannot just make XKB and Compose file modifications, and have it work.

Ah well, at least it works in uxterm :-)

I am working on fixing the first issue, and the fix for the other one should be trivial (just editting the corresponding file which contains all the compose combinations, probably the one derived from XFree86's en_US.UTF-8/Compose file. So, for the Serbian live Gnome CD Slobo is working on, all of these should be included, because we don't want people to report things that are known problems.

The second issue, while trivial to fix in terms of coding, is a bit politically charged. Unicode has decided not to include accented cyrillic letters in the basic glyph repository. It would be all fine if there was enough good software that could make use of "combining" characters as specified in Unicode. Alas, there isn't, so there's no way to type „long o“ which is one of the most used letters. What people usually do is to type „latin small letter o with circumflex“, and that does the job graphicaly. Since there are not even intentions to include cyrillic accented letter in Unicode in the future, this is atm the best solution possible.

Actually, I do use that in my Compose file, but it works only in X programs that don't do any sophisticated keyboard handling (meaning, Gtk+ and fellas don't work with it). The proper solution might be to fix Pango to render sequence <dead_circumflex>+<Cyrillic_o> the same as <dead_circumflex>+<o> (or, <o with circumflex>), but it's not going to happen anytime soon, either. Yet, if Pango can render right-to-left scripts, complicated compositing for Arabic, it sure can and should handle this. Perhaps, it's also just a thing of modifying a certain table in it's internals.

Okay, this was my first sane input in English, because I hope to have some non-Serbian speaking audience on these issues.

[14:21] | [/gnome] | # | G | | TB

Tue, 16 Sep 2003

Није дуго ни трајало а већ одустајем од свог „бневника“. На инсистирање Зомбија, прелазим на употребу израза „блогче“ (наводно подсећа на блокче, и самим тим је у складу са описом израза „блог“ у мом првом уносу — служи за свакакве баљезгарије).

У складу са тим, и измена наслова из „Блогање“ у „Блогчетање“ (можда је боље „Блогчење“?).

[01:01] | [] | # | G | | TB

Mon, 15 Sep 2003

Изгледа да све иде добрим путем. Марко Росић (координатор превода КДЕ-а на српски језик) се напокон пријавио на Превод.орг, ради учешћа у изради речника.

Очигледно да је био задовољан, пошто је предложио да удружимо снаге у изради речника (бар у техничком делу проблема).

За сада је само потребно пренети све постојеће програме на неку неутралну локацију, а затим би се радило на унапређењу постојећег решења. (Једина мана овог приступа је што би Горанов речник престао да ради уколико би се изменила адреса MySQL сервера).

Наравно, и OSNY има интересовања у самој ствари, па ћемо видети на шта ће то изаћи.

[18:02] | [/prevod] | # | G | | TB

Ево, управо испробавам gnome-blog.

Користим издање из Гномовог CVS-а, а ни оно још увек не садржи превише могућности.

Подржана су зацрњена слова, као и курзив, а наводно и уношење веза ка страницама (а то мени баш и не ради најсјајније).

Наравно, користим преведено издање ;-)

[16:18] | [/blogging] | # | G | | TB

Поставио сам свој „бневник“ (од „веб дневник“).

Сучеље сам задржао на енглеском, али само за кратко време. Разлог томе је што могу очекивати и посетиоце који не разумеју српски.

Проблем је што Pybloxsom користи називе дана и месеца из текућег локалитета. А на разним удаљеним веб серверима, сигурно неће постојати исправни локалитети за српски језик. Успут, нема ниједног разлога зашто не би уградио подршку за „преговарање о садржају“ (content negotiation), и на тај начин омогућио истовремено постојање сучеља на неколико језика.

Корисник би добио оно сучеље које је изабрао међу поставкама свог читача веба.

Да закључим шта је све потребно:

  • Променљиве у зависности од језика, које се неприметно укључују у шаблоне
  • Шаблони у зависности од језика
  • Преговарање о садржају у складу са HTTP протоколом издања 1.1
  • Прерадити Pybloxsom и додатке (као што је pycalendar) да не користе локалитете и strftime, већ изабране податке.
[10:44] | [/blogging] | # | G | | TB
Contact
Danilo Segan

This is blog (web log) of Danilo Šegan (or Данило Шеган).

Archives
2017-Jan
2013-Dec
2011-Nov
2011-Oct
2011-Aug
2011-Jul
2011-Jun
2011-May
2010-Oct
2010-Aug
2010-Jul
2010-Apr
2010-Mar
2010-Feb
2010-Jan
2009-Dec
2009-Oct
2009-Aug
2009-Jun
2008-Oct
2008-Aug
2008-Jul
2008-Jun
2008-May
2008-Apr
2008-Mar
2008-Feb
2007-Dec
2007-Oct
2007-Aug
2007-Jul
2007-May
2007-Apr
2007-Feb
2007-Jan
2006-Nov
2006-Oct
2006-Aug
2006-Jul
2006-Apr
2006-Mar
2006-Feb
2006-Jan
2005-Sep
2005-Jun
2005-May
2005-Apr
2005-Mar
2005-Feb
2004-Dec
2004-Nov
2004-Oct
2004-Sep
2004-Aug
2004-Jul
2004-May
2004-Apr
2004-Mar
2004-Feb
2004-Jan
2003-Dec
2003-Nov
2003-Oct
2003-Sep
1983-Mar

< September 2003 >
MoTuWeThFrSaSu
1 2 3 4 5 6 7
8 91011121314
15161718192021
22232425262728
2930     
Categories

Links
Kvota.net
Prevod.org
My study page
Srpski.org
GNOME
Friends' Blogs
alex (en)
bc (en)
Bojan Živanović (sr)
Carlos (en)
Goran (sr)
imp (sr)
lilit (sr)
Oskuro (en)
Zombie (sr/en)
Feeds
RSS