မြန်မာတို့၏ မပြီးနိုင်သေးသော တိုက်ပွဲ

Frontier Myanmar မှ အင်္ဂလိပ်ဘာသာဖြင့် ရေးထားသော Mr. GRIFFIN HOTCHKISS ၏ ဆောင်းပါးကို ဘာသာ ပြန်ဆိုသည်။ ဤပို့စ်သည် မူရင်းပို့စ်နှင့် လွဲချော်ပြီး မှားယွင်းသည်များ ရှိပါက ဘာသာပြန်သူ၏ မှားယွင်းမှုသာ ဖြစ်သည်။

ရန်ကုန် မြို့လည်ကောင်က ဖန်တီးရာ မှာ ကျင်းပတဲ့ နည်းပညာ ဆွေးနွေးပွဲတစ်ခုမှာ Michael Suantak က ဇွဲနဘဲ ကြီးစွာ ပြောဆို ဆွေးနွေးနေသည်။

“သူတို့တွေ လူတွေကို မလှည့်စားသင့်ဘူး။ သူတို့ အနာဂါတ်ကို မလှည့်စားသင့်ဘူး” လို့ Mr. Suantak က ပြောနေသည်။ “သူတို့တွေ အခုလောလောဆည်တော့ အရမ်း လူသိများနေမှာပဲ။ ဒါပေမယ့် နောက် လေး၊ ငါးနှစ်နေလို့ လူတွေအားလုံး ဒါကိုသိသွားရင်၊ လူတွေ အရမ်း စိတ်ဆိုးကြလိမ့်မယ်။ ကျွန်တော်တို့ ထိန်းနိုင်မှာ မဟုတ်ဘူး။” ဟု သူက ဆက်ပြောတယ်။

ဒီစကားကို ကြားရတဲ့ ခဏမှာ သင့်အနေနဲ့ သူ အပစ်အခတ် ရပ်စဲရေး၊ ပြုပြင်ပြောင်းလဲရေး ဒါမှမဟုတ် ဧပြီ ၁ ရက်နေ့မှာ တာဝန်လွှဲပြောင်းယူမယ့် အစိုးရသစ်အတွက် စိန်ခေါ်မှုတွေအကြောင်းကို သူ ဆွေးနွေး ပြောဆိုနေတယ်လို့ ထင်မိပါလိမ့်မယ်။ ဒါပေမယ့် Mr. Suantak ပြောနေတာက ကွန်ပျူတာမှာ သုံးတဲ့ ဖောင့် (font) တစ်ခုအကြောင်းကို ပြောဆိုနေခြင်းပါ။ တကယ်တော့ ဖောင့်(fonts) ဆိုတာထက် မြန်မာဘာသာစကား စကားလုံးတွေကို သိမ်းဆည်းတဲ့ စနစ်တစ်ခု အကြောင်း၊ လက်ရှိ မိုဘိုင်းလ်ဖုန်း အင်တာနက် သက်သက် အသုံးပြုသူ မျိုးဆက်သစ်တို့၏ မပြီးနိုင်တဲ့ တိုက်ပွဲကြီး အကြောင်းကို ပြောနေတာပါ။

Mr. Suantak သည် ကွန်ပျူတာ မောင်းနှင်စနစ်တွေမှာ မြန်မာစာကို သိမ်းဆည်း(encode) လုပ်နိုင်ရန် ဖြေရှင်းမှုတွေထဲက အစောဆုံး စနစ်တွေထဲက တစ်ခုဖြစ်တဲ့ BIT ဖောင့်(BIT font) ကို တီထွင် ရေးသားခဲ့တဲ့သူ ဖြစ်ပါသည်။ သူ့ မှတ်ချက်၏ အတိမ်အနက်ကို နားလည်ရန် စကားလုံး အက္ခရာ သိမ်းဆည်းမှု (Character encoding) နှင့် ဒါတွေကို မြန်မာဘာသာစကားတို့အတွက် ဘယ်လို အသုံးချလဲ ဆိုတာ ကျွန်တော်တို့ သိဖို့ လိုအပ်ပါသည်။

ဗမာ မဟုတ်တဲ့သူတစ်ယောက် အနေနဲ့ ယူနီကုဒ်နှင့် ဇော်ဂျီ အပေါ်မှာ အစပျိုး ပြောချင်တဲ့ အကြောင်းအရာတွေကတော့ မြန်မာဖောင့်များ၏ သမိုင်း၊ ဘယ်လို ဖြေရှင်းမှု(သို့မဟုတ် ဖြေရှင်းမှု မဟုတ်) တာတွေရဲ့ နောက်ဆက်တွဲ အကျိုးဆက်တွေက မြန်မာဘာသာစကား၏အနာဂါတ် ဘယ်လောက်အရေးကြီးတယ်ဆိုတာကို ဆက်ပြောချင်ပါသည်။

မြန်မာဘာသာစကား အက္ခရာ သိမ်းဆည်းမှု 101 (Burmese Character Encoding 101)

ကျွန်တော်တို့ ပြောဆိုနေကျ စကားလုံးတွေကို ကီးဘုတ်တွေကို အသုံးပြု ရိုက်နှိပ်ပြီး ဖိုင်ငယ်လေးတွေ အဖြစ် ကွန်ပျူတာအတွင်းမှာ သိမ်းဆည်းထားကြပါသည်။ သီချင်း၊ ဗီဒီယို စတဲ့ ဖိုင်တွေလို စာတွေကို သိမ်းထားတဲ့ ဖိုင်(file) တွေဟာလည်း ကွန်ပျူတာမှာ (1, 0) ဂဏန်းအတွဲတွေမျှသာ ဖြစ်ပါသည်။ ဒီဆောင်းပါးကို သိမ်းဆည်းထားတဲ့ စာသားဖိုင် (text file) မှာဆိုရင်၊ အက္ခရာတစ်လုံးချင်း၊ ပုဒ်ဖြတ် ပုဒ်ရပ်၊ စာခွဲ၊ စာပိုဒ်ခွဲ တစ်ခုချင်းစီအတွက် ဂဏန်းတစ်ခုစီ (code point) တစ်ခုစီ ရထားပါသည်။ ဒါ့ကြောင့် ဒီဆောင်းပါး စာသားဖိုင်ကို အခြားကွန်ပျူတာ တွေမှာ ဖတ်ရှုလျှင်လည်း ကျွန်တော် အရင်ရိုက်ထားခဲ့တဲ့အတိုင်း ပြန်လည် ကြည့်ရှုနိုင်ပါသည်။ ဒီလို စာသား အက္ခရာတွေကမှ ကွန်ပျူတာက နားလည်သော ဂဏန်းအတွဲလိုက်အဖြစ် ပြောင်းလဲခြင်းကို Encoding (ကုဒ်ပြောင်းခြင်း) လို့ ခေါ်ဆိုပါသည်။

ပြောင်းပြန်လှန်ပြီး ကွန်ပျူတာမှာ သိမ်းဆည်းထားတဲ့ ဂဏန်းအတွဲလိုက်ကနေ ကျွန်တော်တို့ မြင်နိုင်တဲ့ စာသား အက္ခရာတွေအဖြစ် ပြန်လှန်ပြောင်းလဲခြင်းကို Decoding (ကုဒ်ဖြည်ခြင်း) ဟု ခေါ်ပါသည်။ Encoding နှင့် Decoding ပြုလုပ်ရာမှာ ကွန်ပျူတာ အသီးသီးက အက္ခရာတစ်ခုချင်းစီအတွက် ဂဏန်းတန်ဖိုး တစ်ခုစီ အတူတကွ တူညီစွာ ထားထားကာမှသာ အလုပ်ဖြစ်မည် ဖြစ်ပါသည်။ ဆိုလိုသည်မှာ စာသားတွေ မှန်မှန်ကန်ကန် ပေါ်ဖို့ ကွန်ပျူတာအားလုံး သိမ်းဆည်းမှု ပုံစံ Encoding Schema တူညီစွာ ရှိနေဖို့ လိုအပ်ပါသည်။ တနည်းအားဖြင့် အက္ခရာ သိမ်ဆည်းမှု (Character Encoding)ကို စံစနစ် သတ်မှတ်ထားရပါမည်။ ကမ္ဘာ့ ဘာသာစကား တော်တော်များများအတွက် စာစီစာရိုက်ခြင်း၊ အက္ခရာစီခြင်း၊ ကွန်ပျူတာစနစ် အားလုံးမှာ သိမ်းဆည်းမှု စနစ် တည်ငြိမ်ခြင်းတို့အတွက် Unicode Standard ယူနီကုဒ် စံသတ်မှတ်ချက်များ ရှိနှင့်ပြီး ဖြစ်ပါသည်။

အင်္ဂလိပ်ဘာသာစကားကဲ့သို့ လက်တင် အက္ခရာတွေအပေါ်မှာ အခြေခံထားသော ဘာသာစကားတွေအတွက် ယူနီကုဒ် စံသတ်မှတ်ချက် Unicode Standard ကို လိုက်နာရန် စကားလုံး အသီးသီး တစ်ခုချင်းစီအား သက်ဆိုင်ရာ ဂဏန်း code point တစ်ခု သတ်မှတ်ပေးလိုက်ရုံဖြင့် လွယ်ကူ ရိုးရှင်းစွာ လုပ်ဆောင်နိုင်ပါသည်။ သို့သော် ရေးသားရာတွင် ပိုမိုရှုပ်ထွေးသော ဘာသာစကားများအတွက် အကောင်းဆုံး သိမ်းဆည်းမှု ပုံစံ coding schema ရွေးချယ်ခြင်းမှာ ခက်ခဲလှပါသည်။ မြန်မာဘာသာစကားမှာ ဆိုလျှင်ပင် စကားလုံး တစ်လုံးရေးသားမှုအတွက် ပုံစံအမျိုးမျိုး ရှိနေပါသည်။

အရေးမလွယ်တဲ့ “မြို့”

ဥပမာအားဖြင့် “မြို့” ဟူသော စကားလုံးမှာ အက္ခရာအစိတ်အပိုင်း ၅ လုံးဖြင့် ပေါင်းစပ်ထားပါသည်။ အခြေခံ ဗျည်း “မ” အား ” ြ ” ရရစ်ပေါင်းပြီး “ရ” သံ ထည့်ကာ “မြ” အသံထွက်၊ ” ိ ” လုံးကြီးတင်နှင့် ” ု  ” တစ်ချောင်းငင် ပေါင်းစပ်ပြီး သရသံကို ပြောင်းလဲကာ “မြို” အသံထွက်ကာ နောက်ဆုံး ” ့ ” အောက်မြင့် ပေါင်းပြီး အသံဖြတ်ကာ စာလုံးတစ်လုံး ဖြစ်လာပါသည်။ သိမ်းဆည်းရန် (Encoding) အက္ခရာအစိတ်အပိုင်း တစ်ခုချင်းစီအတွက် ကွန်ပျူတာက နားလည်သော ဂဏန်း code point တစ်ခုစီ သတ်မှတ်ပေးရပါမည်။

ထပ်ဆောင်းပြောရလျှင် အက္ခရာ၏ အစိတ်အပိုင်း တစ်ခုချင်းစီသည် အခြား အက္ခရာ အစိတ်အပိုင်း တစ်ခုကို လိုက်ပြီး ပုံစံ ပြောင်းလဲ (render) ရပါသည်။ ဒီဥပမာတွင် ” ြ ” ရရစ်သည် ခေါင်းပိုင်းမှာ လုံးကြီးတင်ကို ဖုံးမသွားစေရန်အတွက် ဖြတ်တောက်ထားရပါမည်။ ” ့ ” မှာ တစ်ချောင်းငင်နေရာရှိစေရန်အတွက် ညာဘက်အနည်းငယ် ရောက်ရှိနေရပါမည်။ ဒီလို ကိစ္စတွေအတွက် ယူနီကုဒ်သည် အထူး ပုံပြောင်းစနစ်(Intelligent Rendering Engine) တစ်ခုကို အသုံးပြုပြီး “မ ြ ိ ု ့” အက္ခရာအစိတ်အပိုင်း တစ်ခုချင်းစီအတွက် ဂဏန်း code point တစ်ခုစီမျှသာ ပေးကာ ပြေလည်အောင် ဖြေရှင်းပေးပါသည်။ အက္ခရာပေါင်းစပ်မှုပေါ်တွင် မူတည်ပြီး အက္ခရာ အစိတ်အပိုင်း တစ်ခုချင်းစီ၏ ပုံစံကို ပုံပြောင်းစနစ်က ပြောင်းလဲပေးပါသည်။

မြန်မာဖောင့်တွေ၏ အစ

ကနဦး အစတွင် Intelligent Rendering Engine ပုံပြောင်းစနစ် မရှိသည့်အတွက် ကွန်ပျူတာဖန်သားပြင်တွေပေါ်မှာ မြန်မာ အက္ခရာအမျိုးမျိုးကို ပေါ်စေဖို့ ခက်ခဲခဲ့ပါသည်။ အစောဆုံး မြန်မာဖောင့်တွေထဲက တစ်ခုဖြစ်သည့် မြစေတီဖောင့်ကို ရေးသားသော ကိုငွေထွန်း၏ စိတ်ကူးတစ်ခု ဆန်းသစ်ခဲ့မှုသည် ယနေ့အထိ ဇော်ဂျီဖောင့်မှ သုံးစွဲနေဆဲ ဖြစ်သည်။ သူက အက္ခရာ အစိတ်အပိုင်းတစ်ခုချင်းစီ၏ ပုံစံကွဲ အမျိုးမျိုးတို့ကို ဂဏန်း code point တစ်ခုချင်းစီမှာ တွဲဆက် သတ်မှတ်ခဲ့ပါသည်။ ကျွန်တော်တို့ ဥပမာ “မြို့” ကို ရေးသားရန်အတွက် မြစေတီကို အသုံးပြုသူတို့သည် ရရစ် ပုံစံကွဲ ၈ မျိုးထဲမှ သင့်တော်သော ရရစ်နှင့် အောက်မြင့် ကို ရွေးချယ် ရိုက်နှိပ်ရပါသည်။

မြစေတီ၊ ဘီအိုင်တီ(BIT) နှင့် ဇော်ဂျီ တို့သည် အက္ခရာ ပုံပြောင်းစနစ် ခေတ္တ ဖြေရှင်းရန်အတွက် အခြားမြန်မာတိုင်းရင်းသားတို့ ဘာသာစကားတို့အတွက် ထားထားသော code point တွေနေရာမှာ အသုံးပြုခဲ့ပါသည်။ ဒီလို အသုံးပြုလိုက်ခြင်းဟာ တိုင်းရင်းသားတွေ၏ ဘာသာစကားတိုးတက်မှုကို ဟန့်တားထားသလို အတွေ့အကြုံရှိသူတို့အတွက်တောင် စာရိုက်စနစ် ရှုပ်ထွေးပြီး အကျိုးနဲသည်ကို တွေ့ရပါသည်။

ဇော်ဂျီတွင် “မြို့” ဟူသော စကားလုံး တစ်လုံးအတွက် အမြင်မှန်သည်ဟု ယူဆနိုင်သော ရေးသားမှု ၆မျိုး ရှိပါသည်။ အကယ်၍ မှားယွင်းသော ရရစ်ပုံပြောင်းများကိုပါ လက်ခံပါက ထပ်ပြီး ကွဲပြားမှု များစွာ ရှိနေနိုင်ပါသေးသည်။ သို့ပါသော်လည်း ကွန်ပျူတာ တစ်ခုသည် ကျွန်တော်တို့ အမြင်အားဖြင့် မှန်နေသော မူကွဲ မျိုးမျိုးကို မတူညီသော စကားလုံး အဖြစ်သာ မှတ်ယူပါသည်။ နှိုင်းယှဉ်ရလျှင် ယူနီကုဒ်သည် အက္ခရာတစ်ခုချင်းစီအတွက် ကုဒ်ပွိုင့် (code point) တစ်ခုစီကိုသာ ရှိပြီး မှန်ကန်သော အစီအစဉ်ဖြင့် သိမ်းဆည်းမှသာ စကားလုံးပုံစံ မှန်ကန်စွာ ပုံဖော်(render) လုပ်မည် ဖြစ်ပါသည်။ ဆိုလိုရင်းမှာ ယူနီကုဒ်တွင် စကားလုံးတစ်ခုချင်းစီအတွက် သိမ်းဆည်းမှု တစ်ခုစီဖြစ်ပါသည်။

“ဒါဟာ လတ်တလော ဖြေရှင်းခြင်းမျှသာ ဆိုတာ ကျွန်တော်တို့ သိပါတယ်။ ဘာလို့လဲဆိုတော့ Microsoft နှင့် အခြားနည်းပညာ ကုမ္ပဏီတွေဟာ စံစနစ်တစ်ခုကို ထောက်ပံ့ပေးကြမှာလေ” ဟု ကိုငွေထွန်းက ပြောပါသည်။ “စံစနစ် ပြုလုပ်ပြီးတဲ့အခါမှာ ကျွန်တော်တို့ ကျွန်တော်တို့ အသုံးပြုသူတွေကို အရင်လုပ်ခဲ့တာတွေကို ဆက်လက် ထောက်ပံ့မှု မပေးတော့ဆိုတာ ပြောခဲ့ပါတယ်” ဟု သူက ဆိုပါသည်။

သို့ပေမယ့်လည်း စံစနစ်ကို သွေဖယ်ခြင်း တစ်ခုတည်းက မြစေတီဖောင့်၏ ပြဿနာ မဟုတ်ခဲ့ပါ။ မြစေတီဖောင့်သည် အလွန် ဈေးကြီးပါသည်။ အသုံးပြုသူတစ်ယောက်အတွက် အမေရိကန် ဒေါ်လာ ၁၀၀ ကျသင့်ပြီး၊ အွန်လိုင်းမီဒီယာတွေလို ထုတ်လုပ်သူတွေအတွက် ဒေါ်လာ ၁၀၀၀ ကျသင့်မှာ ဖြစ်ပါသည်။ ၂၀၀၂ ခုနှစ်တွင် ကုမ္ပဏီတော်တော်များများအတွက် များပြားသော ပမာဏ ဖြစ်ပါသည်။ တခြား ဈေးကြီးတဲ့ ဆော့ဝဲလ်တွေလိုပါပဲ Piracy ခိုကူးယူမှုတွေက ရှိခဲ့ပါသည်။

ဇော်ဂျီဖောင့် ဖြစ်ပေါ်လာခြင်း

Zawgyi-One ဖောင့်ကို ၂၀၀၆ ခုနှစ်က မန္တလေးမြို့မှာ အခမဲ့ ထုတ်ဝေခဲ့ပြီး မြစေတီနှင့် သိသိသာသာ တူညီနေခဲ့ပါသည်။ ပထမဆုံး ဗားရှင်းဆိုလျှင် ကိုငွေထွန်း၏ မူပိုင်ခွင့် စာသားတစ်ချို့ပင် မူလအတိုင်း ပါဝင်နေကာ မထုတ်ဝေခင်မှာ မသိခဲ့ပါဘူး။ ဒါကြောင့် အချို့မှာ ဆွဲယူ အသုံးပြုဖို့ လက်တွံ့ခဲ့ကြပါသည်။ မကြာမီမှာပဲ မြန်မာကုမ္ပဏီကြီးအများအပြားက မြစေတီအစား ဇော်ဂျီကို အသုံးပြုဖို့ သို့မဟုတ် အသုံးပြုရန် ပြင်ဆင်ခဲ့ကြပါသည်။

ကိုငွေထွန်း၏ ကုမ္ပဏီ Solveware Solution သည် Piracy လုပ်ခံရမှုအတွက် နို့တစ်စာ တစ်စောင် ထုတ်ကာ ဇော်ဂျီဖောင့် ပြုလုပ်သူအပါအဝင် မြစေတီဖောင့်ကို ကူးယူထားသော ဖောင့်အား အသုံးပြုသော ကုမ္ပဏီများအား တရားစွဲဆိုမည့် အကြောင်း ကြေညာခဲ့ပါသည်။ ဒီလို လုပ်သည့်အတွက် နည်းပညာနယ်ပယ် အထူးသဖြင့် သက်ဆိုင်ရာကုမ္ပဏီတို့က ဒေါသထွက် မကျေမနပ် ဖြစ်ခဲ့ကြပြီး၊ ဇော်ဂျီဖောင့်သည်လည်း ယူနီကုဒ်နှင့် ပိုမို ဝေးကွာစေသော အပြောင်းအလဲတစ်ခု  ပြင်ဆင်ခဲ့ပါသည်။ ဒါ့ကြောင့် မူပိုင်ခွင့် ဆိုင်ရာ ယူငင်သုံးစွဲပါသည်ဟု သက်သေပြရန် ခက်ခဲသွားခဲ့ပါသည်။

အဲဒီအတောအတွင်းမှာ ဘာသာစကားပေါင်းကူးခြင်းဆိုင်ရာ လုပ်ငန်းများ(internationalisation)ကို ယူနီကုဒ်အတွက် ဆက်လက် လုပ်ဆောင်ခဲ့ကြပါသည်။ Microsoft Window XP service Pack 2 မှာ အရေးရှုပ် ဘသာစကားတွေ (complex scripts) တွေကို ထောက်ပံ့ပေးလာခဲ့သည့်အတွက် အဲဒီအချိန်က ယူနီကုဒ်စံစနစ်နှင့် ကိုက်ညီသော ၂၀၀၅ ခုနှစ်မှာ ထုတ်ဝေခဲ့တဲ့ မြန်မာ ၁ ဖောင့်(Myanmar 1) က Windows စနစ်မှာ ကောင်းစွာ အလုပ်လုပ်ခဲ့ပါသည်။

Windows စနစ်နှင့် တွဲဖက် အလုပ်လုပ်ဆောင်နိုင်သောလည်း မြန်မာ ၁ ဖောင့်ကို အသုံးပြုရန်အတွက် နည်းပညာ အခြေခံရှိဖို့ လိုအပ်ပြီး တချို့ ပြင်ဆင်မှုတွေ ပြုလုပ်ဖို့ လိုအပ်ပါသည်။ ယူနီကုဒ်အကြောင်း အသေးစိတ် လေ့လာသူ၊ ဇော်ဂျီနှင့် ယူနီကုဒ် ခွဲခြားသိနိုင်သော ကုဒ်များကို ရေးသားသူ ကိုရာဝိ (Ko Ravi Chhabra) က ဒီလို ခက်ခဲမှုတွေအပေါ်မှာ ဇော်ဂျီက ပထမ တစ်ချက် တပန်းသာသွားခဲ့တယ်လို့ ပြောခဲ့ပါသည်။

ဒုတိယ တစ်ချက်က အင်တာနက်ဆိုတာကြီးက သတင်းအချက်အလက်တို့၏ ရင်းမြစ်အဖြစ် ပေါ်ပေါက်လာခဲ့တာ ဖြစ်တယ်လို့ သူက ပြောခဲ့ပါသည်။ ဘုန်းတော်ကြီးတို့ ဦးဆောင်တဲ့ ၂၀၀၇ ရွှေဝါရောင်သပိတ်မှောက် အရေးအခင်းနှင့်အတူ ၂၀၀၈ ဆိုင်ကလုန်း နာဂစ်ကြောင့် လူတွေ အများအပြားသည် အင်တာနက်၏ စွမ်းအားကို ကြားခံအဖြစ် ကောင်းစွာ နားလည်လာခဲ့ကြကာ မြန်မာဘာသာဖြင့် ရေးသားသော အချက်အလက်များ အစီအစဉ်ကျကျ တဖြည်းဖြည်း ပွားများလာခဲ့ပါသည်။

“ဇော်ဂျီ၏ ကြီးမားတဲ့ အောင်မြင်မှု အကြောင်းက planet.com.mm ပဲ” ဟု ကိုရာဝိက ပြောကြာခဲ့ပါသည်။ “planet က သတင်းတွေ စုတဲ့ နေရာ တစ်ခု ဖြစ်ခဲ့ပြီး သူက ဇော်ဂျီကို အသုံးပြုတယ်။ လူတွေက အဲဒီဆိုဒ်ကို သွားတဲ့အခါ ဖောင့်ကို Download လုပ်ဖို့ link တစ်ခု ရှိတယ်။ အဲဒီအချိန်တုန်းက font embedding က အလုပ်မလုပ်သေးတော့ ဖောင့် install လုပ်ဖို့ လိုအပ်တယ်လေ” ဟု သူက ဆက်ပြောခဲ့ပါသည်။

“တတိယ တစ်ချက်က ဘလော့တွေပဲ။ အစောပိုင်း ဘလော့ဂါတွေထဲက တစ်ယောက်ဖြစ်တဲ့ ညီလင်းဆက်က ဇော်ဂျီကို အသုံးပြုခဲ့ပြီး ဘလော့တွေမှာ ဇော်ဂျီအသုံးပြုနည်းတွေကို ရေးသားခဲ့တယ်။ လူတွေက ဒါကို သဘောကျကြတယ်။ ပြီးတော့ သူတို့ ဇော်ဂျီနဲ့ ဘလော့တွေ ရေးဖို့ စခဲ့ကြတာပဲ” ဟု ဆက်လက် ပြောကြားခဲ့ပါသည်။

ကိုငွေထွန်းက တရားစွဲဆိုမယ့် ကိစ္စကို နောက်တော့ ဖျက်သိမ်းခဲ့ပါသော်လည်း ပျက်စီးမှုတွေက ပြီးခဲ့ပါပြီ။ Solveware Solution ၏ စွပ်စွဲ အကြောင်းဆိုမှုတွေနဲ့အတူ ဇော်ဂျီကို ဖန်တီးကြတဲ့ developers တွေကလည်း ဇော်ဂျီဖောင့်ဟာ အကောင်းဆုံး မြန်မာဖောင့်အဖြစ် အွန်လိုင်းပေါ်မှာ ဆက်လက် လှုံ့ဆော်ခဲ့ကြပါတော့သည်။

နောက်ဆက်တွဲ ဇော်ဂျီ ဗားရှင်း ထုတ်ဝေမှုတွေဟာ သာမာန်အသုံးပြုသူတွေအတွက် ပိုမိုလွယ်ကူလာသလို စံစနစ်ဆီကို ပြောင်းလဲဖို့သည်လည်း ပိုမိုခက်ခဲလာကာ ဝေးကွာ လာခဲ့ပါသည်။ တချို့ကိစ္စတွေမှာဆိုလျှင် Microsoft ၏ Arial ဖောင့်ကို အစားထိုးခြင်း၊ Internet Explorer မှာ Plugin တစ်ခု ထည့်ခြင်း၊ ပြန်ဖြုတ်သည့် လုပ်ဆောင်ချက်မပါခြင်းတို့နှင့် အသုံးပြုသူ၏ စနစ်တစ်ခုလုံးကို ဇော်ဂျီဖောင့်အဖြစ် ထားဖို့ လုပ်ဆောင်ခဲ့ကြပါသည်။

“ဒါတွေသာ ကံကောင်းထောက်မစွာ ဖြစ်မလာခဲ့ဘူးထားပါတော့။ အဲလိုသာဆိုရင် ကျွန်တော်တို့ ဒီလိုနေရာမှာ မဟုတ်တော့ဘူး” ဟု ကိုရာဝိက ပြောကြားခဲ့ပါသည်။

ဘာလဲ ဘယ်လဲ နှင့် ကျွန်တော်တို့

မြန်မာယူနီကုဒ် စနစ်ကို ပိုမိုကောင်းမွန်အောင် ပြုပြင် ဖြည့်စွက်ခဲ့တာ ဟိုး အရင်ကတည်းကပါ။ Complex Script နဲ့ ပုံပြောင်းစနစ် (intelligent rendering) ယူနီကုဒ်မှာ ပါလာခဲ့ပါပြီ။ ပြီးတော့ စံသတ်မှတ်ချက်ကို Google, Apple နှင့် Facebook တို့လို ကုမ္ပဏီတွေက မြန်မာဘာသာစကားကို ထောက်ပံ့ဖို့ အသုံးပြုလာကြသည်။ ရှမ်း၊ မွန်၊ ကယား၊ ကရင် စသည့် မြန်မာတိုင်းရင်းဘာသာစကားတွေလည်း မြန်မာယူနီကုဒ်ထဲမှာ ပါဝင်ပါသည်။

သို့ပေမယ့်လည်း Facebook မှာ ရှိတဲ့ မြန်မာလိုရေးထားတဲ့ စာတစ်ပုဒ်ကို ကြည့်မယ်ဆိုရင် ဇော်ဂျီနှင့် ရေးထားတာ အတော် များများ တွေ့ရမှာ ဖြစ်ပါသည်။ တချို့ သတင်းမီဒီယာ စာမျက်နှာတွေမှာတော့ ယူနီကုဒ်ဖြင့်ပါ ရေးသားဖော်ပြကြတာကို တွေ့ရပေမယ့်လည်း အတော်များများက မဖော်ပြကြပါ။ Huawei နှင့် Samsung တို့လို့ မြန်မာနိုင်ငံမှာ အသုံးအများဆုံး ဖုန်းကုမ္ပဏီတွေကလည်း သူတို့ဖုန်းတွေမှာ ဇော်ဂျီကို တပါးတည်း ထည့်ပေးပြီး ဈေးကွက်ရဖို့အတွက်ကို အာရုံစိုက်လာခဲ့ပါသည်။

မြန်မာတွေ သူတို့ ဖုန်းအသစ်ကိုဖွင့် အွန်လိုင်းကို အသုံးပြုလာတာ ပိုများလာလေလေ သူတို့တွေ မသိလိုက်ပဲ ဇော်ဂျီအသုံးပြုသူအဖြစ် အခြားလူများနည်းတူ ရောနှောသွားပါသည်။ ဇော်ဂျီဖောင့်သည် အလုပ်ရှုပ်မခံချင်သူတို့အတွက်ဖောင့်၊ ဒီပြဿနာတွေရဲ့ အကြောင်းအရင်းတစ်ခု ဖြစ်လာပါသည်။

ဒီလိုတွေဖြစ်လာရခြင်းက ဇော်ဂျီကို ဆက်လက်အသုံးပြုနေတဲ့ အတွက်ကြောင့် ဖြစ်ပါသည်။ ယူနီကုဒ်စနစ်ကို ပြောင်းလဲအသုံးပြုရတာ ကနဦး အစမှာ စတေးမှုတချို့ ရှိပါသည်။ သတင်းမီဒီယာတွေလို သတင်းအချက်အလက် ဖြန့်ချိသူတွေ စာဖတ်သူ လျော့ကျနိုင်ခြင်း၊ ဖုန်းထုတ်လုပ်သူတွေ ဖောက်သည် လျော့ကျခြင်း၊ ပုံမှန်အသုံးပြုသူတွေ သူတို့ အသိမိတ်ဆွေတွေနဲ့ ကွဲထွက်လာခြင်း သူ့စာကိုယ်မမြင်ရ ကိုယ့်စာ သူမမြင်ရခြင်းတွေ ဖြစ်နိုင်ပါသည်။ ယူနီကုဒ်စနစ်ဟာ ကမ္ဘာ့ အသိအမှတ်ပြု စံသတ်မှတ်ချက် ဖြစ်တဲ့အတွက် အားလုံးကောင်းဖို့ ဇော်ဂျီကို ဆက်လက် အသုံးမပြုမှ ဖြစ်ပါမည်။ ကွယ်ပျောက်သွားရပါမည်။

သို့ပေမယ့်လည်း ပြောင်းလဲ အသုံးမပြုခင် စပ်ကြားမှာ မြန်မာလူမျိုးတွေ အားလုံး အွန်လိုင်းပေါ်မှာ ရေးသားကြသော တိုးပွားလာသည့် အချက်အလက် သတင်းတွေ အားလုံးသည် မပြည့်မစုံ ဖြစ်လာကြမှာ ဖြစ်ပါသည်။ စာစစ်ထုတ်ရှာဖွေခြင်း၊ အက္ခရာစဉ်ခြင်းနှင့် ဇော်ဂျီဖြင့် ရေးသားထားတဲ့ အချက်အလက်တွေကို တွက်ချက် ဆောင်ရွက်ရသည်မှာ တီထွင်ဖန်တီးသူ Developer တို့၊ ယူနီကုဒ်စံစနစ်ကို လိုက်နာသိမ်းဆည်းမှု မပြုနိုင်တဲ့ ဆော့ဝဲလ်ပြုလုပ်သူတို့အတွက် အိပ်မက်ဆိုး တစ်ခု ဖြစ်ပါသည်။ ဇော်ဂျီ၏ မပြည့်စုံတဲ့ သိမ်းဆည်းမှုစနစ်ပုံစံ (Coding schema) ကြောင့် သူတို့တွေဟာ လိုအပ်ချက်များစွာကို ဖြည့်ဆည်း ဆောင်ရွက်ရမှာ ဖြစ်ပါသည်။

“လာမယ့် အနာဂါတ်မှာ စက်ဘာသာပြန်စနစ်(Machine Translation)၊ ရုပ်ပုံမှ စာအက္ခရာတွေကို ပြောင်းလဲမှု (OCR)၊ စာအက္ခရာမှ အသံထွက်ဆိုနိုင်မှု (Text to voice)တို့တွေ ရှိလာမယ်။ အဲဒီအချိန်မှာ ဇော်ဂျီဖြင့် ရေးထားတဲ့ အချက်အလက် content တွေဟာ အသုံး မဝင် ဖြစ်လာမှာ”

Mr. Suantak က အဲဒီအချိန်ရောက်ရင် ရှိနေတဲ့ သတင်းအချက်အလက်တွေ စွန့်ပစ်ရမည့် အနေအထားတွေ ရှိလာနိုင်တယ်လို့ ယုံကြည်နေပါသည်။ လက်ရှိ သတင်းအချက်အလက် content တွေကို ယူနီကုဒ်စနစ်ကို ပြောင်းလဲဖို့ ရွေးချယ်ခဲ့တဲ့သူတွေကိုလည်း အသိအမှတ် ပြုခဲ့ပါသည်။ “BBC က ယူနီကုဒ်စနစ်ကို လိုက်နာတဲ့ ဖောင့်ကို သုံးတယ်။ လူတွေ BBC ကို ကြည့်နေကြတုန်းပဲ။ သူတို့ပေးနိုင်တဲ့ သတင်းအချက်အလက်တွေက လုံလုံလောက်လောက် ကောင်းနေခဲ့ရင် လူတွေဟာ ဒီအချက်အလက်တွေကို ကြည့်ရှုနိုင်ဖို့ ပြောင်းလဲလာမှာပဲ”။

ယူနီကုဒ် စနစ်ဆီသို့ အပြောင်းအလဲဆိုတာကြီးက ခက်ခက်ခဲခဲ လုပ်ရမည့်ပုံပေါ်သော်လည်း တခြား ပြုပြင်ပြောင်းလဲရေးတွေလောက်  အခက်အခဲ အတားအဆီး မများပါ။ ဇော်ဂျီ/ယူနီကုဒ် ပြောင်းလဲသော ကုဒ်များကို ရေးသားသူ၊ ယူနီကုဒ် ပြင်းပြင်းပြပြ ထောက်ခံသူ ကိုသူရလှိုင် က လူထုကို တွန်းအားပေးဖို့ အစိုးရ၏ ဂရုတစိုက် ညွှန်ကြား ပါဝင်မှု လိုအပ်တယ်လို့ ယုံကြည်ပါသည်။

“ကမ္ဘောဒီယားမှာလည်း ဒီပြဿနာမျိုး ကြုံခဲ့တယ်။ အစိုးရက ရှေ့ဆောင်လမ်းပြပြီး ‘ဒီနိုင်ငံကို ပစ္စည်းတွေ တင်သွင်း ရောင်းချမယ်ဆိုရင် ယူနီကုဒ်ကို သုံးရမယ်’ လို့ ကြေညာခဲ့တယ်။ အဲဒီ ပြဿနာ ပြေလည်သွားခဲ့တယ်”လို့ ကိုသူရလှိုင်က ပြောပါသည်။

မြန်မာနိုင်ငံအတွက် ဒီပြုပြင်ပြောင်းလဲရေးသည်လည်း အလွယ်တကူ ပြီးသွားပါစေလို့ မျှော်လင့်ရင်း . . .

 

MR. GRIFFI HOTCHKISS ရေးသားသော http://frontiermyanmar.net/en/features/battle-of-the-fonts မှ ဆောင်းပါးကို ဘာသာပြန်ဆိုသည်။

Leave a Reply

Your email address will not be published. Required fields are marked *