အင်တာနက်ပေါ်က မြန်မာစာစနစ်

ယနေ့ခေတ် အင်တာနက်တွင် အသုံးပြုနေသော မြန်မာစာစနစ်တွင် “ဇော်ဂျီ” နှင့် “မြန်မာယူနီကုဒ်” ဟူ၍ စနစ် နှစ်မျိုး ကွဲလျှက် ရှိပါသည်။ ဇော်ဂျီ အသုံးပြုသူများမှာ ၈ဝ ရာခိုင်နှုန်းကျော် ရှိနေပြီး မြန်မာယူနီကုဒ်စနစ် အသုံးပြုသူမှာ ၂ဝ ရာခိုင်နှုန်းခန့် ရှိပါသည်။

စနစ်နှစ်ခုကြားက ပြဿနာ

ဇော်ဂျီ နှင့် ယူနီကုဒ် စနစ်နှစ်ခုတွင် တစ်ခုကို အသုံးပြုပါက နောက်တစ်ခုနှင့် ရေးသားထားသော စာများကို ဖတ်ရှုရာတွင် မှန်ကန်စွာ မပြနိုင်ခြင်း ပြဿနာ ရှိပါသည်။ ထိုသို့ စနစ်နှစ်ခု ကွဲပြားနေမှုကြောင့် မြန်မာနိုင်ငံ နည်းပညာလောက တိုးတက်ပြောင်းလဲရေးကို များစွာ နှောင့်နှေးစေသလို သတင်းအချက်အလက် ဖြန့်ဝေရာတွင်လည်း အခက်အခဲဖြစ်စေပါသည်။

စနစ်နှစ်ခုမှ စနစ်တစ်ခုတည်းဆီသို့

စနစ်နှစ်ခုသည် နည်းပညာအရ မဟုတ်ဘဲ သဘောတရားအရ [Code point ပြဿနာ] ပေါင်းစည်းရန် မဖြစ်နိုင်ပါ။ ထို့ကြောင့် ပိုကောင်းသော စနစ်တစ်ခုတည်းသာ အသုံးပြုရန် ရှိပါတော့သည်။

ဘယ်စနစ်က ပိုကောင်းသလဲ

ပိုကောင်းတဲ့ စနစ်တစ်ခုတည်းကိုပဲ ရွေးချယ်အသုံးပြုနိုင်ရေးအတွက် ထိုစနစ်နှစ်ခု၏ အားနည်းချက် အားသာချက်များကို ချိန်ထိုးသုံးသပ်ရမှာဖြစ်ပါသည်။

မူပိုင်ခွင့် (Copyright)

ဇော်ဂျီ
မြန်မာယူနီကုဒ် စမ်းသပ်အဆင့်တွင် မြန်မာပညာရှင်တစ်ဦးဖြစ်သော ဦးရဲမြတ်သူ ရေးသားထားသော ဖောင့်တစ်ခုဖြစ်ပါသည်။ မြန်မာယူနီကုဒ်စနစ် မပြည့်စုံသေးခင်တွင် ယာယီအသုံးပြုနိုင်ရန်အတွက် ရည်ရွယ်ပြီး အခမဲ့ ဖြန့်ဖြူးခဲ့ပါသည်။ အခမဲ့ ဖြန့်ဖြူးခဲ့ပါသော်လည်း Software licence အမျိုးအစားကို ပွင့်လင်းစွာ ထုတ်ဖော်ရေးသားထားခြင်း မရှိခဲ့ပေ။

မြန်မာယူနီကုဒ်
မြန်မာယူနီကုဒ် စနစ်ကို မြန်မာစာအဖွဲ့ ၊ မြန်မာကွန်ပြူတာ ပညာရှင်များအသင်း (MCF) တို့မှ ပူပေါင်းပြီး နိုင်ငံတော် စီမံချက်ဖြင့် National Language Processing (NLP) ကို တည်ထောင်ပြီး ကွန်ပြူတာပေါ်တွင် မြန်မာစာကို မှန်ကန်စွာ လုပ်ဆောင်နိုင်ရေး ကြိုးပမ်းမှုမှ ရရှိလာသော နောက်ဆုံးရလာဒ် ဖြစ်ပါသည်။ နိုင်ငံတော်ပိုင် ဖြစ်ပြီး နိုင်ငံသားအားလုံး(တစ်ကမ္ဘာလုံး) အခမဲ့ အသုံးပြုနိုင်သော စနစ်ဖြစ်ပါသည်။

စာရိုက်ပုံ စနစ်

ဇော်ဂျီ
အမြင်အတိုင်း ရေးသား (စာရိုက်) ရသော စနစ် ဖြစ်ပါသည်။ ဥပမာ- “မြင့်” ဟူသော စကားလုံးကို ရေးသားရာတွင် ရရစ် ကို အရင်ရေးသားပြီးမှသာ မ ကို ရေးသားရပါသည်။ ထို့နောက် င နှင့် အသတ် အောက်မြစ် တို့ကို ဆက်ပြီး ရေးသားရပါသည်။

ဗျည်းကို အရင် မရေးဘဲ အမြင်အရ ရေးသားသောကြောင့် အက္ခရာစီခြင်း (Sorting) တွင် အဆင်မပြေတော့ပါ၊ ဥပမာ – “မို့မို့” နှင့် “မြင့်မြင့်” တို့သည် မ အက္ခရာစဥ်တွင် ရှိရမည် ဖြစ်သော်လည်း “မြင့်မြင့်” ကို ရေးသားစဥ်က ရရစ် ကို အရင်ရိုက်သွင်းခဲ့သောကြောင့် “မ” အက္ခရာစဥ်တွင် ရှိမနေတော့ဘဲ ဗျည်းမဟုတ်သော ရရစ် အုပ်စု အဖြစ်နှင့် ရောက်ရှိသွားပါတော့သည်။

ထိုကဲ့သို ဗျည်း/ သရ ခွဲခြားနိုင်စွမ်း မရှိသည့်အပြင် အမြင်အရ ရေးသားသော စနစ်ဖြစ်တာကြောင့် ရရစ် ၆ မျိုးအထိ ရှိနေခြင်း (ပုံစံမတူညီသော ရရစ်များနမူနာ ကြ၊ ခြ၊ ကြွ၊ ခြွ ၊ ကြိ၊ ခြိ )၊ အောက်မြစ် ၃ မျိုး ရှိနေခြင်း (နေရာချထားပုံမတူသော အောက်မြစ်များနမူနာ “ခ့” “က့” “ကွေ့”) တို့ကြောင့် ရေးသားပြီးသော စာများကို ပြန်လည်ရှာဖွေရာတွင် အခက်အခဲများ ဖြစ်ပေါ်စေသည်။ ထို့အပြင် “မွှ” ကဲ့သို့သော စာလုံးများတွင် မ ဝဆွဲ ဟထိုး ရေးလို့မရဘဲ မ ရေးပြီးလျှင် ဝဆွဲ နှင့် ဟထိုး ပေါင်းထားသော သီးသန့်စာလုံး တစ်ခုကို ရိုက်သွင်းရပါသည်။ ထိုကဲ့သို့ ပေါင်းစပ်ထားသော သီးသန့် စာလုံးများလည်း အများကြီးရှိပါသေးသည်။

မြန်မာစာရေးထုံးကို လိုက်နာစရာ မလိုအပ်သောကြောင့် ရှေ့နောက် လွဲမှားမှုများလည်း ရှိနိုင်ပါသည်။ ဥပမာ – “ကို” ဟူသော စာလုံးကို ရိုက်ရာတွင် ကကြီး လုံးကြီးတင် တစ်ချောင်းငင် ဟု ရိုက်သလို ကကြီး တစ်ချောင်းငင် ကို အရင်ရိုက်ပြီးမှ လုံးကြီးတင် ရိုက်လျှင်လည်း ရပါသည်။ အမြင်အရ အဆင်ပြေသော်လည်း ပြန်လည်ရှာဖွေရာတွင် တစ်ချောင်းငင် ပြီးမှ လုံးကြီးတင် ရေးထားသည့် “ကို” စာလုံးကို လုံးကြီးတင် ပြီးမှ တစ်ချောင်းငင် နည်းဖြင့် ပြန်လည်ရှာဖွေပါက ရှာမတွေ့နိုင်တော့ပေ။

မြန်မာယူနီကုဒ်
မြန်မာစာ ရေးထုံးကို လိုက်နာထားပါသည်။ ထို့ကြောင့် မှားရွင်း ရိုက်သွင်းပါက အမှားစက်ဝန်း (dotted circle) ပြသောကြောင့် စာရေးသားရာတွင် မှားရွင်းသွားသည်ကို အလွယ်တကူ သိရှိနိုင်ပါသည်။ (ဥပမာ “ကို” စာလုံးကဲ့သို့ အရေးအသားများတွင် တစ်ချောင်းငင် ရေးပြီးမှ လုံးကြီးတင် ရေးလျှင် အမှားစက်ဝန်း ပြသည်ကို တွေ့ရပါမည်။ (အမှား နမူနာ “ကို” ။ အလိုအလျောက်ပုံဖေါ်စနစ် (Shaping engine) ပါဝင်မှုကြောင့် ရရစ် တစ်မျိုးသာ ရှိပြီး အလိုအလျာက် ပုံပြောင်းနိုင်ပါသည်။ (ဥပမာ- ကြ၊ ခြ၊ ကြွ၊ ခြွ ၊ ကြိ၊ ခြိ တို့မှ ရရစ် အားလုံးအတွက် ရရစ် တစ်ခုတည်းကိုသာ ရိုက်သွင်းရမှာဖြစ်ပြီး အလိုအလျောက် ပုံပြောင်းစနစ်က လိုအပ်သလို ပုံစံပြောင်းပေးပါလိမ့်မည်။

မြန်မာစာ ရေးထုံးကို လိုက်နာထားပါသော်လည်း ဗျည်း/သရ ခွဲခြားထားသော စနစ်နှင့် အက္ခရာစဥ်ခြင်း အဆင်ပြေစေရန်အတွက် ဗျည်းကိုသာ အရင်ရိုက်သွင်းရပါတယ်။ ထို့ကြောင့် သရဖြစ်သော သဝေထိုးကို ဗျည်းရိုက်ပြီးမှသာ ရိုက်ရပါသည်။ ဥပမာ “မေ” ဟူသော စကားလုံးအတွက် မ ကို အရင်ရေးပြီးမှသာ သဝေထိုး ကို ရေးရပါမည်။ အလိုအလျောက်ပုံပြောင်းစနစ်ကြောင့် သဝေထိုး မှာ မ ၏ အရှေ့သို့ အလိုအလျောက် ရောက်သွားပါမည်။ (သဝေထိုးကို အရှေ့မှာ ရိုက်၍ရသော စာရိုက်စနစ်များလည်း ရှိပါသည်။ ဥပမာ ဗေ ကီးဘုတ်နှင့် tt ကီးဘုတ်)

တိုင်းရင်းသား စာပေ ထောက်ပံ့မှု

ဇော်ဂျီ
ဇော်ဂျီ ဖြန့်ချိစဥ်က မြန်မာယူနီကုဒ်စနစ်တွင် တိုင်းရင်းသားဘာသာများ (ကယား၊ စကောကရင်၊ ပိုးကရင်၊ မွန်၊ သျှမ်း၊ ပအိုဝ်) အတွက် မသတ်မှတ်ရသေးသောကြောင့် ဇော်ဂျီဖောင့်တွင် ဖောင်းပွနေသော ရရစ်များ၊ သရတွဲများ၊ ပဌ်ဆင့် စာလုံးများအတွက် တိုင်းရင်းသား စာလုံးများ၏ နေရာများကို ရယူထားပါသည်။ ထို့ကြောင့် ဇော်ဂျီ အသုံးပြုပါက အဆိုပါ တိုင်းရင်းသား ဘာသာစကားများကို အသုံးပြု၍ မရနိုင်ပါ။

မြန်မာယူနီကုဒ်
မြန်မာယူနီကုဒ် စနစ်တွင် တိုင်းရင်းသား ဘာသာစကားများကိုပါ ထောက်ပံ့ပေးထားပါသည်။

နိုင်ငံတကာ ထောက်ပံ့မှု

ဇော်ဂျီ
နိုင်ငံတကာ ယူနီကုဒ် အဖွဲ့အစည်းကြီးမှ ထုတ်ပြန်ထားသော ကုဒ်ပွိုင့်များမှ သွေဖီသောကြောင့် နိုင်ငံတကာ ထုတ်ကုန်များ အသုံးပြုရာတွင် အဆင်မပြေပါ။ သီးသန့် ထည့်သွင်းမှုများ လိုအပ်ပါသည်။

မြန်မာယူနီကုဒ်
နိုင်ငံတကာ ယူနီကုဒ် အဖွဲ့အစည်းကြီး၏ မြန်မာနိုင်ငံအတွက် အစိတ်အပိုင်းတစ်ခု ဖြစ်ပါသည်။ ဒစ်ဂျစ်တယ် ပစ္စည်းများတွင် အဆင်သင့် ပါဝင်ပြီး ဖြစ်ပါသည်။ သီးသန့် ထည့်သွင်းပေးရန် မလိုအပ်ပါ။

  • 2011 ခုနှစ် Apple ၏ Mac OSX တွင် မြန်မာယူနီကုဒ် စနစ်သုံး Myanmar Sangam MN ဖောင့် နှင့်အတူ မြန်မာယူနီကုဒ်စနစ် အဆင်သင့် ပါဝင်လာခဲ့ပါသည်။
  • 2012 ခုနှစ်တွင် Microsoft ၏ Windows 8.1 တွင် မြန်မာယူနီကုဒ် စနစ်သုံး Myanmar Text ဖောင့် နှင့်အတူ မြန်မာယူနီကုဒ်စနစ် အဆင်သင့် ပါဝင်လာခဲ့ပါသည်။
  • 2012 ခုနှစ်တွင် Google ၏ Android 4 တွင် မြန်မာယူနီကုဒ် စနစ်သုံး Padauk ဖောင့် နှင့်အတူ မြန်မာယူနီကုဒ်စနစ် အဆင်သင့်ပါဝင်လာခဲ့ပြီး Android စနစ်သုံး Smart Phone များတွင် အဆင်ပြေစွာ အသုံးပြုနိုင်ပါပြီ။
  • 2016 ခုနှစ်တွင် Apple ၏ iPhone နှင့် iPad တို့တွင်အသုံးပြုသော စနစ် iOS 10 တွင် မြန်မာယူနီကုဒ် စနစ်သုံး ဖောင့်နှင့်အတူ မြန်မာယူနီကုဒ်စနစ် အဆင်သင့် ပါဝင်လာခဲ့ပါသည်။

သုံးသပ်ချက်

မြန်မာယူနီကုဒ်မှာ ဇော်ဂျီစနစ်ထက် အစစ သာလွန်ပါသော်လည်း ဇော်ဂျီအသုံးပြုသူ များပြားလွန်းခြင်း၊ သတင်းဌာနများ နှင့် အစိုးရ၏ သတင်းထုတ်ပြန်မှုများတွင် အသုံးများသော ဇော်ဂျီကိုသာ အသုံးပြုခြင်း၊ MPT, Telenor, Ooredoo တို့ကဲ့သို့ ဆက်သွယ်ရေး ကုမ္ပဏီကြီးများတွင် အသုံးများသော ဇော်ဂျီကိုသာ အသုံးပြုခြင်း၊ အစိုးရ၏ ထောက်ပံ့အားပေးမှု မရရှိခြင်းတို့ကြောင့် မြန်မာယူနီကုဒ်စနစ်မှာ လူသုံးနည်းပါးလှပါသည်။

မြန်မာယူနီကုဒ်စနစ်ကိုသာ အသုံးပြုပါက Text to speech စနစ်ကိုပင် အသုံးပြုနိုင်မည် ဖြစ်သောကြောင့် မြန်မာစာများကို ကွန်ပြူတာမှ အသံထွက်ဖတ်နိုင်ပါမည်။ (မျက်စိ နှစ်ကွင်း အလင်းကွယ်နေသူများအတွက် အလွန်တန်ဖိုးရှိပါသည်။)

ဇော်ဂျီကိုသာ ဆက်လက်အသုံးပြုပါက အက္ခရာပင် မစဥ်နိုင်သောကြောင့် Database များ မတည်ဆောင်နိုင်ဘဲ တိုင်းပြည်တိုးတက်ရေးအတွက် အလွန်အရေးပါလှသည့် e-government စနစ်ကြီး ဖြစ်မလာနိုင်တော့ပါ။ ထို့အပြင် တိုင်းရင်းသားစာပေများကို အသုံးပြုခွင့်မရသောကြောင့် တိုင်းရင်းသားများအတွက် နစ်နာရသလို တိုင်းရင်သား စာပေများကို နည်းပညာခေတ်တွင်ပျက်သုန်းစေခြင်း (Digital genocide) ကိုပင် ဖြစ်စေပါသည်။

ထို့ကြောင့် ပိုမိုကောင်းမွန်သော တိုင်းပြည်အနာဂါတ်အတွက် တတ်သိပညာရှင်ကြီးများမှ နိုင်ငံ့ခေါင်းဆောင်များ သိရှိရေးနှင့် အများပြည်သူကို အသိပညာပေးရေးအတွက် ကူညီဆောင်ရွက်ပေးကြပါရန် တိုက်တွန်းအပ်ပါသည်ခင်ဗျာ။

ဆောင်းပါးရှင် – ကျော်သက်ထက်ဇော်

2 thoughts on “အင်တာနက်ပေါ်က မြန်မာစာစနစ်”

  1. ကောင်းပါသည်။ နိုင်ငံ့အနာဂတ်အတွက် အမျှော်အမြင်က​ြီးစွာဖြင့် နည်းပညာရှင်များ ပေါင်းစည်းနိုင်ရေး၊ အစိုးရ၏ အားပေးကူညီမှုရရှိနိုင်ရေး အမြန်ဆုံး လိုလားပါ၏။
    မိမိ blog တွင် ဘယ်ဟာ သုံးမှန်း မသိ၊ ခေါင်းခဲနေတယ်။
    let’s use the only Unicode for myanmar future.

    1. Blog မှာ Unicode သုံးမယ်ဆိုရင် Zawgyi သမားတွေပါ ဖတ်လို့ရအောင် Font Embedded လုပ်ပေးထားရင် အဆင်ပြေနိုင်ပါတယ်ခင်ဗျ

Leave a Reply

Your email address will not be published. Required fields are marked *