ယူ​နီ​ကုဒ် စာလုံး​စီ​ပုံ – Unicode Encoding

ယူနီကုဒ် အက္ခရာများကို စီစဉ်တဲ့အခါ Logical Order (ဘာသာစကား အသံသဘော) အရ စီစဉ်ရပါတယ်။ အဲဒီအခါ အဓိက ပြဿနာဖြစ်တာက သဝေထိုးပါပဲ။ သဝေထိုးနဲ့ ခခွေးဟာ ဘယ်ညာလှည့်ပုံသာ ကွဲပေမဲ့ ဘယ်သူမှ ဘယ်ကို ခလျှောက်ခွေးနေတာလဲလို့ မပြောကြပါ။ ဘယ်ကို သဝေထိုးနေလဲ လို့သာ ပြောပါတယ်။ ဆိုလိုချင်တာကတော့ သဝေထိုးဟာ သဝေထိုးပြီး ရှေ့ကို ရောက်နေတယ်⁠တယ်လို့ ပြောချင်တာပါ။ မြန်မာစာကို ရှေးလူကြီးတွေက ဒီလိုရေးခဲ့တော့ ထုံးဖြစ်နေသော်လည်း သရကို ရှေ့မှာထားတာ မှားပါတယ်။ နောက်ပြန်ရှင်းပါ့မယ်။

ဟိုးရှေးရှေး ဝင်းဖောင့်၊ စီအီးဖောင့် အစရှိလို့ ဇော်ဂျီဖောင့် ဖြစ်လာတဲ့အထိ Logical Order နဲ့ မစီပါ၊ အမြင်အတိုင်းသာ စီပါတယ်။ ဆိုလိုတာက “ပြောင်း” ဆိုတဲ့ စာလုံးကို ရိုက်မယ်ဆိုရင် သဝေထိုး+ ရရစ်+ ပစောက်+ ရေးချ+ င+ အသတ်+ ဝစ္စပေါက် ရယ်လို့ ရိုက်ရပါတယ်။ အဲလိုမှ မရိုက်ရင်လည်း အမှန် မမြင်ရပဲကိုး။

လူတိုင်းအတွက် ယူနီကုဒ်


ကွန်ပျူတာတွေစပေါ်တော့ ဖောင့်တစ်ခုမှာ အက္ခရာ ၂၅၆ လုံးသာ ဆန့်ပါတယ်။ အဲဒီနေရာတွေမှာ အင်္ဂလိပ် လက်တင် အက္ခရာတွေနဲ့တင် ပြည့်သွားပါပြီ။ ဒီတော့ တခြားဘာသာစကားတွေအတွက် သုံးချင်ရင် ရှိပြီးသား စာလုံးတွေကို ဖယ်ပြီး မိမိဘာသာစကား အက္ခရာတွေနဲ့ အစားထိုးရပါတယ်။ မြန်မာလို ဝင်းစာလုံးစီပုံနဲ့ “ပြောင်း”လို့ ရေးထားရင် အင်္ဂလိပ်လို “ajymif;” ဆိုပြီး ပေါက်ကရတွေ မြင်ရပါတယ်။ အဲဒီတော့ ဘာသာစကား နှစ်ခုနဲ့အထက် ဒေတာတွေကို ဖလှယ်ချင်တဲ့အခါ ကိုဒုက္ခနဲ့ မလှလှ တွေ့ကြပါတော့တယ်။ ကွန်ဗာတာပေါင်း အမျိုးစုံသုံးပြီး ဟိုဘာသာနဲ့ဒီဘာသာ ပြန်ပြောင်း၊ ဗမာစာမှာဆိုလည်း ဟိုဖောင့်နဲ့ ဒီဖောင့်ပြန်ပြောင်း၊ ဝင်းနဲ့ရေးတာ စီအီးနဲ့ ဖတ်မရလို့ ကွန်ဗာတာသုံးပြီး ပြန်ပြောင်းနဲ့ အင်မတိ အင်မတန် ကပေါက်တိ ကပေါက်ချာ ဖြစ်ခဲ့ပါတယ်။

အဲဒီပြဿနာတွေကို ဖြေရှင်းဖို့ ဘာသာစကားအားလုံးအတွက် ရည်ရွယ်တဲ့ ယူနီကုဒ်စနစ်ကို တီထွင်ခဲ့ကြပါတယ်။ ယူနီကုဒ်မှာ ဘာသာစကားတိုင်းရဲ့ အက္ခရာတိုင်းအတွက် သူ့နေရာနဲ့သူ သတ်မှတ်ပေးထားပါတယ်။ ဒါကြောင့် ယူနီကုဒ်စနစ်ကို သုံးရင် ဒေတာတွေ ဖလှယ်နိုင်ဖို့အတွက် ဖောင့်ပြဿနာဆိုတာ လုံးလုံး မရှိတော့ပါဘူး။

 

ယူနီကုဒ် စည်းမျဉ်း

ယူနီကုဒ်အက္ခရာတွေကို စီတဲ့အခါ ဘာသာဗေဒ အသံထွက် သဘောတရား (Linguistics) ကို မှီပြီး စီစဉ်ရပါတယ်။ အဲဒါ ဘယ်ဘာသာအတွက် သီးသန့်ဆိုပြီး ချွင်းချက် မထားပါဘူး။ ဘယ်ဘာသာစကားမဆို ယူနီကုဒ်စနစ်မှာ အဲဒီစည်းမျဉ်းကို လိုက်နာရပါတယ်။

ယူနီကုဒ် စာလုံးစီပုံမှာ ပထမဆုံး လာရတာ “ဗျည်း” (consonants) ပါ။ မြန်မာစာမှာဆိုရင် “ကကြီး” ကနေ “အ” အထိလို့ အလွယ်မှတ်နိုင်ပါတယ်။

ဒုတိယ လာရတာ “ဗျည်းတွဲ” (medials) ပါ။ မြန်မာစာမှာဆို “ပင့်ရစ်ဆွဲထိုး” လို့ အလွယ်မှတ်နိုင်ပါတယ်။ ယပင့်၊ ရရစ်၊ ဝဆွဲ၊ ဟထိုး လေးလုံးပါ။

တတိယ လာရတာ “သရ” (vowels) ပါ။ မြန်မာမှာ “အ၊ အာ၊ အိ၊ အီ၊ အု၊ အူ၊ အေ၊ အဲ၊ အော၊ အော်၊ အံ၊ အိုး” တွေပါ။ သင်္ကေတတွေသာ ယူရင် “သဝေထိုး၊ ရေးချ၊ မောက်ချ၊ လုံးကြီးတင်၊ လုံးကြီးတင်ဆံခတ်၊ တစ်ချောင်းငင်၊ နှစ်ချောင်းငင်၊  နောက်ပစ်” တွေပါ။ သေး⁠သေးတင်၊ ဝစ္စပေါက်တွေကို သရထဲ မထည့်ပါ။

အဲဒီနောက်မှာမှ “သေး⁠သေးတင်၊ အောက်ကမြစ်၊ ဝစ္စပေါက်၊ အသတ်” တွေကို နောက်ဆုံးပိတ် ထည့်ပါတယ်။ အသတ်ကိုတော့ အသံကို သတ်ပစ်တယ်လို့ သတ်မှတ်ပြီး အောက်ကမြစ်နဲ့ ယှဉ်လာရင် နောက်ဆုံးမှ ထည့်ပါတယ်။ အသတ်နဲ့ တန်ဖိုးညီတာက ပါဌ်ဆင့်အဖြစ်သုံးတဲ့ “ဝိရာမ (Virama)” ပါ။ သူက မမြင်ရပါ။ ဥပမာ “ကကြီး+ မ+ ဝိရာမ+ ဘကုန်း+ ရေးချ” ဆိုရင် “ကမ္ဘာ” ရပါတယ်။ ရှေ့ထိုးဟာ အသတ်နဲ့ ပုံစံတူတဲ့အတွက် ရှေ့ထိုးနဲ့ အသတ်ကို အတူတူ ယူပါတယ်။ ရှေ့ထိုးဟာ အက္ခရာ သရအနေနဲ့ မရှိဘဲ ဪသရရဲ့ အစိတ်အပိုင်းသာ ဖြစ်တဲ့အတွက် သူ့အတွက် ကုဒ်ပွိုင့်သတ်သတ် မပေးပါ။

အသံကို အခြေခံ

ကဲ “ပြောင်း”ဆိုတဲ့ စာလုံးကို ယူနီကုဒ်လို ရေးကြည့်ရအောင်။ ယူနီကုဒ်က Linguistics ကို အခြေခံတဲ့အတွက် ပထမဆုံး အနေနဲ့ ချမရေးခင် ပါးစပ်နဲ့ အသံအရင်ထွက်ကြည့်ပါ။

ပြောင်း
ပ+ ရ+ အောင်း
ပ+ ရရစ်+ သဝေထိုး+ ရေးချ+ င+ အသတ်+ ဝစ္စနှစ်လုံးပေါက်

အဲဒီထိ ရှင်းသေးတယ်ဆိုရင် ဒီအောက်က နမူနာ စာလုံးတွေကို ကြည့်ပါ။

မှောင်
မ+ ဟ+ အောင်
မ+ ဟထိုး+ သဝေထိုး+ ရေးချ+ င+ အသတ်

ကျောက်
က+ ယ+ အောက်
က+ ယပင့်+ သဝေထိုး+ ရေးချ+ ကကြီး+ အသတ်

မောင့်
မ+ အောင့်
မ+ သဝေထိုး+ ရေးချ+ င+ အောက်ကမြစ်+ အသတ်

မြို့
မ+ ရ+ အို့
မ+ ရရစ်+ လုံးကြီးတင်+ တစ်ချောင်းငင်+ အောက်ကမြစ်

မှို
မ+ ဟ+ အို
မ+ ဟထိုး+ လုံးကြီးတင်+ တစ်ချောင်းငင်

သွေး
သ+ ဝ+ အေး
သ+ ဝဆွဲ+ သဝေထိုး+ ဝစ္စနှစ်လုံးပေါက်
ပင့်ရစ်ဆွဲထိုး လေးလုံး အချင်းချင်း ယှဉ်လာရင် အစဉ်အတိုင်း စီပါတယ်။ ဥပမာ အမြွှာ ကို ရေးရင် အ + မ + ရရစ် + ဝဆွဲ + ဟထိုး + ရေးချ။

ပါဌ်ဆင့် နဲ့ ကင်းစီး

ဟိုးရှေး⁠ရှေးက စာရေးရင် ပေရွက် ထန်းရွက် စသည်မှာ ရေးရတဲ့အတွက် ရှည်နေတဲ့စာလုံးတွေကို ချုံ့ပစ်ပါတယ်။ စာနှစ်လုံးကို တစ်လုံးတည်း ဖြစ်အောင် ပူးပစ်ပါတယ်။ အဲဒါတွေဟာ ခုတော့ ရေးထုံး ဖြစ်လာပါတယ်။ ဥပမာ – အု ဆိုတဲ့စာလုံးကို အက္ခရာ ဥ လုပ်လိုက်ပါတယ်။ အဲဒါ ချုံ့တာပါ။ ကမ်ဘာဆိုတဲ့ စာလုံးကို ကမ္ဘာ လို့ နှစ်ဆင့်ထပ်ပြီးရေးတာ ပါဌ်ဆင့်တယ် ခေါ်ပါတယ်။ မင်ဂလာကို မင်္ဂလာလို့ တခြားစာလုံးပေါ်တင်တာကျတော့ ကင်းစီးတင်တယ် ခေါ်ပါတယ်။ အခု ပါဌ်ဆင့်နဲ့ ကင်းစီးရေးပုံကို ပြောပါမယ်။ သူတို့ကို ရေးရင် ဝိရာမ သုံးရပါတယ်။

ပါဌ်ဆင့်ရေးရင် ဝိရာမကို အသတ်နေရာမှာ ထည့်ပါတယ်။

စန္ဒာ
စ+ အန်+ ဒ+ အာ
စ+ နငယ်+ ဝိရာမ+ ဒဒွေး+ ရေးချ

ကြမ္မာ
က+ ရ+ အမ်+ မ+ အာ
က+ ရရစ်+ မ+ ဝိရာမ+ မ+ ရေးချ

ကင်းစီးရေးရင် အသတ်အရင်ရေးပါတယ်။ အသတ်နောက်က ဝိရာမ လိုက်ပါတယ်။

မင်္ဂလာ
မ+ အင်+ ဂ+ လ+ အာ
မ+ င+ အသတ်+ ဝိရာမ+ ဂငယ်+ လ+ ရေးချ

သင်္ကြန်
သ+ အင်+ က+ ရ+ အန်
သ+ င+ အသတ်+ ဝိရာမ+ ကကြီး+ ရရစ်+ နငယ်+ အသတ်

 

Rendering လို

အဲဒီလို ယူနီကုဒ်စနစ်နဲ့ စီထားတာတွေကို မျက်စိအမြင်မှာ ပုံမှန်အတိုင်းမြင်စေဖို့ ဖောင့်ထဲမှာ ပုံဖော်တဲ့ စည်းမျဉ်းတွေ ထည့်ပေးရပါတယ်။ ဥပမာ Graphite, Pango, Uniscribe, Harfbuzz, AAT စတဲ့ နည်းပညာတွေ ဖြစ်ပါတယ်။

 

ကိုယ်သုံးနေတဲ့ကွန်ပျူတာ မိုဘိုင်းတွေမှာ ယူနီကုဒ်စနစ်ကို လိုက်နာထားတဲ့ ဖောင့်ကို သုံးထားပါလျက်နဲ့ စာလုံးစီပုံတွေ ဖတ်မရဘူးဆိုရင် ဒါ အဲဒီစက်မှာ ယူနီကုဒ်စနစ်ကို မထောက်ပံ့ပေးထားလို့ ဖြစ်တယ်လို့ ယေဘုယျအားဖြင့် ပြောနိုင်ပါတယ်။ ဒါဆိုရင် မြန်မာစာသာမက မြန်မာထက် နည်းပညာပိုင်းဆိုင်ရာ ရှေ့တန်းရောက်နေတဲ့ အိန္ဒိယ၊ အာရပ်တို့ရဲ့ ယူနီကုဒ်စနစ်သုံးစာတွေပါ အဲဒီစက်မှာ မမြင်ရသေးဘူးလို့ ကောက်ချက်ချနိုင်ပါတယ်။

တောင်ကိုဖောက်၍

ဘယ် နည်းပညာရပ်ဝန်းမှာ ဖြစ်⁠ဖြစ်ပါ။ တစ်ချိန်မှာ မြန်မာစာကို ထောက်ပံ့ပေးတော့မယ်ဆိုရင် ယူနီကုဒ်စနစ်သုံး မြန်မာစာကို သာ ထောက်ပံ့မှာ ဖြစ်ပါတယ်။ နည်းပညာ ပလက်ဖောင်းတစ်ခုပေါ်လာတယ်။ ယူနီကုဒ်ဖောင့်တွေအတွက် ပုံဖော်စနစ်မရှိသေးဘူး။ ရုတ်တရက်ဆိုရင် လူသုံးများနေတဲ့ ဇော်ဂျီကို အလွယ်သုံးလိုက်မယ်။ သူက ဘာစနစ်မှ လိုက်နာစရာမလိုဘူး။ ဘာပုံဖော်စနစ်မှ မလိုဘူး။ အမြင်အတိုင်း စာလုံးစီတာ ဖြစ်တဲ့အတွက် ပလက်ဖောင်းတော်တော်များ⁠များနဲ့ အဆင်ပြေတယ်။ သို့သော် ဇော်ဂျီသည် ဇော်ဂျီသာဖြစ်၍ ဇော်ဂျီနဲ့ ဖြေရှင်းထားတဲ့ တစ်ပွဲတိုးနည်းများကို ဘယ်နိုင်ငံတကာအဖွဲ့အစည်းကမှ တရားဝင် အသိအမှတ် ပြုမှာမဟုတ် ဆိုတာကို သတိချပ်စေလိုပါတယ်။

 

ကျွန်တော်တို့ လမ်းသွားရင်းနဲ့ တောင်တစ်လုံး ရှေ့ကခံနေတာတွေ့မယ်။ ဘေးက ကွေ့ရှောင်သွားလို့ရတယ်။ ဒါပေမယ့် မတော်ရင် တောထဲမှာ လမ်းပျောက်သွားနိုင်တယ်။ သွားလိုရာ ရောက်ခဲ့ရင်တောင် အဆင့်ဆင့် ကွေ့ပတ်သွားနေရမယ်။ ခြုံတောတိုးရမယ်။ ကိုယ်က အားနည်းနည်းစိုက်ပြီး ဒီတောင်ကို လမ်းဖြစ်အောင် ဖောက်လိုက်ရင် နောင်လာနောက်သားတွေအတွက် အကျိုးများနိုင်ပါတယ်။ မြန်မာစာကို ချစ်မြတ်နိုးတဲ့ လူတိုင်း ယူနီကုဒ်လမ်းကို ကွေ့သွားမယ့်အစား ဝင်ဖောက်ပေးတဲ့ လူတွေထဲက တစ်ယောက်အနေနဲ့ ပါဝင်ကူညီကြစေလိုပါတယ်။ ကျေးဇူးတင်ပါတယ်။

 

Read more:

http://unicode.org/notes/tn11/UTN11_3.pdf

ကိုမောင်ဆန်း Lionslayer  ဘလော့မှ ကူးယူဖော်ပြပါသည်။

 

2 thoughts on “ယူ​နီ​ကုဒ် စာလုံး​စီ​ပုံ – Unicode Encoding”

Leave a Reply

Your email address will not be published. Required fields are marked *