စကားပြောဆိုသော AI

Bhasini သည် အိန္ဒိယ၏ ဘာသာဗေဒ ပေါင်းစပ်ပါဝင်မှုကို မည်ကဲ့သို့ စွမ်းဆောင်နိုင်မည်နည်း။

G20 Digital Economy Working Group ဝန်ကြီးများတွေ့ဆုံပွဲတွင် ၀န်ကြီးချုပ် Narendra Modi မှ "Bhashini" ကို ထုတ်ဖော်ပြသခဲ့သည်။ ဤ AI စနစ်သုံး ဘာသာစကား ဘာသာပြန်ပလပ်ဖောင်းသည် အိန္ဒိယ၏ ဘာသာစကားကွဲပြားမှုကို ဂုဏ်ပြုသည်။

Bhashini ဒစ်ဂျစ်တယ် ပိုင်းခြားမှုကို ပေါင်းကူးရန်နှင့် အိန္ဒိယတိုင်းနှင့် ချိတ်ဆက်နေသည်ဟု ခံစားရကြောင်း သေချာစေရန် ရည်ရွယ်သည်။ အိန္ဒိယသည် ၎င်း၏ကျယ်ပြောလှသော ဘာသာစကားများနှင့် ဒေသိယစကားများဖြင့် ထိုကဲ့သို့သော ဆန်းသစ်တီထွင်မှုအတွက် ကင်းဗတ်တစ်ခုဖြစ်လာသည်။ ပလက်ဖောင်းသည် အိန္ဒိယ၏ မရေမတွက်နိုင်သော ဘာသာစကားများတစ်လျှောက် ဒစ်ဂျစ်တယ်ပါဝင်မှုကို ပံ့ပိုးပေးသည်။

လူများစွာအတွက်၊ ၎င်းသည် ၎င်းတို့၏မိခင်ဘာသာစကားတွင် အကြောင်းအရာများကို ပထမဆုံးအကြိမ် ဝင်ရောက်ကြည့်ရှုခြင်းကို ဆိုလိုသည်။ ဒီတော့ Bhashini ဆိုတာ ဘာလဲဆိုတာ လေးလေးနက်နက် လေ့လာကြည့်ရအောင်။

Bhashini အတွက်လိုအပ်ချက်

ဒစ်ဂျစ်တယ်ကမ္ဘာသည် အင်္ဂလိပ်ဘက်သို့ ဦးတည်ကာ အင်္ဂလိပ်မဟုတ်သော ပြောဆိုသူအများအပြားကို ချန်ထားရစ်စေခဲ့သည်။ သတင်းအချက်အလက်ကို အွန်လိုင်းမှာ ရှာဖို့ စိတ်ကူးကြည့်ပါ၊ ဒါပေမယ့် သင့်ဘာသာစကားနဲ့ မဟုတ်ဘူး။ စိတ်ပျက်စရာကောင်းပြီး ကန့်သတ်ချက်တစ်ခုပါပဲ။

အိန္ဒိယလူမျိုး အများအပြားသည် ၎င်းတို့၏ မိခင်ဘာသာစကားဖြင့် အကြောင်းအရာများကို ရယူရန် ရုန်းကန်နေရသဖြင့် နေ့စဉ်နေ့တိုင်း ဤပြဿနာကို ရင်ဆိုင်နေကြရသည်။ ဤနေရာတွင် Bhashini အတွက် လိုအပ်ချက်များ ရောက်ရှိလာပါသည်။ ၎င်းသည် ဤကွာဟချက်ကို ဖြည့်ဆည်းရန်နှင့် လူတိုင်း ဒစ်ဂျစ်တယ်နေရာလွတ်တွင် တရားမျှတသော အခွင့်အရေးရရှိစေရန် အိန္ဒိယဘာသာစကားတိုင်းအတွက် ပလပ်ဖောင်းတစ်ခုကို ပေးဆောင်ရန် ရည်ရွယ်ပါသည်။ ဘာသာစကားကြောင့် နောက်ကျကျန်ရစ်တယ်လို့ ဘယ်သူမှ မခံစားသင့်ပါဘူး။

Bhashini Model ကိုနားလည်ခြင်း။

Bhasini

Bhashini သည် ဒစ်ဂျစ်တယ်ပထမခေတ်တွင် ဘာသာစကားပါဝင်နိုင်မှု မျှော်လင့်ချက်တစ်ခုအဖြစ် ရပ်တည်နေသည်။ လည်ပတ်ပုံနှင့် ၎င်း၏ ပင်မအခြေခံမူများကို ကြည့်ကြပါစို့။

ဘာသာစကားများ လုပ်ဆောင်ခြင်းနှင့် မြှင့်တင်ရေး

Bhashini သည် ဒေသတွင်းဘာသာစကားများကို တက်ကြွစွာ အားပေးသည့် လှုပ်ရှားမှုတစ်ခုဖြစ်သည်။ ၎င်းသည် ၎င်း၏နည်းပညာဆိုင်ရာ စွမ်းဆောင်မှုများနှင့် ပူးပေါင်းဆောင်ရွက်မှုများဖြင့် ပြုလုပ်သည်။ Bhashini သည် ကုမ္ပဏီများနှင့် ပလက်ဖောင်းများနှင့် ချိတ်ဆက်ဆောင်ရွက်သောကြောင့် ၎င်း၏ကမ်းလှမ်းချက်များကို ပေါင်းစပ်ထားသည်။ ၎င်းသည် ဒစ်ဂျစ်တယ်ပလပ်ဖောင်းအမျိုးမျိုးတွင် ချောမွေ့စွာအသုံးပြုသူအတွေ့အကြုံကို သေချာစေသည်။

Bhashini ၏အဆောက်အဦများ

နည်းပညာ

Asr

အလိုအလျောက် စကားပြောအသိအမှတ်ပြုမှုသည် စကားပြောစကားလုံးများကို နားလည်ရန် ကူညီပေးသည်။

OCR

Optical Character Recognition သည် ပုံများမှ စာသားကို ဖတ်သည်။

NLU

သဘာဝဘာသာစကားနားလည်ခြင်းသည် ဆက်စပ်နားလည်မှုကို သေချာစေသည်။

MT

Machine Translation သည် အချိန်နှင့်တပြေးညီ ဘာသာပြန်ချက်များကို ပေးဆောင်သည်။

၏ TTS

Text to Speech သည် ရေးထားသော အကြောင်းအရာကို အသံပေးသည်။

ထုတ်ကုန်များ

  • အချိန်နှင့်တပြေးညီ စကားပြောမှ မိန့်ခွန်း စက်ယန္တရား လက်ငင်းဘာသာပြန်ချက်များအတွက်။
  • ဘာသာပြန်ကိရိယာတွေလိုမျိုး Speech To Speech (S2S) အစိုးရလက်ထောက်.
  • အိန္ဒိယဘာသာစကား အသံအင်တာနက် မူရင်းရှာဖွေမှုအတွေ့အကြုံများအတွက်။
  • အကြောင်းအရာ ဒေသအလိုက် ပြောင်းလဲခြင်း ဒေသတွင်း ပရိသတ်များနှင့် ပဲ့တင်ထပ်သော အကြောင်းအရာများကို ဖန်တီးရန် ကူညီပေးသည်။
  • Accessibility ကိရိယာများသည် လူတိုင်းနှင့် ကိုက်ညီပြီး မည်သူမျှ မကျန်ရစ်စေရန် သေချာသည်။
  • ဘာသာပြန်သူ မှန်ဘီလူး အမြင်အာရုံဘာသာပြန်အကူအညီပေးသည်။

ဖောင်ဒေးရှင်း

  • ဒေတာ Corpus- ဘာသာစကားဒေတာစုဆောင်းမှု ကြွယ်ဝသော Bhashini။
  • High Compute Infrastructure (HCI): ၎င်းသည် ချောမွေ့ပြီး ထိရောက်သော လုပ်ဆောင်ချက်များကို သေချာစေသည်။

အနှစ်သာရအားဖြင့် Bhashini သည် အိန္ဒိယနိုင်ငံ၏ ကျယ်ပြန့်သော ဘာသာစကားလောကကို ထင်ဟပ်စေသည်။ ဒစ်ဂျစ်တယ်ခေတ်တွင် မတူကွဲပြားမှု၌ စည်းလုံးမှုသည် အမှန်တကယ်ဆိုလိုကြောင်း သက်သေအဖြစ် ရပ်တည်သည်။

Bhashini ၏အကျိုးကျေးဇူးများ

Bhashini သည် ဘာသာပြန်ပလက်ဖောင်းတစ်ခုမျှသာဖြစ်သည်။ အပြောင်းအလဲအတွက် အထောက်အကူတစ်ခုဖြစ်သည်။ ၎င်း၏ အကျိုးကျေးဇူးများကို လေ့လာကြည့်ကြပါစို့။

ဒေသဆိုင်ရာ ဘာသာစကား အကြောင်းအရာ မြှင့်တင်ရေး

အိန္ဒိယနိုင်ငံသည် အိမ်ဖြစ်သည်။ သီးခြားရုံးသုံးဘာသာစကား ၂၁ မျိုး၊ စုစုပေါင်းဘာသာစကား ၁၂၁ မျိုးနှင့် မိခင်ဘာသာစကား ၂၇၁ မျိုးရှိသည်။ ဒေသတစ်ခုစီတွင် ၎င်း၏ကိုယ်ပိုင်ဘာသာစကားကျက်သရေရှိပြီး Bhashini က ၎င်းကိုအသိအမှတ်ပြုသည်။ ၎င်းသည် ဒေသတွင်းဘာသာစကားများဖြင့် အကြောင်းအရာအတွက် တက်ကြွစွာ တွန်းအားပေးပါသည်။ ဒါက မတူကွဲပြားတဲ့ ယဉ်ကျေးမှုတွေကို အွန်လိုင်းမှာ ကိုယ်စားပြုခွင့်ရဖို့ သေချာစေတယ်။

အိန္ဒိယအားလုံးအတွက် ဒစ်ဂျစ်တယ်ပါဝင်မှု

Bhashini သည် အိန္ဒိယလူမျိုးများ ကြုံတွေ့နေရသော ဒစ်ဂျစ်တယ် ပိုင်းခြားမှုကို ချိတ်ဆက်ပေးသည့် တံတားတစ်ခုဖြစ်သည်။ Bhashini ဖြင့်၊ အကြောင်းအရာသည် တစ်ဦး၏မိခင်ဘာသာစကားဖြင့် ရနိုင်သည်။ အိန္ဒိယတိုင်းသည် ၎င်းတို့၏ဘာသာစကားမခွဲခြားဘဲ ပါဝင်ခံစားရကြောင်း သေချာစေသည်။

ဒေသတွင်း အကြောင်းအရာ ဖန်တီးသူများအတွက် စီးပွားရေး အခွင့်အလမ်းများ

Bhashini သည် ပြည်တွင်းဖန်တီးသူများအတွက် လမ်းခင်းပေးသောကြောင့် စီးပွားရေးကို မြှင့်တင်ပေးပါသည်။ ယခုအခါ ၎င်းတို့သည် ဒေသတွင်း ဘာသာစကားများဖြင့် အကြောင်းအရာများကို ထုတ်လုပ်နိုင်ပြီဖြစ်သည်။ ၎င်းသည် ဒေသတွင်း အနုပညာရှင်များ၊ စာရေးဆရာများနှင့် ဖန်တီးသူများအဖို့ ဘာသာစကားအတားအဆီးများကို အွန်လိုင်းတွင်ရှာဖွေရန် ယခင်က ပြဿနာရှိနေသည့် လမ်းကြောင်းသစ်များကို ဖွင့်လှစ်ပေးသည်။ သူတို့ဟာ သူတို့ရဲ့ အရည်အချင်းတွေကို ထုတ်ဖော်ပြသနိုင်ပြီး ပရိသတ်ကို ရရှိတော့မှာ ဖြစ်လို့ ဒီကနေ ဝင်ငွေတွေ ရနိုင်ပါတယ်။

ဒေသဆိုင်ရာ ဘာသာစကား ဝဘ်ဆိုဒ်များ

Kerala မှ ခရီးသွားတစ်ဦးကို သုံးသပ်ကြည့်ပါ။ သူတို့သည် Rajasthan ၏ယဉ်ကျေးမှုအကြောင်းသိချင်သည်။ Bhashini ဖြင့် ဝဘ်ဆိုဒ်များသည် မလေးလမ်ဘာသာဖြင့် အကြောင်းအရာများကို ကမ်းလှမ်းနိုင်ပါသည်။ ယင်းက ခရီးသွားများအတွက် အချက်အလက်များ အလွယ်တကူ ကြေညက်စေသည်။

အိန္ဒိယဘာသာစကားများတွင် ဒစ်ဂျစ်တယ်ကိရိယာများနှင့် ပလပ်ဖောင်းများ

ပန်ဂျပ်ရှိ လယ်သမားတစ်ဦးကို မြင်ယောင်ကြည့်ပါ။ မိုးလေဝသခန့်မှန်းချက်အက်ပ်ကို သုံးလိုကြသည်။ Bhashini သည် app ကို Punjabi တွင်ရရှိနိုင်ကြောင်းသေချာစေသည်။ ၎င်းသည် လယ်သမားအား အရေးကြီးသော ရာသီဥတု အပ်ဒိတ်များကို နားလည်ရန် ကူညီပေးသည်။

အစိုးရဝန်ဆောင်မှုများသည် ပိုမိုကျယ်ပြန့်သော ပရိသတ်များထံ ရောက်ရှိစေပါသည်။

Odisha ရှိ သက်ကြီးရွယ်အိုတစ်ဦးကို စဉ်းစားကြည့်ပါ။ အစိုးရပင်စင်ပေါ်တယ်ကို သူတို့ဝင်ရောက်ဖို့ လိုအပ်တယ်။ Bhashini သည် ပေါ်တယ်ကို Odia (Oriya) တွင် ရှိနေစေပါသည်။ ယခုအခါ သက်ကြီးရွယ်အိုများသည် ဝန်ဆောင်မှုများကို လွယ်ကူစွာ အသုံးပြု၍ သွားလာနိုင်ပြီး ဝင်ရောက်နိုင်ပြီဖြစ်သည်။ စကားပြောဆိုသော AI အ ဒေသဆိုင်ရာဘာသာစကားများဖြင့်

Shaip ၏ Bhashini အား ပံ့ပိုးကူညီမှု- ဘာသာစကားပေါင်းစုံ ဒေတာစုဆောင်းမှုမှတစ်ဆင့် ဒစ်ဂျစ်တယ် ပေါင်းစည်းမှု

Indian Institute of Technology, Madras နှင့် ပူးပေါင်းဆောင်ရွက်ခြင်း၊ Shaip သည် မတူကွဲပြားသော အိန္ဒိယဘာသာစကားဒေတာအတွဲများကို စုဆောင်းခြင်း၊ အပိုင်းခွဲခြင်းနှင့် ကူးယူခြင်းအတွက် ကြီးကျယ်ခမ်းနားသောတာဝန်ကို ထမ်းဆောင်ခဲ့သည်။

ရည်ရွယ်ချက်မှာ ခိုင်မာသော ဘာသာစကားပေါင်းစုံ စကားပြောပုံစံများကို တည်ဆောက်ရန်နှင့် ရှေ့ဆက်ရမည့်လမ်းတွင် စိန်ခေါ်မှုများစွာရှိသည်။

ရှုပ်ထွေးမှုကို ဆင်ခြင်ပါ။- ဘာသာစကား 3000 မျိုး ပါဝင်သော အမျိုးမျိုးသော အသံဒေတာ နာရီပေါင်း 8 ကို ရယူထားပြီး တစ်ခုချင်းစီတွင် ထူးခြားသော ဒေသိယစကား 4 မျိုးရှိသည်။ ဤဒေတာသည် စေ့စေ့စပ်စပ် ခွဲခြမ်းခြင်းနှင့် စာသားမှတ်တမ်း လိုအပ်ပါသည်။

သို့သော် Shaip က အောင်ပွဲခံခဲ့သည်။ ၎င်းတို့၏ ကျယ်ကျယ်ပြန့်ပြန့်ချဉ်းကပ်မှုတွင် အသွင်အပြင်မျိုးစုံကို လွှမ်းခြုံထားသည်။

  • ဒေတာများစုဆောင်းခြင်း: Shaip သည် အသက်၊ ကျား၊ မ၊ ပညာရေးနှင့် ဒေသိယစကားဆိုင်ရာ အသံများဆိုင်ရာ ကွဲပြားသော အချက်အလက်များကို စုဆောင်းခဲ့သည်။
  • ဒေတာခွဲခြမ်းမှု: အသံဒေတာသည် ပြင်းထန်သော အပိုင်းခွဲခြင်းကို လုပ်ဆောင်ခဲ့သည်။ ကျွန်ုပ်တို့သည် အပိုင်းတစ်ခုစီကို တိကျသေချာစေရန် ဂရုတစိုက် မှတ်သားထားသည်။
  • အရည်အသွေးကောင်းခြင်းအာမခံချက်- အသံသွင်းမှုတိုင်းသည် တင်းကြပ်သော အရည်အသွေးစစ်ဆေးမှုများမှတစ်ဆင့် အောင်မြင်ခဲ့သည်။ အတတ်နိုင်ဆုံးသာ ဖြတ်ထုတ်ခဲ့သည်။
  • ဒေတာမှတ်တမ်း: ကျွန်ုပ်တို့သည် တိကျမှုမရှိဘဲ အရည်အသွေးပြည့်မီသော တိကျမှုဖြင့် လုပ်ဆောင်ရန် လိုအပ်ပါသည်။ ထို့ကြောင့်၊ ကျွန်ုပ်တို့သည် စကားလုံးတိုင်း၊ တုံ့ဆိုင်းမှုနှင့် ကွဲလွဲမှုကို တိကျစွာ ဖမ်းယူထားသည်။

ရလဒ်အနေဖြင့် အိန္ဒိယဘာသာစကား ရှစ်မျိုးတွင် အမှားမရှိသော စကားပြောမှတ်သားမှုပုံစံများကို ဖန်တီးရန် IIT Madras အား ခွန်အားဖြစ်စေသည့် အရည်အသွေးမြင့် အသံဒေတာအတွဲကို ဖန်တီးခဲ့သည်။ ဤပူးပေါင်းဆောင်ရွက်မှု၏ ဒစ်ဂျစ်တယ်ကမ္ဘာတစ်လွှားတွင် တုန်လှုပ်သွားသည့် သက်ရောက်မှုများသည် သံသယဖြစ်ဖွယ် ပဲ့တင်ထပ်မည်ဖြစ်သည်။ အမှန်တကယ်ပါဝင်သော ဒစ်ဂျစ်တယ်အိန္ဒိယနိုင်ငံကို ဖန်တီးရန် ဘာသာစကားဆိုင်ရာ အတားအဆီးများကို ပေါင်းကူးပေးမည်ဖြစ်သည်။

လူမှုဝေမျှမယ်