AI အရင်းအမြစ်စင်တာ - ဖြစ်ရပ်မှန်လေ့လာမှု

အတွက် Crafted & Curated
ကမ္ဘာ့အဆင့်မီ AI အဖွဲ့များ
ဖြစ်ရပ်မှန်လေ့လာမှု
စကားဝိုင်း Ai

ဘာသာစကားမျိုးစုံပြောဆိုသော AI ကိုတည်ဆောက်ရန်သင်တန်းအချက်အလက်များ

အရည်အသွေးမြင့်အသံဒေတာကို ၂၇ ဘာသာဖြင့်စကားပြောဆိုသော AI ကိုလေ့ကျင့်ရန်ရင်းမြစ်၊ ဖန်တီး၊

Uterance Data စုဆောင်းခြင်း။

ဘာသာစကားပေါင်းစုံ ဒစ်ဂျစ်တယ်လက်ထောက်ကို တည်ဆောက်ရန် စကားစုဒေတာစုဆောင်းခြင်း။

ဘာသာစကားပေါင်း ၁၃ မျိုးဖြင့် ဘာသာစကားမျိုးစုံ ဒစ်ဂျစ်တယ်လက်ထောက်များကို တည်ဆောက်ရန်အတွက် နာရီပေါင်း 7k ကျော်ကြာ အသံဒေတာဖြင့် 22M+ Uterances များကို ပေးပို့ခဲ့သည်။

Content Moderation - အရင်းအမြစ်ပုံ

30K+ docs ဝဘ်ကို ဖျက်သိမ်းပြီး အကြောင်းအရာ စိစစ်မှုအတွက် မှတ်စုများ ရေးသွင်းထားသည်။

အလိုအလျောက်ပါဝင်မှု ထိန်းညှိပေးသည့် ML မော်ဒယ်ကို အဆိပ်အတောက်ဖြစ်စေသော၊ ရင့်ကျက်သော သို့မဟုတ် လိင်ပိုင်းဆိုင်ရာ ရိုင်းစိုင်းသော အမျိုးအစားများအဖြစ် နှစ်ပိုင်းခွဲတည်ဆောက်ရန်

အရင်းအမြစ်များ-Iitm Case Study

အသံဒေတာကို အိန္ဒိယဘာသာစကား ၈ မျိုးဖြင့် စုဆောင်း၊ အပိုင်းခွဲခြင်းနှင့် အသံသွင်းပါ။

ဘာသာစကား 3 မျိုးဖြင့် အိန္ဒိယဘာသာစကား မျိုးစုံဖြင့် စကားပြောနည်းပညာကို တည်ဆောက်ရန် စုဆောင်း၊ အပိုင်းပိုင်းနှင့် ကူးယူထားသော အသံဒေတာကို နာရီပေါင်း 8k ကျော် စုဆောင်း၊ အပိုင်းခွဲပြီး ကူးယူထားသည်။

Key Phrase စုစည်းမှု

ကားအတွင်း အသံဖြင့်ဖွင့်ထားသော စနစ်များအတွက် သော့စကားစု

သတ်မှတ်ထားသောအချိန်အတွင်း စပီကာ ၂၈၀၀ ထံမှ ကမ္ဘာလုံးဆိုင်ရာဘာသာစကား ၁၂ ခုဖြင့် စုဆောင်းထားသော အဓိကစကားစုများ/ကုန်အမှတ်တံဆိပ် 200k+ သော့ချက်စကားစုများ။

Named Entity အသိအမှတ်ပြုခြင်း (Ner)

Clinical NLP အတွက် Entity Recognition (NER) ဟု အမည်ပေးထားသည်။

ကျန်းမာရေးစောင့်ရှောက်မှု API ၏နောက် version ကိုတည်ဆောက်ရန်လက်တွေ့ NLP ကိုလေ့ကျင့်ရန် / ဖွံ့ဖြိုးရန်အတွက်ကောင်းမွန်စွာမှတ်သားထားသည့်နှင့် Gold Standard လက်တွေ့စာသားအချက်အလက်။

Image Collection နှင့်မှတ်စုများ

Image Recognition ကိုမြှင့်တင်ရန် Image Collection & Annotation

စမတ်ဖုန်းစီးရီးအသစ်အတွက်ပုံရိပ်အသိအမှတ်ပြုမော်ဒယ်များကိုလေ့ကျင့်ပေးရန်အရည်အသွေးမြင့်မားသောရုပ်ပုံဒေတာများကိုရင်းမြစ်ပြီးမှတ်သားထားပါသည်။

သင်၏နောက် AI ပဏာမခြေလှမ်းနှင့်မည်သို့ကူညီနိုင်ကြောင်းကျွန်ုပ်တို့အားပြောပြပါ။