ကျန်းမာရေးစောင့်ရှောက်မှု AI အတွက် ဒေတာ မှတ်ချက်

လူ့စွမ်းအားသုံး ဆေးဘက်ဆိုင်ရာ အချက်အလက် မှတ်ချက်

ရှုပ်ထွေးသောအချက်အလက်များကို entity ထုတ်ယူခြင်းနှင့် အသိအမှတ်ပြုခြင်းတို့ဖြင့် ဖွဲ့စည်းတည်ဆောက်ထားသောဒေတာတွင် လော့ခ်ဖွင့်ပါ။

ဆေးဘက်ဆိုင်ရာ အချက်အလက် မှတ်ချက်

Featured Clients များ

အဖွဲ့များကိုကမ္ဘာ့ ဦး ဆောင်သော AI ထုတ်ကုန်များတည်ဆောက်ရန်အားပေးခြင်း။

အမေဇုံ
Google
Microsoft က
ကော့နစ်
မရှာဖွေနိုင်သော ထိုးထွင်းသိမြင်မှုများကို ဖော်ထုတ်ရန် ဖွဲ့စည်းတည်ဆောက်ပုံမရှိသော၊ ရှုပ်ထွေးသော ဆေးဘက်ဆိုင်ရာ အချက်အလက်များကို ခွဲခြမ်းစိတ်ဖြာရန် တောင်းဆိုမှု တိုးလာပါသည်။

ကျန်းမာရေးစောင့်ရှောက်မှုဒိုမိန်းရှိ ဒေတာများ၏ 80% သည် ဖွဲ့စည်းတည်ဆောက်ပုံမရှိသောကြောင့် လက်လှမ်းမမီနိုင်ပါ။ ဒေတာကို ဝင်ရောက်ကြည့်ရှုရာတွင် အသုံးပြုနိုင်သော ဒေတာပမာဏကို ကန့်သတ်ထားသည့် သိသာထင်ရှားသော လက်ဖြင့်ဝင်ရောက်စွက်ဖက်မှု လိုအပ်သည်။ ဆေးဘက်ဆိုင်ရာ ဒိုမိန်းရှိ စာသားကို နားလည်ခြင်းသည် ၎င်း၏ အလားအလာကို သော့ဖွင့်ရန် ၎င်း၏ ဝေါဟာရအသုံးအနှုန်းများကို နက်ရှိုင်းစွာ နားလည်ရန် လိုအပ်သည်။ Shaip သည် AI အင်ဂျင်များကို အတိုင်းအတာတစ်ခုအထိ တိုးတက်ကောင်းမွန်လာစေရန် ကျန်းမာရေးစောင့်ရှောက်မှုဒေတာကို မှတ်သားရန် ကျွမ်းကျင်မှုကို ပံ့ပိုးပေးသည်။

IDC၊ Analyst Firm-

ကမ္ဘာတစ်ဝှမ်းတွင် တပ်ဆင်ထားသည့် သိုလှောင်မှုပမာဏသည် ရောက်ရှိမည်ဖြစ်သည်။ ၄၄ zettabytes in 2023

IBM၊ Gartner နှင့် IDC-

80% ကမ္ဘာတဝှမ်းရှိ ဒေတာများသည် ဖွဲ့စည်းပုံမရှိသောကြောင့် အသုံးမပြုနိုင်ဘဲ ပျက်ပြားသွားစေသည်။ 

Real-World ဖြေရှင်းချက်

NLP မော်ဒယ်များကို ဆေးဘက်ဆိုင်ရာ စာသားဒေတာ မှတ်သားချက်ဖြင့် လေ့ကျင့်ရန် အဓိပ္ပာယ်ရှိသော ထိုးထွင်းသိမြင်မှုကို ရှာဖွေရန် ဒေတာကို ပိုင်းခြားစိတ်ဖြာပါ။

ပေးထားသော စာသား သို့မဟုတ် ပုံတွင် ပါရှိသည့် ဆေးဘက်ဆိုင်ရာ အစိတ်အပိုင်းများကို ခွဲခြားသတ်မှတ်ရန် စက်များကို ကူညီပေးသည့် ဆေးဝါးမှတ်တမ်းများ၊ EHR ဝင်ခွင့်/ဆင်းသက်မှု အနှစ်ချုပ်များ၊ ရောဂါဗေဒ အစီရင်ခံစာများ အစရှိသည်ဖြင့် အဖွဲ့အစည်းများ၏ အရေးပါသော အချက်အလက်များကို ထုတ်ယူရာတွင် အထောက်အကူဖြစ်စေသော ဆေးဘက်ဆိုင်ရာ အချက်အလက်မှတ်ချက် ဝန်ဆောင်မှုများ ပေးပါသည်။ ကျွန်ုပ်တို့၏ ယုံကြည်စိတ်ချရသော ဒိုမိန်းကျွမ်းကျင်သူများသည် သင့်အား စောင့်ရှောက်မှုအတွက် ထိုးထွင်းသိမြင်မှုများကို တွန်းအားပေးကူညီရန် - ဥပမာ၊ ရောဂါလက္ခဏာများ၊ ရောဂါများ၊ ဓာတ်မတည့်မှုနှင့် ဆေးဝါးများကို ပေးအပ်ရန် သင့်အား ကူညီပေးနိုင်ပါသည်။

Real-World ဖြေရှင်းချက်

ကျွန်ုပ်တို့သည် စာသားမှတ်တမ်းတွင် ဖော်ပြထားသည့် အမည်ရှိအရာများကို အလိုအလျောက်ခွဲခြားသတ်မှတ်နိုင်ပြီး အမျိုးအစားခွဲခြားနိုင်သည့် သီးသန့်ဆေးဘက်ဆိုင်ရာ NER APIs (ကြိုတင်လေ့ကျင့်ထားသည့် NLP မော်ဒယ်များ) ကိုလည်း ပေးပါသည်။ ဆေးဘက်ဆိုင်ရာ NER APIs များသည် 20M+ ဆက်ဆံရေးနှင့် 1.7M+ ဆေးခန်းဆိုင်ရာ အယူအဆများဖြင့် မူပိုင်အသိပညာဂရပ်ကို လွှမ်းမိုးထားသည်။

ဒေတာလိုင်စင်ရယူခြင်းနှင့် စုဆောင်းခြင်းမှသည် ဒေတာမှတ်စုများအထိ၊ Shaip သည် သင့်အား အကာအကွယ်ပေးထားသည်။

  • ဓာတ်မှန်ရိုက်ခြင်း၊ အာထရာဆောင်း၊ ရင်သားဓါတ်မှန်ရိုက်ခြင်း၊ CT စကင်န်များ၊ MRI နှင့် ဖိုတွန်ထုတ်လွှတ်မှု ဓာတ်မှန်ရိုက်ခြင်းအပါအဝင် ဆေးဘက်ဆိုင်ရာပုံရိပ်များ၊ ဗီဒီယိုများနှင့် စာသားများ ပြင်ဆင်မှု
  • ဆေးဘက်ဆိုင်ရာ စာသားအမျိုးအစားခွဲခြားခြင်း၊ အမည်ပေးထားသည့် အကြောင်းအရာခွဲခြားခြင်း၊ စာသားခွဲခြမ်းစိတ်ဖြာခြင်းစသည့် အပါအဝင်၊ သဘာဝဘာသာစကားလုပ်ဆောင်ခြင်း (NLP) အတွက် ဆေးဝါးနှင့် အခြားကျန်းမာရေးစောင့်ရှောက်မှုဆိုင်ရာ အသုံးပြုမှုကိစ္စများ

ဆေးဘက်ဆိုင်ရာ မှတ်ချက် လုပ်ငန်းစဉ်

မှတ်ချက်ပေးခြင်းလုပ်ငန်းစဉ်သည် ယေဘုယျအားဖြင့် သုံးစွဲသူ၏လိုအပ်ချက်နှင့် ကွဲပြားသော်လည်း ၎င်းတွင် အဓိကအားဖြင့် ပါဝင်သည်-

ဒိုမိန်းကျွမ်းကျင်မှု

အဆင့် 1: နည်းပညာဆိုင်ရာ ဒိုမိန်းကျွမ်းကျင်မှု (နယ်ပယ်နှင့် မှတ်ချက်လမ်းညွှန်ချက်များကို နားလည်ပါ)

လေ့ကျင့်ရေးအရင်းအမြစ်များ

အဆင့် 2: ပရောဂျက်အတွက် သင့်လျော်သော အရင်းအမြစ်များကို လေ့ကျင့်သင်ကြားပေးခြင်း။

Q စာရွက်စာတမ်းများ

အဆင့် 3: မှတ်ချက်ပေးထားသောစာရွက်စာတမ်းများ၏ တုံ့ပြန်ချက်စက်ဝန်းနှင့် QA

ကျွန်ုပ်တို့၏ကျွမ်းကျင်မှု

1. Clinical Entity အသိအမှတ်ပြု/မှတ်ချက်

ဆေးဘက်ဆိုင်ရာအချက်အလက်များနှင့် အသိပညာအမြောက်အမြားကို အဓိကအားဖြင့် ဖွဲ့စည်းတည်ဆောက်ပုံမထားသောပုံစံဖြင့် ဆေးမှတ်တမ်းများတွင် ရရှိနိုင်သည်။ ဆေးဘက်ဆိုင်ရာအဖွဲ့အစည်း မှတ်ချက်ပေးခြင်းသည် ဖွဲ့စည်းတည်ဆောက်ပုံမထားသောဒေတာကို ဖွဲ့စည်းတည်ဆောက်ပုံဖော်မတ်အဖြစ်သို့ ပြောင်းလဲနိုင်စေပါသည်။

Clinical Entity မှတ်ချက်
ဆေးဂုဏ်တော်များ

2. ထည့်သွင်းဖော်ပြချက် မှတ်ချက်

2.1 ဆေးဂုဏ်ရည်များ

ဆေးဝါးများနှင့် ၎င်းတို့၏ ဂုဏ်ရည်များကို ဆေးမှတ်တမ်းတိုင်းနီးပါးတွင် မှတ်တမ်းတင်ထားပြီး၊ ဆေးခန်း၏ အရေးကြီးသော အစိတ်အပိုင်းတစ်ခုဖြစ်သည်။ ကျွန်ုပ်တို့သည် လမ်းညွှန်ချက်များနှင့်အညီ ဆေးဝါးများ၏ အမျိုးမျိုးသော ဂုဏ်ရည်များကို ခွဲခြားမှတ်သားနိုင်ပါသည်။

2.2 Lab Data Attributes

ဓာတ်ခွဲခန်းဒေတာအများစုသည် ဆေးမှတ်တမ်းတစ်ခုတွင် ၎င်းတို့၏ အရည်အချင်းများဖြင့် ပါ၀င်သည်။ ကျွန်ုပ်တို့သည် လမ်းညွှန်ချက်များအရ ဓာတ်ခွဲခန်းဒေတာ၏ အမျိုးမျိုးသော အရည်အချင်းများကို ခွဲခြားသတ်မှတ်နိုင်ပြီး မှတ်သားထားနိုင်ပါသည်။

Lab Data Attributes
ခန္ဓာကိုယ် တိုင်းတာခြင်း ဂုဏ်တော်များ

2.3 ခန္ဓာကိုယ် အတိုင်းအတာ အရည်အချင်းများ

ခန္ဓာကိုယ် တိုင်းတာခြင်းအား ဆေးမှတ်တမ်းတစ်ခုတွင် ၎င်းတို့၏ အရည်အချင်းများဖြင့် လိုက်ပါဆောင်ရွက်ပါသည်။ ၎င်းတွင် အများအားဖြင့် အရေးကြီးသော လက္ခဏာများ ပါဝင်သည်။ ကျွန်ုပ်တို့သည် ခန္ဓာကိုယ်တိုင်းတာခြင်း၏ အမျိုးမျိုးသော ဂုဏ်သတ္တိများကို ခွဲခြားမှတ်သားနိုင်ပြီး မှတ်သားနိုင်ပါသည်။

3. Oncology Specific NER မှတ်ချက်

ယေဘူယျဆေးဘက်ဆိုင်ရာ NER မှတ်ချက်နှင့်အတူ၊ ကင်ဆာရောဂါ၊ ဓာတ်မှန်ရိုက်ခြင်းစသည့် ဒိုမိန်းဆိုင်ရာ သီးခြားမှတ်ချက်များပေါ်တွင်လည်း လုပ်ဆောင်နိုင်ပါသည်။ ဤတွင် ကင်ဆာရောဂါဆိုင်ရာ သီးခြား NER အစိတ်အပိုင်းများကို မှတ်သားထားနိုင်သော ကင်ဆာပြဿနာ၊ Histology၊ ကင်ဆာအဆင့်၊ TNM အဆင့်၊ ကင်ဆာအဆင့်၊ အတိုင်းအတာ၊ ဆေးဘက်ဆိုင်ရာအခြေအနေ၊ အကျိတ်အမှတ်အသားစစ်ဆေးမှု၊ ကင်ဆာဆေးပညာ၊ ကင်ဆာခွဲစိတ်မှု၊ ဓါတ်ရောင်ခြည်၊ မျိုးရိုးဗီဇလေ့လာချက်၊ ပုံစံကွဲကုဒ်၊ ခန္ဓာကိုယ်ဆိုဒ်

ကင်ဆာရောဂါဆိုင်ရာ သီးခြား Ner မှတ်ချက်
ဆိုးရွားသောသက်ရောက်မှု မှတ်ချက်

4. Adverse Effect NER & Relationship မှတ်ချက်

အဓိက ဆေးခန်းများနှင့် ဆက်စပ်မှုများကို ခွဲခြားသတ်မှတ်ခြင်းနှင့် မှတ်သားခြင်းနှင့်အတူ၊ အချို့သော ဆေးဝါးများ သို့မဟုတ် လုပ်ထုံးလုပ်နည်းများ၏ ဆိုးကျိုးများကို မှတ်သားနိုင်ပါသည်။ နယ်ပယ်မှာ အောက်ပါအတိုင်းဖြစ်သည်- ဘေးထွက်ဆိုးကျိုးများနှင့် ၎င်းတို့၏ အကြောင်းရင်းခံများကို တံဆိပ်ကပ်ခြင်း။ ဆိုးကျိုးနှင့် အကျိုးသက်ရောက်မှု အကြောင်းရင်းကြား ဆက်စပ်မှုကို သတ်မှတ်ပေးခြင်း။

5. ဆက်ဆံရေး မှတ်ချက်

ဆေးဘက်ဆိုင်ရာ entities များကို ခွဲခြားသတ်မှတ်ပြီး အမှတ်အသားပြုပြီးနောက်၊ သက်ဆိုင်ရာ entities များကြားတွင် သက်ဆိုင်ရာ ဆက်ဆံရေးကိုလည်း သတ်မှတ်ပေးပါသည်။ ဆက်ဆံရေးများသည် အယူအဆနှစ်ခု သို့မဟုတ် ထို့ထက်ပိုသော အယူအဆများကြားတွင် ရှိနေနိုင်သည်။

ဆက်စပ်မှတ်ချက်

6. ပြောဆိုချက် မှတ်ချက်

ဆေးဘက်ဆိုင်ရာအကြောင်းအရာများနှင့် ဆက်ဆံရေးများကို ခွဲခြားသတ်မှတ်ခြင်းနှင့်အတူ၊ ကျွန်ုပ်တို့သည် ဆေးဘက်ဆိုင်ရာအဖွဲ့အစည်းများ၏ အဆင့်အတန်း၊ အဆိုးမြင်မှုနှင့် ဘာသာရပ်တို့ကိုလည်း သတ်မှတ်ပေးနိုင်ပါသည်။

Status-Negation-Subject

7. ယာယီမှတ်စု

ဆေးမှတ်တမ်းမှ ယာယီအကြောင်းအရာများကို မှတ်သားခြင်း၊ လူနာ၏ခရီး၏ အချိန်ဇယားကို တည်ဆောက်ရာတွင် အထောက်အကူဖြစ်စေသည်။ ၎င်းသည် သီးခြားဖြစ်ရပ်တစ်ခုနှင့် ဆက်စပ်သည့် ရက်စွဲအား ကိုးကားချက်နှင့် အကြောင်းအရာကို ပေးဆောင်သည်။ ဤတွင် ရက်စွဲများ- ရောဂါရှာဖွေသည့်ရက်စွဲ၊ လုပ်ထုံးလုပ်နည်းရက်စွဲ၊ ဆေးဝါးစတင်သည့်ရက်စွဲ၊ ဆေးဝါးကုန်ဆုံးရက်စွဲ၊ ဓာတ်ရောင်ခြည်စတင်သည့်ရက်စွဲ၊ ဓာတ်ရောင်ခြည်ထုတ်သည့်ရက်စွဲ၊ ဝင်ခွင့်ရက်စွဲ၊ ဆင်းမည့်ရက်၊ တိုင်ပင်ဆွေးနွေးသည့်ရက်စွဲ၊ မှတ်ချက်ရက်စွဲ၊ စတင်သည့်ရက်စွဲ။

ယာယီမှတ်စု
အပိုင်း မှတ်ချက်

8. အပိုင်း မှတ်ချက်

၎င်းသည် ကျန်းမာရေးစောင့်ရှောက်မှုဆိုင်ရာ စာရွက်စာတမ်းများ၊ ရုပ်ပုံများ သို့မဟုတ် ဒေတာ၏ ကွဲပြားသော ကဏ္ဍများ သို့မဟုတ် အစိတ်အပိုင်းများကို စနစ်တကျ စုစည်းခြင်း၊ အညွှန်းတပ်ခြင်းနှင့် အမျိုးအစားခွဲခြင်းလုပ်ငန်းစဉ်ကို ရည်ညွှန်းသည်။ ဆိုလိုသည်မှာ စာရွက်စာတမ်းမှ သက်ဆိုင်ရာကဏ္ဍများ၏ မှတ်ချက်နှင့် ကဏ္ဍများကို ၎င်းတို့၏ အမျိုးအစားများအလိုက် အမျိုးအစားခွဲခြင်းတို့ကို ရည်ညွှန်းပါသည်။ ၎င်းသည် ဆေးခန်းဆိုင်ရာ ဆုံးဖြတ်ချက်ပံ့ပိုးမှု၊ ဆေးသုတေသနနှင့် ကျန်းမာရေးစောင့်ရှောက်မှုဒေတာခွဲခြမ်းစိတ်ဖြာမှုစသည့် ရည်ရွယ်ချက်အမျိုးမျိုးအတွက် အသုံးပြုနိုင်သည့် ဖွဲ့စည်းတည်ဆောက်ပုံနှင့် အလွယ်တကူရနိုင်သော အချက်အလက်များကို ဖန်တီးရာတွင် ကူညီပေးသည်။

9. ICD-10-CM & CPT Coding

လမ်းညွှန်ချက်များအရ ICD-10-CM နှင့် CPT ကုဒ်များ၏ မှတ်ချက်။ တံဆိပ်တပ်ထားသော ဆေးဘက်ဆိုင်ရာကုဒ်တစ်ခုစီအတွက်၊ တံဆိပ်ကပ်ခြင်းဆိုင်ရာ ဆုံးဖြတ်ချက်ကို သက်သေအထောက်အထားပြသော အထောက်အထား (စာသားအတိုအထွာများ) ကို ကုဒ်နှင့်အတူ မှတ်စုပေးပါမည်။

Icd-10-Cm &Amp; Cpt Coding
Rxnorm Coding

10. RXNORM Coding

လမ်းညွှန်ချက်များအရ RXNORM ကုဒ်များ၏ မှတ်ချက်။ အညွှန်းတပ်ထားသော ဆေးဘက်ဆိုင်ရာကုဒ်တစ်ခုစီအတွက်၊ တံဆိပ်ကပ်ခြင်းဆိုင်ရာ ဆုံးဖြတ်ချက်ကို သက်သေအထောက်အထားပြသော အထောက်အထား (စာသားအတိုအထွာများ) ကိုလည်း ကုဒ်နှင့်အတူ မှတ်စုပေးပါမည်။

11. SNOMED Coding

လမ်းညွှန်ချက်များအရ SNOMED ကုဒ်များ၏ မှတ်ချက်။ တံဆိပ်တပ်ထားသော ဆေးဘက်ဆိုင်ရာကုဒ်တစ်ခုစီအတွက်၊ တံဆိပ်ကပ်ခြင်းဆိုင်ရာ ဆုံးဖြတ်ချက်ကို သက်သေအထောက်အထားပြသော အထောက်အထား (စာသားအတိုအထွာများ) ကို ကုဒ်နှင့်အတူ မှတ်စုပေးပါမည်။

Snomed Coding
Umls Coding

12. UMLS Coding

လမ်းညွှန်ချက်များအရ UMLS ကုဒ်များ၏ မှတ်ချက်။ တံဆိပ်တပ်ထားသော ဆေးဘက်ဆိုင်ရာကုဒ်တစ်ခုစီအတွက်၊ တံဆိပ်ကပ်ခြင်းဆိုင်ရာ ဆုံးဖြတ်ချက်ကို သက်သေအထောက်အထားပြသော အထောက်အထား (စာသားအတိုအထွာများ) ကို ကုဒ်နှင့်အတူ မှတ်စုပေးပါမည်။

Shaip ကို သင်၏ ယုံကြည်စိတ်ချရသော ဆေးဘက်ဆိုင်ရာ မှတ်ချက်များကို ပါတနာအဖြစ် ရွေးချယ်ရန် အကြောင်းပြချက်များ

  လူပုဂၢဳိလ္မ်ား

လူပုဂၢဳိလ္မ်ား

အပ်နှံပြီးလေ့ကျင့်ထားသောအသင်းများ -

  • Data Creation, Labeling & QA အတွက် 30,000+ ပူးပေါင်းသူ
  • စီမံကိန်းစီမံခန့်ခွဲမှုအဖွဲ့
  • အတွေ့အကြုံရှိသောကုန်ပစ္စည်းဖွံ့ဖြိုးရေးအဖွဲ့
  • Talent ရေကူးကန် Sourcing & Onboarding အဖွဲ့
ဖြစ်စဉ်

ဖြစ်စဉ်

အမြင့်ဆုံးဖြစ်စဉ်ကိုထိရောက်မှုနှင့်အတူအာမခံသည်

  • ကြံ့ခိုင် 6 Sigma အဆင့် -Gate Process ကို
  • Sigma အနက်ရောင်ခါးပတ် ၆ ခုပါ ၀ င်သောအဖွဲ့ - အဓိကလုပ်ငန်းစဉ်ပိုင်ရှင်များနှင့်အရည်အသွေးလိုက်နာမှု
  • စဉ်ဆက်မပြတ်တိုးတက်မှု & တုံ့ပြန်ချက် Loop
ပလက်ဖောင်း

ပလက်ဖောင်း

မူပိုင်ခွင့်ထားသောပလက်ဖောင်းသည်အကျိုးကျေးဇူးများကိုပေးသည်။

  • Web-based အဆုံးမှအဆုံးသို့ပလက်ဖောင်း
  • ပြီးပြည့်စုံသောအရည်အသွေး
  • မြန် TAT
  • ချောမွေ့စွာဖြန့်ဝေ
Shaip ကျွန်ုပ်တို့ကို ဆက်သွယ်ပါ။

ရှုပ်ထွေးသော ပရောဂျက်များအတွက် ကျန်းမာရေးစောင့်ရှောက်မှု သတိပေးချက် ကျွမ်းကျင်သူများကို ရှာဖွေနေပါသလား။

မင်းရဲ့ထူးခြားတဲ့ AI/ML ဖြေရှင်းချက်အတွက် ဒေတာအတွဲကို ဘယ်လိုစုဆောင်းပြီး မှတ်စုထုတ်နိုင်မလဲဆိုတာ လေ့လာဖို့ အခုပဲ ဆက်သွယ်လိုက်ပါ။

  • စာရင်းသွင်းခြင်းဖြင့်၊ Shaip နှင့် သဘောတူပါသည်။ ကိုယ်ရေးအချက်အလက်ပေါ်လစီ နှင့် ဝန်ဆောင်မှုစည်းမျဉ်းများ Shaip ထံမှ B2B စျေးကွက်ချဲ့ထွင်ဆက်သွယ်ရေးကို လက်ခံရယူရန် ကျွန်ုပ်၏သဘောတူညီချက်ကို ပေးဆောင်ပါ။

Entity Recognition သည် Natural Language Processing ၏ အစိတ်အပိုင်းတစ်ခုဖြစ်သည်။ NER ၏ အဓိကရည်ရွယ်ချက်မှာ တည်ဆောက်ပုံနှင့်ဖွဲ့စည်းပုံမထားသော အချက်အလက်များကို စီမံဆောင်ရွက်ပြီး အဆိုပါအမည်ပေးထားသည့်အရာများကို ကြိုတင်သတ်မှတ်ထားသော အမျိုးအစားများအဖြစ် အမျိုးအစားခွဲခြားရန်ဖြစ်သည်။ အချို့သော ဘုံအမျိုးအစားများမှာ အမည်၊ တည်နေရာ၊ ကုမ္ပဏီ၊ အချိန်၊ ငွေကြေးတန်ဖိုးများ၊ ပွဲလမ်းသဘင်များနှင့် အခြားအရာများ ပါဝင်သည်။

အတိုချုပ်အားဖြင့်၊ NER သည်-

အမည်ပေးထားသည့် အရာအား အသိအမှတ်ပြုခြင်း/ထောက်လှမ်းခြင်း - စာရွက်စာတမ်းတစ်ခုရှိ စကားလုံးတစ်လုံး သို့မဟုတ် စကားလုံးစီးရီးများကို ခွဲခြားသတ်မှတ်ခြင်း။

အမည်ပေးထားသော entity အမျိုးအစားခွဲခြားခြင်း - ရှာဖွေတွေ့ရှိထားသော အရာတိုင်းကို ကြိုတင်သတ်မှတ်ထားသော အမျိုးအစားများအဖြစ် အမျိုးအစားခွဲခြားခြင်း။

Natural Language processing သည် စကားပြောနှင့် စာသားမှ အဓိပ္ပါယ်ကို ထုတ်ယူနိုင်သည့် အသိဉာဏ်ရှိသော စက်များကို တီထွင်ရန် ကူညီပေးပါသည်။ Machine Learning သည် သဘာဝဘာသာစကား ဒေတာအစုံအလင် အများအပြားကို လေ့ကျင့်ပေးခြင်းဖြင့် ဤအသိဉာဏ်ရှိသော စနစ်များကို ဆက်လက်သင်ယူရန် ကူညီပေးပါသည်။ ယေဘူယျအားဖြင့် NLP တွင် အဓိက အမျိုးအစားသုံးမျိုး ပါဝင်သည်။

ဘာသာစကား၏ဖွဲ့စည်းပုံနှင့်စည်းမျဉ်းများကိုနားလည်ခြင်း - Syntax

စကားလုံးများ၊ စာသားနှင့် အပြောအဆိုများ၏ အဓိပ္ပါယ်ကို ရယူပြီး ၎င်းတို့၏ ဆက်ဆံရေးများကို ခွဲခြားသတ်မှတ်ခြင်း - ဝေါဟာရများ

ပြောသောစကားလုံးများကို ခွဲခြားသိမြင်ပြီး ၎င်းတို့ကို စာသားအဖြစ် ပြောင်းလဲခြင်း - မိန့်ခွန်း

ကြိုတင်သတ်မှတ်ထားသော entity အမျိုးအစားခွဲခြင်း၏ ဘုံဥပမာအချို့မှာ-

Person: Michael Jackson၊ Oprah Winfrey၊ Barack Obama၊ Susan Sarandon

တည်နေရာ: ကနေဒါ၊ ဟိုနိုလူလူ၊ ဘန်ကောက်၊ ဘရာဇီး၊ ကိန်းဘရစ်

အဖွဲ့အစည်းက: Samsung၊ Disney၊ Yale တက္ကသိုလ်၊ Google

အချိန်: 15.35 12 PM၊

NER စနစ်များဖန်တီးခြင်းအတွက် မတူညီသောနည်းလမ်းများမှာ-

အဘိဓာန်အခြေခံစနစ်များ

စည်းကမ်းအခြေခံစနစ်များ

စက်သင်ယူမှုအခြေခံစနစ်များ

ချောမွေ့သော ဖောက်သည် ပံ့ပိုးမှု

ထိရောက်သော လူ့စွမ်းအားအရင်းအမြစ်များ

ရိုးရှင်းသော အကြောင်းအရာ အမျိုးအစားခွဲခြားခြင်း။

ရှာဖွေရေးအင်ဂျင်များကို အကောင်းဆုံးလုပ်ဆောင်ခြင်း။

တိကျသော အကြောင်းအရာ အကြံပြုချက်