Named Entity အသိအမှတ်ပြုခြင်း (NER)

အမည်ပေးထားသည့် Entity Recognition (NER) – အယူအဆ၊ အမျိုးအစားများနှင့် အသုံးချမှုများ

ကျွန်ုပ်တို့သည် စကားလုံးတစ်လုံးကိုကြားခြင်း သို့မဟုတ် စာသားကိုဖတ်သည့်အခါတိုင်း၊ ကျွန်ုပ်တို့တွင် စကားလုံးကို လူ၊ နေရာ၊ တည်နေရာ၊ တန်ဖိုးများနှင့် အခြားအရာများအဖြစ် ခွဲခြားခွဲခြားသတ်မှတ်နိုင်သည့် သဘာဝစွမ်းရည်ရှိသည်။ လူသားများသည် စကားလုံးတစ်လုံးကို လျင်မြန်စွာ မှတ်မိနိုင်ပြီး ၎င်းကို အမျိုးအစားခွဲကာ အကြောင်းအရာကို နားလည်နိုင်သည်။ ဥပမာအားဖြင့်၊ 'Steve Jobs' ဟူသော စကားလုံးကို ကြားသောအခါ၊ သင်သည် အနည်းဆုံး attribute သုံးခုမှ လေးခုကို ချက်ခြင်းစဉ်းစားနိုင်ပြီး entity ကို အမျိုးအစားများခွဲခြားနိုင်သည်။

  • Person: စတိဗ်ဂျော့ဘ်
  • ကုမ္ပဏီ: Apple
  • တည်နေရာ: California

ကွန်ပျူတာများတွင် ဤသဘာဝစွမ်းရည်မရှိသောကြောင့် စကားလုံးများ သို့မဟုတ် စာသားများကိုခွဲခြားသတ်မှတ်ပြီး အမျိုးအစားခွဲရန် ကျွန်ုပ်တို့၏အကူအညီကို လိုအပ်ပါသည်။ ဘယ်မှာလဲ။ Entity အသိအမှတ်ပြု Named (NER) ကစားသို့ကြွလာ။

NER နှင့် NLP နှင့် ၎င်း၏ဆက်စပ်မှုကို အတိုချုံးနားလည်ကြပါစို့။

Entity Recognition ဆိုတာ ဘာလဲ

Entity Recognition သည် Natural Language Processing ၏ အစိတ်အပိုင်းတစ်ခုဖြစ်သည်။ ၏အဓိကရည်ရွယ်ချက် င်း၏ NNER လုပ်ဆောင်ရန်ဖြစ်ပါသည်။ ဖွဲ့စည်းတည်ဆောက်ပုံနှင့်ဖွဲ့စည်းပုံမထားသောဒေတာ နှင့် ဤအမည်ရှိအရာများကို ကြိုတင်သတ်မှတ်ထားသော အမျိုးအစားများအဖြစ် အမျိုးအစားခွဲပါ။ အချို့သော ဘုံအမျိုးအစားများမှာ အမည်၊ တည်နေရာ၊ ကုမ္ပဏီ၊ အချိန်၊ ငွေကြေးတန်ဖိုးများ၊ ပွဲလမ်းသဘင်များနှင့် အခြားအရာများ ပါဝင်သည်။

အတိုချုပ်အားဖြင့်၊ NER သည်-

  • အမည်ပေးထားသည့် အရာအား အသိအမှတ်ပြုခြင်း/ထောက်လှမ်းခြင်း - စာရွက်စာတမ်းတစ်ခုရှိ စကားလုံးတစ်လုံး သို့မဟုတ် စကားလုံးစီးရီးများကို ခွဲခြားသတ်မှတ်ခြင်း။
  • အမည်ပေးထားသော entity အမျိုးအစားခွဲခြားခြင်း - ရှာဖွေတွေ့ရှိထားသော အရာတိုင်းကို ကြိုတင်သတ်မှတ်ထားသော အမျိုးအစားများအဖြစ် အမျိုးအစားခွဲခြားခြင်း။

သို့သော် NER သည် NLP နှင့် မည်သို့ဆက်စပ်သနည်း။

Natural Language processing သည် စကားပြောနှင့် စာသားမှ အဓိပ္ပါယ်ကို ထုတ်ယူနိုင်သည့် အသိဉာဏ်ရှိသော စက်များကို တီထွင်ရန် ကူညီပေးပါသည်။ Machine Learning သည် သဘာဝဘာသာစကား အမြောက်အမြားကို လေ့ကျင့်ပေးခြင်းဖြင့် အဆိုပါ အသိဉာဏ်ရှိသော စနစ်များကို ဆက်လက်သင်ယူရန် ကူညီပေးပါသည်။ ဒေတာအစုံ.

ယေဘူယျအားဖြင့် NLP တွင် အဓိက အမျိုးအစားသုံးမျိုး ပါဝင်သည်။

  • ဘာသာစကား၏ ဖွဲ့စည်းပုံနှင့် စည်းမျဉ်းများကို နားလည်ခြင်း- syntax
  • စကားလုံးများ၊ စာသားနှင့် အပြောအဆိုများ၏ အဓိပ္ပါယ်ကို ရယူပြီး ၎င်းတို့၏ ဆက်ဆံရေးကို ခွဲခြားသတ်မှတ်ခြင်း- semantic
  • စကားပြောသော စကားလုံးများကို ခွဲခြားသိမြင်ပြီး ၎င်းတို့ကို စာသားအဖြစ် ပြောင်းလဲခြင်း။ - မိန့်ခွန်း

NER ၏ semantic အပိုင်း၌ ကူညီသည်။ NLPစကားလုံးများ၏ အဓိပ္ပာယ်ကို ကောက်နုတ်ခြင်း၊ ၎င်းတို့၏ ဆက်ဆံရေးအပေါ် အခြေခံ၍ ၎င်းတို့ကို ဖော်ထုတ်ခြင်းနှင့် နေရာချထားခြင်း။

NER ၏ ဘုံဥပမာများ

ကြိုတင်သတ်မှတ်ထားသော ဘုံဥပမာအချို့ entity အမျိုးအစားခွဲခြင်း။ ခေါင်းစဉ်:

Ner ၏ ဘုံဥပမာများ Person: Michael Jackson၊ Oprah Winfrey၊ Barack Obama၊ Susan Sarandon

တည်နေရာ: ကနေဒါ၊ ဟိုနိုလူလူ၊ ဘန်ကောက်၊ ဘရာဇီး၊ ကိန်းဘရစ်

အဖွဲ့အစည်းက: Samsung၊ Disney၊ Yale တက္ကသိုလ်၊ Google

အချိန်: 15.35 12 PM၊

အခြားအမျိုးအစားများတွင် ကိန်းဂဏာန်းတန်ဖိုးများ၊ Expression၊ E-Mail Address နှင့် Facility တို့ ပါဝင်ပါသည်။

အမည်ပေးထားသော အဖွဲ့အစည်း အသိအမှတ်ပြုမှုတွင် ရှုပ်ထွေးမှု

သက်ဆိုင်သည့် အသုံးအနှုန်းအမျိုးအစားသည် လူသားများအတွက် အလိုလိုရှင်းလင်းပါသည်။ သို့သော် ကွန်ပျူတာများတွင် ထိုသို့မဟုတ်ပါ - အမျိုးအစားခွဲခြားခြင်းဆိုင်ရာ ပြဿနာများ ကြုံတွေ့ရတတ်ပါသည်။ ဥပမာ:

မန်စီးတီး (အဖှဲ့အစညျး) ပရီးမီးယားလိဂ်ဆုဖလားကို ဆွတ်ခူးနိုင်သော်လည်း အောက်ပါဝါကျတွင် အဖွဲ့အစည်းကို ကွဲပြားစွာအသုံးပြုသည်။ မန်စီးတီး (Location) အထည်အလိပ်နှင့် စက်မှုလုပ်ငန်းသုံး ဓာတ်အားပေးစက်ရုံဖြစ်ခဲ့သည်။

သင်၏ NER မော်ဒယ် လိုအပ်သည်။ လေ့ကျင့်ရေးဒေတာ တိကျစွာလုပ်ဆောင်ရန် ဘဘ ထုတ်ယူခြင်း။ နှင့်အမျိုးအစားခွဲခြား။ Shakespearean English ဖြင့် သင့်မော်ဒယ်လ်ကို လေ့ကျင့်သင်ကြားပေးနေပါက Instagram တွင် ပုံဖေါ်နိုင်မည်မဟုတ်ပါ။

မတူညီသော NER ချဉ်းကပ်မှုများ

တစ်ဦး၏ အဓိက ပန်းတိုင် NER မော်ဒယ် စာသားစာရွက်စာတမ်းများတွင် အရာဝတ္တုများကို အညွှန်းတပ်ပြီး ၎င်းတို့ကို အမျိုးအစားခွဲရန်ဖြစ်သည်။ ဤရည်ရွယ်ချက်အတွက် အောက်ပါနည်းလမ်းသုံးခုကို ယေဘူယျအားဖြင့် အသုံးပြုပါသည်။ သို့သော်၊ တစ်ခု သို့မဟုတ် တစ်ခုထက်ပိုသော နည်းလမ်းများကို ပေါင်းစပ်ရန် သင်ရွေးချယ်နိုင်သည်။

ယနေ့သင်၏ AI သင်တန်းအချက်အလက်လိုအပ်ချက်ကိုဆွေးနွေးကြပါစို့။

NER စနစ်များဖန်တီးခြင်းအတွက် မတူညီသောနည်းလမ်းများမှာ-

  • အဘိဓာန်အခြေခံစနစ်များ

    အဘိဓာန်အခြေခံစနစ်သည် အရိုးရှင်းဆုံးနှင့် အခြေခံအကျဆုံး NER ချဉ်းကပ်မှုဖြစ်နိုင်သည်။ ၎င်းသည် စကားလုံးများ၊ အဓိပ္ပါယ်တူကွဲများနှင့် ဝေါဟာရစုဆောင်းမှုများစွာပါရှိသော အဘိဓာန်ကို အသုံးပြုမည်ဖြစ်သည်။ စနစ်သည် စာသားတွင်ပါရှိသော သီးခြားအရာတစ်ခုကို ဝေါဟာရ၌လည်း ရနိုင်မလား။ string-matching algorithm ကိုအသုံးပြုခြင်းဖြင့်၊ entities များကို အပြန်အလှန်စစ်ဆေးခြင်းကို လုပ်ဆောင်ပါသည်။

    ဤချဉ်းကပ်မှုကိုအသုံးပြုခြင်း၏အားနည်းချက်တစ်ခုမှာ NER မော်ဒယ်၏ထိရောက်သောလုပ်ဆောင်မှုများအတွက် ဝေါဟာရဒေတာအတွဲကို အဆက်မပြတ်အဆင့်မြှင့်တင်ရန် လိုအပ်ပါသည်။

  • စည်းကမ်းအခြေခံစနစ်များ

    ဤချဉ်းကပ်မှုတွင်၊ ကြိုတင်သတ်မှတ်ထားသော စည်းမျဥ်းများပေါ်တွင် အခြေခံ၍ အချက်အလက်များကို ထုတ်ယူသည်။ သုံးတဲ့ စည်းမျဉ်း နှစ်ခုရှိတယ်၊

    ပုံစံအခြေခံစည်းမျဉ်းများ- အမည်တွင် အကြံပြုထားသည့်အတိုင်း၊ ပုံစံအခြေခံစည်းမျဉ်းတစ်ခုသည် စာရွက်စာတမ်းတွင်အသုံးပြုသော morphological ပုံစံ သို့မဟုတ် စာလုံးတန်းများကို လိုက်နာသည်။

    ဆက်စပ်စည်းမျဉ်းများ- အကြောင်းအရာအခြေခံစည်းမျဉ်းများသည် စာရွက်စာတမ်းရှိ စကားလုံး၏အဓိပ္ပာယ် သို့မဟုတ် ဆက်စပ်မှုအပေါ် မူတည်သည်။

  • စက်သင်ယူမှုအခြေခံစနစ်များ

    Machine learning-based systems တွင်၊ ကိန်းဂဏာန်းစံနမူနာကို entities ကိုရှာဖွေရန်အသုံးပြုသည်။ ဤချဉ်းကပ်မှုတွင် စာသားစာရွက်စာတမ်း၏ အင်္ဂါရပ်ကိုအခြေခံသော ကိုယ်စားပြုမှုကို အသုံးပြုသည်။ မော်ဒယ်က အသိအမှတ်ပြုနိုင်တဲ့အတွက် ပထမချဉ်းကပ်မှုနှစ်ခုရဲ့ အားနည်းချက်များစွာကို သင် ကျော်လွှားနိုင်ပါတယ်။ entity အမျိုးအစားများ ၎င်းတို့၏ စာလုံးပေါင်းမှာ အနည်းငယ်ကွဲလွဲနေသော်လည်း၊

NER ၏လျှောက်လွှာများ

NER တွင် Natural Language Processing နှင့် Training Datasets များ ဖန်တီးခြင်းနှင့် ဆက်စပ်သော နယ်ပယ်များစွာတွင် အသုံးပြုနိုင်သော ကိစ္စများစွာ ရှိပါသည်။ စက်သင်ယူမှု နှင့် နက်ရှိုင်းသောသင်ယူမှု ဖြေရှင်းချက်များ။ NER ၏ အချို့သော application များမှာ-

  • ချောမွေ့သော ဖောက်သည် ပံ့ပိုးမှု

    NER စနစ်သည် ထုတ်ကုန်အမည်များ၊ သတ်မှတ်ချက်များ၊ ဌာနခွဲတည်နေရာနှင့် အခြားအရာများကဲ့သို့ အရေးကြီးသော အချက်အလက်များအပေါ် အခြေခံ၍ သက်ဆိုင်ရာ သုံးစွဲသူများ၏ တိုင်ကြားချက်များ၊ မေးမြန်းချက်များနှင့် တုံ့ပြန်ချက်များကို အလွယ်တကူ တွေ့ရှိနိုင်သည်။ တိုင်ကြားချက် သို့မဟုတ် အကြံပြုချက်အား ဦးစားပေးသော့ချက်စာလုံးများကို စစ်ထုတ်ခြင်းဖြင့် မှန်ကန်သောဌာနသို့ လမ်းကြောင်းပြောင်းသွားပါသည်။

  • ထိရောက်သော လူ့စွမ်းအားအရင်းအမြစ်များ

    NER သည် လူ့စွမ်းအားအရင်းအမြစ်အဖွဲ့များအား ၎င်းတို့၏ အလုပ်ခန့်ထားမှုလုပ်ငန်းစဉ်ကို မြှင့်တင်ရန်နှင့် လျှောက်ထားသူများ၏ ကိုယ်ရေးအကျဉ်းကို အမြန်အကျဉ်းချခြင်းဖြင့် အချိန်ဇယားများကို လျှော့ချရန် ကူညီပေးသည်။ NER ကိရိယာများသည် ကိုယ်ရေးရာဇဝင်ကို စကန်ဖတ်ပြီး သက်ဆိုင်ရာ အချက်အလက်များ – အမည်၊ အသက်၊ လိပ်စာ၊ အရည်အချင်းစစ်၊ ကောလိပ်စသည်ဖြင့် ထုတ်ယူနိုင်သည်။

    ထို့အပြင် HR ဌာနသည် ဝန်ထမ်းများ၏ တိုင်ကြားချက်များကို စစ်ထုတ်ပြီး သက်ဆိုင်ရာ ဌာနဆိုင်ရာ အကြီးအကဲများထံ ထပ်ဆင့်ပေးပို့ခြင်းဖြင့် ဌာနတွင်း အလုပ်အသွားအလာများကို ချောမွေ့စေရန် NER ကိရိယာများကို အသုံးပြုနိုင်သည်။

  • ရိုးရှင်းသော အကြောင်းအရာ အမျိုးအစားခွဲခြားခြင်း။

    အကြောင်းအရာ အမျိုးအစားခွဲခြားခြင်းသည် သတင်းပေးသူများအတွက် ရယ်စရာအလုပ်တစ်ခုဖြစ်သည်။ အကြောင်းအရာကို မတူညီသောအမျိုးအစားများအဖြစ် ခွဲခြားသတ်မှတ်ခြင်းက ရှာဖွေတွေ့ရှိရန်၊ ထိုးထွင်းသိမြင်မှုရရှိရန်၊ လမ်းကြောင်းများကို ခွဲခြားသတ်မှတ်ရန်နှင့် ဘာသာရပ်များကို နားလည်ရန် ပိုမိုလွယ်ကူစေသည်။ နာမည်တစ်ခု Entity အသိအမှတ်ပြုမှု သတင်းပေးသူများအတွက် ကိရိယာသည် အသုံးဝင်သည်။ ၎င်းသည် ဆောင်းပါးများစွာကို စကင်န်ဖတ်ကာ၊ ဦးစားပေးသော့ချက်စာလုံးများကို ရှာဖွေဖော်ထုတ်နိုင်ပြီး လူပုဂ္ဂိုလ်၊ အဖွဲ့အစည်း၊ တည်နေရာနှင့် အခြားအရာများအပေါ် အခြေခံ၍ အချက်အလက်များကို ထုတ်ယူနိုင်သည်။

  • ရှာဖွေရေးအင်ဂျင်များကို အကောင်းဆုံးလုပ်ဆောင်ခြင်း။

    Search Engine Optimization င်း၏ NNER ရှာဖွေမှုရလဒ်များ၏ အမြန်နှုန်းနှင့် ဆီလျော်မှုတို့ကို ရိုးရှင်းစေပြီး ပိုမိုကောင်းမွန်စေရာတွင် ကူညီပေးသည်။ ဆောင်းပါးထောင်ပေါင်းများစွာအတွက် ရှာဖွေမှုမေးခွန်းကို လုပ်ဆောင်မည့်အစား NER မော်ဒယ်သည် မေးခွန်းကို တစ်ကြိမ်လုပ်ဆောင်ပြီး ရလဒ်များကို သိမ်းဆည်းနိုင်သည်။ ထို့ကြောင့်၊ ရှာဖွေမှုမေးမြန်းချက်ရှိ တဂ်များကို အခြေခံ၍ မေးမြန်းချက်နှင့်ဆက်စပ်သော ဆောင်းပါးများကို အမြန်ကောက်ယူနိုင်သည်။

  • တိကျသော အကြောင်းအရာ အကြံပြုချက်

    ခေတ်မီသော အပလီကေးရှင်းများစွာသည် ပိုမိုကောင်းမွန်အောင်ပြုလုပ်ပြီး စိတ်ကြိုက်သုံးစွဲသူအတွေ့အကြုံကို ပေးအပ်ရန် NER ကိရိယာများပေါ်တွင် မူတည်သည်။ ဥပမာအားဖြင့်၊ Netflix သည် သုံးစွဲသူများ၏ ရှာဖွေမှုနှင့် ကြည့်ရှုမှုမှတ်တမ်းအပေါ် အခြေခံ၍ ပုဂ္ဂိုလ်ရေးသီးသန့် အကြံပြုချက်များကို ပေးဆောင်သည်။

Entity Recognition လို့ အမည်ပေးထားတာက သင့်ကို စေတယ်။ စက်သင်ယူမှု မော်ဒယ်များသည် ပိုမိုထိရောက်ပြီး ယုံကြည်စိတ်ချရသည်။ သို့သော်၊ သင့်မော်ဒယ်များသည် ၎င်းတို့၏ အကောင်းဆုံးအဆင့်တွင် လုပ်ဆောင်ရန်နှင့် ရည်ရွယ်ထားသည့် ပန်းတိုင်များအောင်မြင်ရန် အရည်အသွေးပြည့်မီသော လေ့ကျင့်ရေးဒေတာအတွဲများ လိုအပ်ပါသည်။ သင်လိုအပ်သမျှသည် သင့်အား အသုံးပြုရန်အသင့်ဖြစ်နိုင်သော အရည်အသွေးဒေတာအစုံများကို ပံ့ပိုးပေးနိုင်သည့် အတွေ့အကြုံရှိသော ဝန်ဆောင်မှုပါတနာဖြစ်သည်။ ဒီလိုဆိုရင်၊ Shaip က မင်းရဲ့အကောင်းဆုံးအလောင်းအစားပါ။ သင်၏ AI မော်ဒယ်များအတွက် ထိရောက်ပြီး အဆင့်မြင့် ML ဖြေရှင်းချက်များအား ဖွံ့ဖြိုးတိုးတက်အောင် ကူညီရန်အတွက် ပြည့်စုံသော NER ဒေတာအတွဲများအတွက် ကျွန်ုပ်တို့ထံ ဆက်သွယ်ပါ။P

လူမှုဝေမျှမယ်

သငျသညျဒါ့အပြင်လိုနိုင်ပါစေ