ကွန်ပြူတာများသည် အရာဝတ္ထုများကို စတင်ကြည့်ရှုပြီး ၎င်းတို့ကို ဘာသာပြန်ဆိုကတည်းက ကမ္ဘာကြီးနှင့် မတူတော့ပါ။ သင့်မျက်နှာပေါ်ရှိ ရယ်စရာမုတ်ဆိတ်မွေးကိုထုတ်ပေးသည့် Snapchat စစ်ထုတ်မှုကဲ့သို့ ရိုးရှင်းနိုင်သည့် ဖျော်ဖြေရေးပစ္စည်းများမှ စကင်န်အစီရင်ခံချက်များမှ မိနစ်ပိုင်းအကျိတ်များရှိနေခြင်းကို အလိုအလျောက်သိရှိနိုင်သော ရှုပ်ထွေးသောစနစ်များအထိ၊ ကွန်ပျူတာအမြင်သည် လူသားတို့၏ ဆင့်ကဲဖြစ်စဉ်တွင် အဓိကအခန်းကဏ္ဍမှ ပါဝင်နေသည်။
သို့သော်၊ မလေ့ကျင့်ရသေးသော AI စနစ်အတွက်၊ ၎င်းတွင်ထည့်သွင်းထားသော အမြင်နမူနာ သို့မဟုတ် ဒေတာအတွဲသည် အဓိပ္ပါယ်မရှိပါ။ စည်ကားနေသော Wall Street ၏ရုပ်ပုံ သို့မဟုတ် ရေခဲမုန့်ပုံတစ်ပုံကို သင်ကျွေးနိုင်သည်၊ စနစ်နှစ်ခုလုံးသည် ဘာလဲဆိုတာ မသိနိုင်ပါ။ အဘယ်ကြောင့်ဆိုသော် ရုပ်ပုံများနှင့် ရုပ်ပုံဆိုင်ရာ အစိတ်အပိုင်းများကို ခွဲခြား၍ အပိုင်းပိုင်းခွဲနည်းကို မလေ့လာရသေးသောကြောင့် ဖြစ်သည်။
ယခု၊ ဤသည်မှာ အလွန်ရှုပ်ထွေးပြီး အချိန်ကုန်သော လုပ်ငန်းစဉ်ဖြစ်ပြီး အသေးစိတ်နှင့် လုပ်အားကို စေ့စေ့စပ်စပ် အာရုံစိုက်ရန် လိုအပ်ပါသည်။ ဤနေရာတွင် AI မော်ဒယ်များသည် အမြင်အာရုံဒေတာအစုံတွင် မတူညီသောဒြပ်စင်များကို အလွယ်တကူ လေ့လာနိုင်စေရန်အတွက် ဒေတာမှတ်ချက်ကျွမ်းကျင်သူများ ရောက်ရှိလာပြီး ပုံများပေါ်ရှိ အချက်အလက်များ၏ ဘိုက်တစ်ခုစီတိုင်းကို ကိုယ်တိုင်အမှတ်အသားပြုခြင်း သို့မဟုတ် တဂ်လုပ်ခြင်းဖြစ်သည်။ ကွန်ပြူတာတစ်လုံးသည် မှတ်စုပြုထားသော အချက်အလက်များကို လေ့ကျင့်ပေးသောအခါ၊ ၎င်းသည် မြို့ပြရှုခင်း၊ ငှက်တစ်ကောင်မှ တိရစ္ဆာန်၊ အဖျော်ယမကာနှင့် အစားအစာနှင့် အခြားရှုပ်ထွေးသော အမျိုးအစားခွဲခြားမှုကို အလွယ်တကူ ခွဲခြားနိုင်သည်။
ယခု ကျွန်ုပ်တို့ ဤအရာကို သိလာရသောအခါ ဒေတာမှတ်စုများသည် ပုံဒြပ်စင်များကို မည်ကဲ့သို့ အမျိုးအစားခွဲခြားပြီး တက်ဂ်လုပ်ကြသနည်း။ သူတို့သုံးတဲ့ သီးခြားနည်းပညာတွေ ရှိပါသလား။ ဟုတ်တယ်ဆိုရင် အဲဒါတွေက ဘာလဲ။
ကောင်းပြီ၊ ဒီပို့စ်က ဘာအကြောင်းတွေပါလိမ့်၊ ပုံမှတ်စု အမျိုးအစားများ၊ ၎င်းတို့၏ အားသာချက်များ၊ စိန်ခေါ်မှုများနှင့် အသုံးပြုမှုကိစ္စများ။
ပုံ မှတ်ချက် အမျိုးအစားများ
ကွန်ပြူတာအမြင်အတွက် ရုပ်ပုံမှတ်ချက်ရေးနည်းများကို အဓိက အမျိုးအစားငါးမျိုးဖြင့် ခွဲခြားနိုင်သည်။
- အရာဝတ္ထု ထောက်လှမ်းခြင်း။
- လိုင်းထောက်လှမ်းခြင်း။
- အထင်ကရ ထောက်လှမ်းခြင်း။
- segment
- ရုပ်ပုံအမျိုးအစားခွဲခြားခြင်း။
object ထောက်လှမ်းခြင်း
အမည်တွင်ဖော်ပြထားသည့်အတိုင်း၊ အရာဝတ္ထုရှာဖွေခြင်း၏ပန်းတိုင်မှာ ကွန်ပျူတာများနှင့် AI မော်ဒယ်များသည် ပုံများတွင် မတူညီသောအရာဝတ္ထုများကို ရှာဖွေဖော်ထုတ်နိုင်ရန် ကူညီပေးရန်ဖြစ်သည်။ မတူကွဲပြားသည့် အရာဝတ္ထုများကို သတ်မှတ်ရန်၊ ဒေတာမှတ်စုကျွမ်းကျင်သူများသည် ထင်ရှားသောနည်းစနစ်သုံးခုကို အသုံးပြုသည်-
- 2D ဘောင်များ- ပုံများရှိ အရာဝတ္တုများပေါ်တွင် ထောင့်မှန်စတုဂံပုံးများကို ရေးဆွဲပြီး တံဆိပ်တပ်ထားသည်။
- 3D ဘောင်များ- အရာဝတ္တုများ၏ အတိမ်အနက်ကို ထုတ်ဆောင်ရန် 3-ဖက်မြင်သေတ္တာများကို အရာဝတ္တုများပေါ်တွင် ရေးဆွဲထားသည်။
- ပိုလီဂွန်များ- အရာဝတ္တုတစ်ခု၏ အစွန်းများကို အမှတ်အသားပြုခြင်းဖြင့် ပုံသဏ္ဍာန်နှင့် ထူးခြားသော အရာဝတ္တုများကို တံဆိပ်တပ်ပြီး နောက်ဆုံးတွင် အရာဝတ္တု၏ ပုံသဏ္ဍာန်ကို ဖုံးအုပ်ရန် ၎င်းတို့ကို အတူတကွ ပေါင်းစည်းထားသည့်နေရာ။
အားသာချက်များ
- 2D နှင့် 3D ဘောင်ခတ်ထားသောသေတ္တာများနည်းပညာများသည် အလွန်ရိုးရှင်းပြီး အရာဝတ္ထုများကို အလွယ်တကူတံဆိပ်တပ်နိုင်သည်။
- 3D ဘောင်ခတ်ထားသောသေတ္တာများသည် 2D ဘောင်သွင်းသေတ္တာများနည်းပညာတွင် မပါရှိသော အရာဝတ္ထုတစ်ခု၏ တိမ်းညွှတ်မှုကဲ့သို့သော အသေးစိတ်အချက်အလက်များကို ပေးဆောင်ပါသည်။
Object Detection ၏အားနည်းချက်
- 2D နှင့် 3D ဘောင်ကွက်များ တွင် အမှန်တကယ် အရာဝတ္ထုတစ်ခု၏ မပါဝင်သည့် နောက်ခံ pixels များလည်း ပါဝင်သည်။ ဒါက လေ့ကျင့်မှုကို နည်းမျိုးစုံနဲ့ လှည့်စားတယ်။
- 3D ဘောင်ခတ်ထားသောသေတ္တာများနည်းစနစ်တွင်၊ မှတ်ချက်ပေးသူများသည် အရာဝတ္ထုတစ်ခု၏အတိမ်အနက်ကို အများအားဖြင့် ယူဆကြသည်။ ဒါက လေ့ကျင့်ရေးကိုလည်း သိသိသာသာ ထိခိုက်စေတယ်။
- အရာဝတ္ထုတစ်ခုသည် အလွန်ရှုပ်ထွေးပါက polygon နည်းပညာသည် အချိန်ကုန်နိုင်သည်။
လိုင်းထောက်လှမ်းခြင်း။
ဤနည်းပညာကို ပုံများတွင် မျဉ်းခွဲခြင်း၊ မှတ်စုမှတ်ခြင်း သို့မဟုတ် ခွဲခြားသတ်မှတ်ရန် အသုံးပြုသည်။ ဥပမာ- မြို့တွင်းလမ်းများ။
အားသာချက်များ
ဤနည်းပညာ၏ အဓိကအားသာချက်မှာ ဘုံဘောင်တစ်ခုမျှမပါဝင်သည့် pixels များကို ရှာဖွေတွေ့ရှိနိုင်ပြီး မှတ်သားထားနိုင်မည်ဖြစ်သည်။ ၎င်းသည် တိုတောင်းသော သို့မဟုတ် ပိတ်နေသော မျဉ်းကြောင်းများကို မှတ်သားရန် အကောင်းဆုံးဖြစ်သည်။
အားနည်းချက်များ
- လိုင်းများစွာရှိလျှင် လုပ်ငန်းစဉ်သည် အချိန်ပိုကုန်သည်။
- ထပ်နေသည့် လိုင်းများ သို့မဟုတ် အရာဝတ္ထုများသည် လွဲမှားသော အချက်အလက်နှင့် ရလဒ်များကို ပေးနိုင်ပါသည်။
အထင်ကရ ထောက်လှမ်းခြင်း။
ဒေတာမှတ်စုရှိ အထင်ကရနေရာများသည် အထူးစိတ်ဝင်စားဖွယ် သို့မဟုတ် အရေးပါသည့်နေရာများကို မဆိုလိုပါ။ ၎င်းတို့သည် အမှတ်အသားပြုရန် လိုအပ်သော ပုံတစ်ခုရှိ အထူး သို့မဟုတ် မရှိမဖြစ်အချက်များဖြစ်သည်။ ၎င်းသည် မျက်နှာအင်္ဂါရပ်များ၊ ဇီဝဗေဒဆိုင်ရာ တိုင်းတာမှုများ သို့မဟုတ် ထို့ထက်ပို၍ ဖြစ်နိုင်သည်။ ဒါကို pose estimation လို့လည်း ခေါ်တယ်။
အားသာချက်များ
မှတ်တိုင်အမှတ်များ၏ တိကျသော သြဒီနိတ်များ လိုအပ်သော အာရုံကြောကွန်ရက်များကို လေ့ကျင့်ရန် စံပြဖြစ်သည်။
အားနည်းချက်များ
မိနစ်တိုင်းတွင် မရှိမဖြစ်လိုအပ်သောအချက်ကို တိကျစွာမှတ်သားထားရသောကြောင့် ၎င်းသည် အလွန်အချိန်ကုန်ပါသည်။
segment
ပုံတစ်ပုံအား ကွဲပြားသောရှုထောင့်များကို ဖော်ထုတ်ရန်အတွက် အပိုင်းများစွာကို ခွဲခြားသတ်မှတ်ထားသည့် ရှုပ်ထွေးသောလုပ်ငန်းစဉ်တစ်ခု။ ၎င်းတွင် နယ်နိမိတ်များကို ထောက်လှမ်းခြင်း၊ အရာဝတ္ထုများကို ရှာဖွေခြင်းနှင့် အခြားအရာများ ပါဝင်သည်။ သင့်အား ပိုမိုကောင်းမွန်သော အကြံဥာဏ်တစ်ခုပေးရန်၊ ဤသည်မှာ ထင်ရှားသော ခွဲခြမ်းခြင်းနည်းပညာများစာရင်းဖြစ်သည်-
- ဝေါဟာရ ပိုင်းခြားခြင်း- ပုံတစ်ပုံရှိ pixel တစ်ခုစီတိုင်းကို အသေးစိတ်အချက်အလက်များဖြင့် မှတ်သားထားသည်။ ပတ်ဝန်းကျင်အခြေအနေ လိုအပ်သော မော်ဒယ်များအတွက် အရေးကြီးပါသည်။
- ဥပမာ အပိုင်းခွဲခြင်း- ပုံတစ်ပုံရှိ ဒြပ်စင်တစ်ခုစီ၏ သာဓကတစ်ခုစီတိုင်းကို အသေးစိတ်အချက်အလက်များအတွက် မှတ်ပုံတင်ထားသည်။
- Panoptic အပိုင်းခွဲခြင်း- semantic နှင့် instance segmentation မှအသေးစိတ်အချက်အလက်များကို ပုံများတွင် ထည့်သွင်းပြီး မှတ်သားထားသည့်နေရာတွင်။
အားသာချက်များ
- ဤနည်းပညာများသည် အရာဝတ္တုများမှ အကောင်းဆုံးအချက်အလက်များကို ထုတ်ပေးပါသည်။
- ၎င်းတို့သည် လေ့ကျင့်ရေးရည်ရွယ်ချက်များအတွက် အပိုအကြောင်းအရာနှင့် တန်ဖိုးများကို ပေါင်းထည့်ကာ နောက်ဆုံးတွင် ရလဒ်များကို အကောင်းဆုံးဖြစ်အောင် လုပ်ဆောင်သည်။
အားနည်းချက်များ
ဤနည်းပညာများသည် ပင်ပန်းခက်ခဲပြီး ပင်ပန်းလွန်းလှသည်။
Image ကိုအမျိုးအစားခွဲခြား
ရုပ်ပုံအမျိုးအစားခွဲခြားခြင်းတွင် အရာဝတ္ထုတစ်ခုရှိ ဒြပ်စင်များကို ခွဲခြားသတ်မှတ်ခြင်းနှင့် ၎င်းတို့ကို သီးခြားအရာဝတ္ထုအတန်းများအဖြစ် ခွဲခြားသတ်မှတ်ခြင်းတို့ပါဝင်သည်။ ဤနည်းပညာသည် object detection technique နှင့် အလွန်ကွာခြားပါသည်။ နောက်ပိုင်းတွင်၊ အရာဝတ္ထုများကိုသာ ခွဲခြားသတ်မှတ်သည်။ ဥပမာအားဖြင့်၊ ကြောင်ရုပ်ပုံတစ်ပုံကို တိရစ္ဆာန်အဖြစ် ရိုးရှင်းစွာမှတ်ယူနိုင်သည်။
သို့သော် ရုပ်ပုံအမျိုးအစားခွဲရာတွင် ရုပ်ပုံအား ကြောင်အဖြစ် ခွဲခြားထားသည်။ တိရိစ္ဆာန်မျိုးစုံပါရှိသော ရုပ်ပုံများအတွက် တိရစ္ဆာန်တိုင်းကို ရှာဖွေတွေ့ရှိပြီး အမျိုးအစားအလိုက် ခွဲခြားထားသည်။
အားသာချက်များ
- ဒေတာအတွဲများရှိ အရာဝတ္ထုများအကြောင်း စက်များကို ပိုမိုအသေးစိတ်ပေးသည်။
- မော်ဒယ်များကို တိရိစ္ဆာန်များ (ဥပမာ) သို့မဟုတ် မော်ဒယ်သီးသန့် ဒြပ်စင်များအကြား တိကျစွာ ခွဲခြားနိုင်ရန် ကူညီပေးသည်။
အားနည်းချက်များ
ရုပ်ပုံအစိတ်အပိုင်းအားလုံးကို ဂရုတစိုက်ခွဲခြားပြီး အမျိုးအစားခွဲရန် ဒေတာမှတ်ချက်ကျွမ်းကျင်သူများအတွက် အချိန်ပိုလိုအပ်သည်။
Computer Vision တွင် ပုံသဏ္ဌာန်မှတ်ချက်ရေးနည်းများကို Cases of Image Annotation နည်းပညာကို အသုံးပြုပါ။
ရုပ်ပုံမှတ်စုနည်းပညာ | မှုများကိုသုံးပါ |
---|---|
2D နှင့် 3D ဘောင်ကွက်များ | ကုန်ကျစရိတ်၊ စာရင်းအင်းနှင့် အခြားအရာများကို ခန့်မှန်းရန် စက်သင်ယူမှုစနစ်များအတွက် ထုတ်ကုန်များနှင့် ကုန်ပစ္စည်းများ၏ ပုံများကို မှတ်သားရန် အကောင်းဆုံးဖြစ်သည်။ |
အနားများ | ပုံသဏ္ဍာန်မမှန်သော အရာဝတ္ထုများနှင့် ပုံသဏ္ဍာန်များကို မှတ်သားနိုင်စွမ်းရှိသောကြောင့် X-Rays၊ CT scans နှင့် အခြားအရာများကဲ့သို့ ဒစ်ဂျစ်တယ်ပုံရိပ်ဖော်မှတ်တမ်းများတွင် လူသားအင်္ဂါများကို တဂ်ဂ်လုပ်ရန်အတွက် စံပြဖြစ်ပေသည်။ ယင်းအစီရင်ခံစာများမှ ကွဲလွဲချက်များနှင့် ပုံသဏ္ဍာန်များကို သိရှိရန် စနစ်များကို လေ့ကျင့်ရန် ၎င်းတို့ကို အသုံးပြုနိုင်သည်။ |
semantic အပိုင်း | ယာဉ်ရွေ့လျားမှုနှင့်ဆက်စပ်သည့် pixel တိုင်းကို တိကျစွာတဂ်လုပ်ထားနိုင်သည့် မောင်းသူမဲ့ကား၏နေရာများတွင် အသုံးပြုသည်။ တိရစ္ဆာန်များ၊ လမ်းသွားလမ်းလာများ၊ လမ်းအရာဝတ္ထုများ၊ လမ်းသွားများနှင့် အခြားအရာများကြားတွင် အာရုံခံကိရိယာများမှ ဒေတာများကို ရှာဖွေပြီး ခွဲခြားအသုံးပြုနိုင်သည့် ရုပ်ပုံအမျိုးအစားခွဲခြားခြင်းကို မောင်းသူမဲ့ကားများတွင် အသုံးပြုနိုင်သည်။ |
အထင်ကရ ထောက်လှမ်းခြင်း။ | လူသားတို့၏ စိတ်ခံစားမှုများကို ရှာဖွေလေ့လာရန်နှင့် မျက်နှာမှတ်သားမှုစနစ်များ ဖွံ့ဖြိုးတိုးတက်ရန်အတွက် အသုံးပြုသည်။ |
လိုင်းများနှင့် Splines | စက်ရုပ်များသည် အလိုအလျောက်လုပ်ဆောင်သည့် လုပ်ငန်းများကို လုပ်ဆောင်ရန်အတွက် နယ်နိမိတ်များကို သတ်မှတ်နိုင်သည့် ဂိုဒေါင်များနှင့် ကုန်ထုတ်လုပ်မှုယူနစ်များတွင် အသုံးဝင်သည်။ |
Up ကိုအရှေ့ဥရောပ, တောင်အာဖရိက
မြင်တဲ့အတိုင်းပဲ၊ ကွန်ပျူတာရူပါရုံကို အလွန်ရှုပ်ထွေးသည်။ ဂရုပြုရမယ့် ရှုပ်ထွေးမှုတွေ အများကြီးရှိတယ်။ ဤပုံသဏ္ဌာန်သည် တုန်လှုပ်ဖွယ်ကောင်းသော်လည်း၊ နောက်ထပ်စိန်ခေါ်မှုများတွင် အရည်အသွေးဒေတာ အချိန်မီရရှိနိုင်မှု၊ အမှားအယွင်းမရှိ၊ အချက်အလက်မှတ်စု လုပ်ငန်းစဉ်များ၊ အလုပ်အသွားအလာများ၊ မှတ်သားသူများ၏ ဘာသာရပ်ဆိုင်ရာ ကျွမ်းကျင်မှုနှင့် အခြားအရာများ။
ဒေတာမှတ်ချက်ပေးသောကုမ္ပဏီများသည်ထိုကဲ့သို့သောပြောကြသည်။ ship အရည်အသွေးပြည့်မီသော datasets များကို လိုအပ်သောကုမ္ပဏီများထံ ပေးပို့ရန် ကြီးမားသောအလုပ်တစ်ခု လုပ်ဆောင်နေပါသည်။ လာမည့်လများတွင် စက်သင်ယူမှုစနစ်များသည် ဒေတာအတွဲများကို အမှားအယွင်းမရှိ ၎င်းတို့ကိုယ်တိုင် တိကျစွာ မှတ်ကျောက်တင်နိုင်သည့် ဤနေရာ၌ ဆင့်ကဲဖြစ်စဉ်ကို ကျွန်ုပ်တို့ တွေ့မြင်နိုင်မည်ဖြစ်သည်။