ကွန်ပျူတာ Vision ၏

22+ ကွန်ပြူတာအမြင်အတွက် အရှာအများဆုံး ပွင့်လင်းအရင်းအမြစ်ဒေတာအတွဲများ

AI အယ်လဂိုရီသမ်တစ်ခုသည် သင်ကျွေးသည့်ဒေတာအတိုင်းသာ ကောင်းမွန်ပါသည်။

၎င်းသည် ရဲရင့်ခြင်းလည်းမဟုတ် သမားရိုးကျမဟုတ်သော ထုတ်ပြန်ချက်တစ်ခုလည်း မဟုတ်ပေ။ AI သည် လွန်ခဲ့သောဆယ်စုနှစ်အနည်းငယ်က အတော်လေးကို ဝေးကွာသွားပုံရနိုင်သော်လည်း Artificial Intelligence နှင့် Machine Learning သည် ထိုအချိန်မှစ၍ အလွန်ဝေးကွာလာခဲ့သည်။

Computer ကိုရူပါရုံကို ကွန်ပျူတာများသည် အညွှန်းများနှင့် ပုံများကို နားလည်ပြီး ဘာသာပြန်ရန် ကူညီပေးသည်။ သင့်ကွန်ပြူတာသည် မှန်ကန်သောရုပ်ပုံများကို အသုံးပြု၍ လေ့ကျင့်ပေးသောအခါတွင် အမျိုးမျိုးသော မျက်နှာအသွင်အပြင်များကို သိရှိနိုင်ခြင်း၊ နားလည်ခြင်းနှင့် ခွဲခြားသတ်မှတ်ခြင်း၊ ရောဂါများကို သိရှိနိုင်ခြင်း၊ အလိုအလျောက်မောင်းနှင်သည့် ယာဉ်များကို မောင်းနှင်ခြင်းနှင့် ဘက်ပေါင်းစုံမှ ကိုယ်တွင်းအင်္ဂါများကို စကင်န်ဖတ်ခြင်းဖြင့်လည်း အသက်များကို ကယ်တင်နိုင်မည်ဖြစ်သည်။

Computer Vision Market ကို ရောက်နိုင်မယ်လို့ ခန့်မှန်းထားပါတယ်။ $ 144.46 ဘီလီယံ 2028 ခုနှစ်တွင် အနည်းငယ်မျှသာသော $7.04 Billion မှ 2020 တွင် CAGR 45.64% နှင့် 2021 နှင့် 2028 ကြားတွင် ကြီးထွားလာသည်။

ကွန်ပြူတာ အမြင်အာရုံအတွက် အချို့သော ကိစ္စရပ်များမှာ-

  • ဆေးဘက်ဆိုင်ရာပုံရိပ်
  • ကိုယ်ပိုင်အုပ်ချုပ်ခွင့်ရယာဉ်
  • မျက်နှာနှင့် အရာဝတ္တုများကို မှတ်မိခြင်း။
  • ချို့ယွင်းချက် ဖော်ထုတ်ခြင်း။
  • မြင်ကွင်းရှာဖွေတွေ့ရှိမှု

အဆိုပါ ပုံဒေတာအတွဲ သင်သည် သင်၏ Machine Learning နှင့် ကွန်ပြူတာ အမြင်အာရုံများကို ကျွေးမွေး လေ့ကျင့်ပေးခြင်းသည် သင်၏ AI ပရောဂျက်၏ အောင်မြင်မှုအတွက် အရေးကြီးပါသည်။ အရည်အသွေးပြည့်မီသော ဒေတာအတွဲတစ်ခုရရှိရန် အလွန်ခက်ခဲသည်။ သင့်ပရောဂျက်၏ ရှုပ်ထွေးမှုအပေါ်မူတည်၍ ကွန်ပျူတာအမြင်ရည်ရွယ်ချက်အတွက် ယုံကြည်စိတ်ချရပြီး သက်ဆိုင်ရာဒေတာအတွဲများရရှိရန် ရက်အနည်းငယ်မှ ရက်သတ္တပတ်အနည်းငယ်အတွင်း မည်သည့်နေရာတွင်မဆို ကြာနိုင်သည်။

ဤတွင်၊ သင်ချက်ချင်းအသုံးပြုနိုင်သည့် open-source datasets ၏ အပိုင်းအခြားတစ်ခု (သင့်အတွက် အမျိုးအစားခွဲထားသည်) သင့်အား ပေးထားပါသည်။

Computer Vision Datasets အစုံအလင်စာရင်း

အထွေထွေ:

  1. IMAGEnet (လင့်ခ်)

    ImageNet သည် အသုံးများသော dataset တစ်ခုဖြစ်ပြီး အမျိုးအစား 1.2 ဖြင့် အမျိုးအစားခွဲထားသော အံ့အားသင့်စရာကောင်းသော ပုံပေါင်း 1000 သန်း ပါဝင်ပါသည်။ ဤဒေတာအတွဲကို WorldNet အထက်တန်းအဆင့်အတိုင်း ဖွဲ့စည်းထားပြီး လေ့ကျင့်ရေးဒေတာ၊ ရုပ်ပုံအညွှန်းများနှင့် တရားဝင်ဒေတာကို အပိုင်းသုံးပိုင်းခွဲခြားထားသည်။

  2. Kinetics 700 (လင့်ခ်)

    Kinetics 700 သည် မတူညီသော လူ့လုပ်ဆောင်မှု အတန်းအစား 650,000 ၏ အပိုင်းပေါင်း 700 ကျော်ပါရှိသော အရည်အသွေးမြင့် ဒေတာအစုံဖြစ်သည်။ အတန်းလုပ်ဆောင်ချက်တစ်ခုစီတွင် ဗီဒီယိုအပိုင်း ၇၀၀ ခန့်ရှိသည်။ ဒေတာအတွဲရှိ ကလစ်များသည် လူ-အရာဝတ္တုနှင့် လူ-လူအပြန်အလှန် တုံ့ပြန်မှုများပါရှိသည်၊ ၎င်းသည် ဗီဒီယိုများတွင် လူ့လုပ်ရပ်များကို အသိအမှတ်ပြုသည့်အခါ အတော်လေး အထောက်အကူဖြစ်ကြောင်း သက်သေပြပါသည်။

  3. CIFAR-10 (လင့်ခ်)

    CIFAR 10 သည် 60000 32 x 32 ရောင်စုံရုပ်ပုံများ ပါဝင်သည့် အတန်းအစား ဆယ်ခုကို ကိုယ်စားပြုသည့် အကြီးဆုံးသော ကွန်ပျူတာအမြင် ဒေတာအတွဲများထဲမှ တစ်ခုဖြစ်သည်။ အတန်းတစ်ခုစီတွင် ကွန်ပြူတာအမြင်အာရုံဆိုင်ရာ အယ်လဂိုရီသမ်များနှင့် စက်သင်ယူမှုကို လေ့ကျင့်ရန် အသုံးပြုသည့် ပုံပေါင်း 6000 ခန့်ရှိသည်။

မျက်နှာအသိအမှတ်ပြုမှု-

facial အသိအမှတ်ပြုမှု

  1. တောရိုင်းထဲတွင် တံဆိပ်တပ်ထားသော မျက်နှာများ (လင့်ခ်)

    တံဆိပ်တပ်ထားသည့် Faced in the Wild သည် အင်တာနက်မှ ရှာဖွေတွေ့ရှိသူ 13,230 နီးပါး၏ ရုပ်ပုံပေါင်း 5,750 ကျော်ပါရှိသော ကြီးမားသောဒေတာအတွဲတစ်ခုဖြစ်သည်။ ဤမျက်နှာများ၏ ဒေတာအတွဲသည် အတားအဆီးမရှိသော မျက်နှာကို သိရှိခြင်းအား ပိုမိုလွယ်ကူစွာ လေ့လာနိုင်ရန် ဒီဇိုင်းထုတ်ထားပါသည်။

  2. CASIA WebFace (လင့်ခ်)

    CASIA Web face သည် အတားအဆီးမဲ့ မျက်နှာမှတ်မိခြင်းအတွက် စက်သင်ယူမှုနှင့် သိပ္ပံနည်းကျ သုတေသနပြုရန် ကူညီပေးသည့် ကောင်းစွာဒီဇိုင်းဆွဲထားသော ဒေတာအတွဲတစ်ခုဖြစ်သည်။ အစစ်အမှန် 494,000 နီးပါးရှိသော ရုပ်ပုံပေါင်း 10,000 ကျော်ဖြင့်၊ ၎င်းသည် မျက်နှာခွဲခြားခြင်းနှင့် အတည်ပြုခြင်းလုပ်ငန်းများအတွက် အကောင်းဆုံးဖြစ်သည်။

  3. UMD Faces ဒေတာအတွဲ (လင့်ခ်)

    UMD သည် အပိုင်းနှစ်ပိုင်းပါသည့် အပိုင်းနှစ်ပိုင်းပါသည့် ကောင်းစွာမှတ်စုထားသော ဒေတာအတွဲကို ရင်ဆိုင်နေရသည်။ ဒေတာအတွဲတွင် မျက်နှာမှတ်စာများ 367,800 ကျော်နှင့် အကြောင်းအရာများ၏ မှတ်သားထားသည့် ဗီဒီယိုဘောင် 3.7 သန်းရှိသည်။

လက်ရေးအသိအမှတ်ပြုမှု-

  1. MNIST ဒေတာဘေ့စ် (လင့်ခ်)

    MNIST သည် 0 မှ 9 အထိ လက်ရေးဂဏန်းနမူနာများပါရှိသော ဒေတာဘေ့စ်တစ်ခုဖြစ်ပြီး ၎င်းတွင် လေ့ကျင့်ရေးနှင့် စမ်းသပ်ပုံ 60,000 နှင့် 10,000 ပါရှိသည်။ 1999 ခုနှစ်တွင် ထုတ်ဝေခဲ့သော MNIST သည် Deep Learning တွင် ရုပ်ပုံလုပ်ဆောင်ခြင်းစနစ်များကို စမ်းသပ်ရန် ပိုမိုလွယ်ကူစေသည်။

  2. ဇာတ်ကောင်အတု ဒေတာအတွဲ (လင့်ခ်)

    Artificial Characters Dataset သည် စာလုံးကြီး ဆယ်လုံးဖြင့် အင်္ဂလိပ်ဘာသာစကား တည်ဆောက်ပုံကို ဖော်ပြသည့် အတုအယောင် ထုတ်ပေးသည့် ဒေတာဖြစ်သည်။ ပုံပေါင်း 6000 ကျော်ပါရှိပါတယ်။

ယနေ့သင်၏ AI သင်တန်းအချက်အလက်လိုအပ်ချက်ကိုဆွေးနွေးကြပါစို့။

အရာဝတ္ထုထောက်လှမ်းခြင်း

  1. MS COCO (လင့်ခ်)

    MS COCO သို့မဟုတ် Context ရှိ ဘုံအရာဝတ္တုများသည် အရာဝတ္တုများကို ရှာဖွေခြင်းနှင့် စာတန်းထိုးခြင်း ဒေတာအတွဲတစ်ခုဖြစ်သည်။

    ၎င်းတွင် keypoint detection၊ multi-object detection၊ captioning နှင့် segmentation mask မှတ်ချက်များပါရှိသော ပုံ 328,000 ကျော်ပါရှိသည်။ ၎င်းတွင် အရာဝတ္ထုအမျိုးအစား 80 နှင့် တစ်ပုံလျှင် စာတန်းငါးခုပါရှိသည်။

  2. LSUN(လင့်ခ်)

    ကြီးမားသောရှုခင်းနားလည်မှု၏အတိုကောက်ဖြစ်သော LSUN တွင် အရာဝတ္ထု 20 နှင့် မြင်ကွင်းအမျိုးအစား 10 ခုတွင် အညွှန်းတပ်ထားသော ပုံတစ်သန်းကျော်ရှိသည်။ အချို့သောအမျိုးအစားများတွင် ပုံ 300,000 နီးပါးရှိပြီး တရားဝင်အတည်ပြုရန်အတွက် ပုံ 300 နှင့် စမ်းသပ်ဒေတာအတွက် ပုံ 1000 ပါရှိသည်။

  3. မူလအရာဝတ္ထုများ(လင့်ခ်)

    Home Objects ဒေတာအတွဲတွင် အိမ်တစ်ဝိုက်မှ ကျပန်းအရာဝတ္ထုများ - မီးဖိုချောင်၊ ဧည့်ခန်းနှင့် ရေချိုးခန်းများ တွင် အမှတ်အသားပြုထားသော ပုံများ ပါရှိသည်။ ဤဒေတာအတွဲတွင် အမှတ်အသားပြုထားသော ဗီဒီယိုအနည်းငယ်နှင့် စမ်းသပ်ရန်အတွက် ဒီဇိုင်းထုတ်ထားသည့် မှတ်ချက်မဲ့ဓာတ်ပုံ 398 ပုံလည်း ပါရှိပါသည်။

မော်တော်ကား:

  1. Cityscape ဒေတာအတွဲ (လင့်ခ်)

    Cityscape သည် များစွာသော ကိုးကားချက်များ၏ လမ်းမြင်ကွင်းများမှ မှတ်တမ်းတင်ထားသော ဗီဒီယိုအစီအစဥ်များကို ရှာဖွေသည့်အခါ သွားရမည့် ဒေတာအစုံဖြစ်သည်။ ဤပုံများကို အချိန်အကြာကြီး ရိုက်ကူးထားပြီး မတူညီသော ရာသီဥတုနှင့် အလင်းရောင် အခြေအနေများတွင် ရိုက်ကူးထားသည်။ မှတ်ချက်များသည် မတူညီသောအမျိုးအစား ရှစ်မျိုးဖြင့် ပိုင်းခြားထားသော ရုပ်ပုံအမျိုးအစား 30 အတွက်ဖြစ်သည်။

  2. Barkley Deep Drive (လင့်ခ်)

    Barkley DeepDrive သည် ကိုယ်ပိုင်အုပ်ချုပ်ခွင့်ရယာဉ်လေ့ကျင့်မှုအတွက် အထူးဒီဇိုင်းထုတ်ထားပြီး ၎င်းတွင် မှတ်ပုံတင်ထားသော ဗီဒီယို အပိုင်းပေါင်း 100 ကျော်ရှိသည်။ ၎င်းသည် ပြောင်းလဲနေသော လမ်းနှင့် မောင်းနှင်မှုအခြေအနေများကြောင့် အလိုအလျောက်မောင်းနှင်နိုင်သော ယာဉ်များအတွက် အထောက်အကူအရှိဆုံး လေ့ကျင့်ရေးဒေတာတစ်ခုဖြစ်သည်။

  3. ကြာပီ (လင့်ခ်)

    Mapillary တွင် စက်သင်ယူမှုနှင့် AI အယ်လဂိုရီသမ်များတွင် အမြင်အာရုံဆိုင်ရာ ပုံစံများကို လေ့ကျင့်သင်ကြားရာတွင် အလွန်အသုံးဝင်သည့် ကမ္ဘာတစ်ဝှမ်းရှိ လမ်းမြင်ကွင်းများနှင့် ယာဉ်အမှတ်အသားပေါင်း သန်း 750 ကျော်ရှိသည်။ ၎င်းသည် သင့်အား အလင်းရောင်နှင့် ရာသီဥတုအခြေအနေများနှင့် ရှုထောင့်အမျိုးမျိုးကို ဖြည့်ဆည်းပေးသည့် ကိုယ်ပိုင်အုပ်ချုပ်ခွင့်ရယာဉ်များကို တီထွင်နိုင်စေမည်ဖြစ်သည်။

ဆေးဘက်ဆိုင်ရာပုံရိပ်-

  1. Covid-19 ဖွင့်ထားသော သုတေသနဒေတာအတွဲ (လင့်ခ်)

    ဤမူရင်းဒေတာအတွဲတွင် AP/PA ရင်ဘတ်ဓာတ်မှန်ရိုက်ခြင်းနှင့်ပတ်သက်၍ 6500 pixel-polygonal အဆုတ်အပိုင်းများ ရှိသည်။ ထို့အပြင်၊ အမည်၊ တည်နေရာ၊ ဝင်ခွင့်အသေးစိတ်၊ ရလဒ်နှင့် အခြားအရာများပါရှိသော တဂ်များပါရှိသော Covid-517 လူနာဓာတ်မှန်ရိုက်ခြင်း၏ ပုံ 19 ပုံကို ရနိုင်သည်။

  2. 100,000 ရင်ဘတ်ဓာတ်မှန်များ NIH ဒေတာဘေ့စ် (လင့်ခ်)

    NIH ဒေတာဘေ့စ်သည် ရင်ဘတ်ဓာတ်မှန်ရိုက်သည့်ပုံ 100,000 နှင့် သိပ္ပံပညာနှင့် သုတေသနအသိုင်းအဝိုင်းအတွက် အသုံးဝင်သော အချက်အလက် XNUMX ပါဝင်သော အကျယ်ပြန့်ဆုံးသော အများသူငှာရရှိနိုင်သော ဒေတာအတွဲများထဲမှ တစ်ခုဖြစ်သည်။ အဆင့်မြင့် အဆုတ်အခြေအနေရှိ လူနာများ၏ ပုံများပင် ပါရှိသည်။

  3. ဒစ်ဂျစ်တယ်ရောဂါဗေဒ၏ Atlas (လင့်ခ်)

    ဒစ်ဂျစ်တယ်ရောဂါဗေဒ၏ Atlas သည် မတူညီသောအင်္ဂါအစိတ်အပိုင်းများ၏ မှတ်သားထားသောဆလိုက် ၁၀၀ နီးပါးမှ စုစုပေါင်း 17,000 ကျော်၊ histopathological patch ပုံများစွာကို ပေးစွမ်းသည်။ ဤဒေတာအတွဲသည် ကွန်ပြူတာအမြင်နှင့် ပုံစံအသိအမှတ်ပြုဆော့ဖ်ဝဲကို တီထွင်ရာတွင် အသုံးဝင်သည်။

မြင်ကွင်း အသိအမှတ်ပြုမှု-

မြင်ကွင်းကို မှတ်မိသည်။

  1. မိုးလုံလေလုံမြင်ကွင်းအသိအမှတ်ပြုမှု (လင့်ခ်)

    Indoor Scene Recognition သည် စက်သင်ယူမှုနှင့် ဒေတာလေ့ကျင့်မှုတွင် အသုံးပြုရန် အရာဝတ္ထုများနှင့် အိမ်တွင်းရှုခင်း 15620 ပုံများနီးပါး အမျိုးအစားခွဲထားသော ဒေတာအစုတစ်ခုဖြစ်သည်။ အမျိုးအစား 65 ကျော်ပါရှိပြီး အမျိုးအစားတစ်ခုစီတွင် အနည်းဆုံး ပုံ 100 ရှိသည်။

  2. xView (လင့်ခ်)

    အများသူငှာရရှိနိုင်သည့် အကောင်းဆုံးဒေတာအတွဲများထဲမှ တစ်ခုအနေဖြင့်၊ xView သည် ရှုပ်ထွေးပြီး ကြီးမားသော မြင်ကွင်းအမျိုးမျိုးမှ မှတ်သားထားသော ပုံရိပ်များစွာပါရှိသည်။ အတန်းပေါင်း 60 ခန့်နှင့် အရာဝတ္ထုပေါင်း တစ်သန်းကျော်ရှိခြင်း၊ ဤဒေတာအတွဲ၏ ရည်ရွယ်ချက်မှာ ဂြိုလ်တုဓာတ်ပုံများကို အသုံးပြု၍ ပိုမိုကောင်းမွန်သော သဘာဝဘေးအန္တရာယ်ဆိုင်ရာ ကယ်ဆယ်ရေးလုပ်ငန်းများကို ပံ့ပိုးပေးရန်ဖြစ်သည်။

  3. သောနေရာများ (လင့်ခ်)

    MIT မှပံ့ပိုးပေးထားသည့် ဒေတာအစုံဖြစ်သော Places တွင် မတူညီသော မြင်ကွင်းအမျိုးအစား 1.8 ခုမှ ပုံပေါင်း 365 သန်းကျော်ရှိသည်။ အတည်ပြုရန်အတွက် ဤအမျိုးအစားတစ်ခုစီတွင် ပုံ 50 ခန့်ရှိပြီး စမ်းသပ်ရန်အတွက် ပုံ 900 ခန့်ရှိသည်။ မြင်ကွင်းမှတ်သားခြင်း သို့မဟုတ် အမြင်အာရုံမှတ်သားခြင်းဆိုင်ရာ လုပ်ဆောင်ချက်များကို တည်ထောင်ရန် နက်နဲသော မြင်ကွင်းအင်္ဂါရပ်များကို လေ့လာခြင်းသည် ဖြစ်နိုင်သည်။

Entertainment က:

  1. IMDB WIKI ဒေတာအတွဲ (လင့်ခ်)

    IMDB – Wiki သည် အသက်၊ ကျား၊ မ၊ အမည်များဖြင့် လုံလောက်စွာ တံဆိပ်တပ်ထားသော မျက်နှာများ၏ ရေပန်းအစားဆုံး အများသူငှာ ဒေတာဘေ့စ်များထဲမှ တစ်ခုဖြစ်သည်။ ၎င်းတွင် နာမည်ကြီးများ၏ မျက်နှာပေါင်း ၂၀,ဝဝဝ ခန့်နှင့် Wikipedia မှ ၆၂,ဝဝဝ ခန့်တို့ ပါဝင်သည်။

  2. Celeb မျက်နှာများ (လင့်ခ်)

    Celeb Faces သည် ကျော်ကြားသူများ၏ အမှတ်အသားပြုပုံ 200,000 ပါရှိသည့် အကြီးစားဒေတာဘေ့စ်တစ်ခုဖြစ်သည်။ ပုံများသည် နောက်ခံဆူညံသံများ နှင့် ကွဲပြားမှုများ ပါ၀င်သည် ၊ ၎င်းတို့သည် ကွန်ပြူတာအမြင် အလုပ်များ တွင် လေ့ကျင့်ရေး စမ်းသပ်မှု အစုံ အတွက် အဖိုးတန် စေသည်။ မျက်နှာမှတ်သားမှု၊ တည်းဖြတ်မှု၊ မျက်နှာပိုင်း အစိတ်အပိုင်းကို ဒေသအလိုက်သတ်မှတ်ခြင်းနှင့် အခြားအရာများတွင် ပိုမိုတိကျမှုရရှိစေရန်အတွက် ၎င်းသည် အလွန်အကျိုးရှိသည်။

ယခု သင့်တွင် သင်၏ ဉာဏ်ရည်တုစက်များကို လောင်စာဆီထည့်ရန် open-source image dataset များစာရင်းကြီးတစ်ခုရှိသည်။ သင်၏ AI နှင့် စက်သင်ယူမှုမော်ဒယ်များ၏ ရလဒ်သည် သင်ကျွေးမွေးပြီး လေ့ကျင့်ပေးထားသည့် ဒေတာအတွဲများ၏ အရည်အသွေးပေါ်တွင် အဓိကမူတည်ပါသည်။ သင်၏ AI မော်ဒယ်လ်သည် တိကျသော ခန့်မှန်းချက်များကို ထုတ်ပယ်လိုပါက၊ ပေါင်းစည်းထားသော၊ တဂ်ထားကာ ပြီးပြည့်စုံအောင် တံဆိပ်တပ်ထားသော အရည်အသွေးဒေတာအတွဲများ လိုအပ်ပါသည်။ သင့်ကွန်ပြူတာအမြင်စနစ်၏အောင်မြင်မှုကို ချဲ့ထွင်ရန်၊ သင့်ပရောဂျက်အမြင်နှင့် သက်ဆိုင်သည့် အရည်အသွေးရှိသော ရုပ်ပုံဒေတာဘေ့စ်များကို အသုံးပြုရပါမည်။ အကယ်၍ သင်သည်ထိုကဲ့သို့သောဒေတာအတွဲများကိုပိုမိုရှာဖွေနေပါက ဤနေရာကိုကလစ်နှိပ်ပါ

လူမှုဝေမျှမယ်

သငျသညျဒါ့အပြင်လိုနိုင်ပါစေ