خپلکارې پلان جوړونه او مهالوېش

د ويکيپېډيا، وړیا پوهنغونډ له خوا
د اسيمو روبوټ سینسرونه او ويښیار الګوریتمونه کاروي ترڅو د خنډونو مخه ونیسي او د زینو پورته حرکت وکړي.

اتوماتیک پلان جوړونه او مهالویش يا خپلکارې پلان جوړونه او مهالوېش ، کله ناکله د مصنوعي ځيرکتيا پالن کولو په نامه یادېږي، [۱] د مصنوعي ځيرکتيا یوه څانګه ده چې د ستراتیژیو یا د عملونو ترتیب په اړه اندیښنه لري، معمولا د هوښیار اجنټانو، خودمختاره روبوټونو او بې پیلوټه موټرو لخوا ترسره کیږي. د کلاسیک کنټرول او طبقه بندي ستونزو برعکس، حلونه پیچلي دي او باید په څو اړخیز ځای کې کشف او اصلاح شي. پلان جوړونه هم د پریکړي له تیوري سره تړاو لري.

په پېژندل شوي چاپیریال کې د شته موډلونو سره، پالن کول په آفلاین توګه ترسره کیدی شي. د پلي کیدو دمخه حل موندل کیدی شي او ارزول کیدی شي. په متحرک ډول نامعلوم چاپیریال کې، ستراتیژي ډیری وختونه آنلاین بیاکتنې ته اړتیا لري. د موډلونو او پالیسیو د تطبیق اړتیا سره. حلونه معمولا تکراري محاکمې او غلطی پروسې ته لاره هواروي چې په مصنوعي ځيرکتيا کې عام دي. پدې کې متحرک پروګرامونه ، د پیاوړتیا زده کړه او ګډ اصلاح شامل دي. هغه ژبې چې د پلان کولو او مهالویش تشریح کولو لپاره کارول کیږي اکثرا د سوداګرۍ ژبې په نوم یادیږي.

کتنه[سمول]

د نړۍ د ممکنه ابتدایي حالتونو توضیحاتو ته په پام سره، مطلوب اهداف، او د ممکنه کړنو د یوې ټولګې توضیحات، د پالن کولو ستونزه دا ده چې د یو فول پروف پلان راټولول (کله چې په کوم لومړني حالت کې پلي کیږي) د غوښتل شوي دولت رامینځته کولو لپاره اهداف (دې حالت ته د هدف حالت ويل کيږی).

د پالن کولو مشکل د کارول شوي ساده کولو انګیرنو پورې اړه لري. د پالن جوړونې ستونزې څو کټګورۍ په څو ابعادو کې د ستونزو ځانګړتیاو پورې اړه لري پیژندل کیدی شي.

  • ایا کړنې لازمي دي یا غیر تصادفي؟ د نامعلومو کړنو لپاره، ایا اړوند احتمال شتون لري؟
  • ایا د دولت متغیرونه جلا یا دوامداره دي؟ که دوی جلا وي، ایا دوی یوازې د ممکنه ارزښتونو محدود شمیر لري؟
  • ایا اوسنی حالت په ناڅرګند ډول لیدل کیدی شي؟ بشپړ مشاهده او جزوي مشاهده کیدی شي.
  • څو ابتدايي حالتونه شتون لري، ایا دوی محدود دي یا خپلسري؟
  • ایا پروسیجرونه موده لري؟
  • ایا په ورته وخت کې ډیری عملونه کیدی شي، یا په یو وخت کې یوازې یو ممکن دی؟
  • ایا د پلان هدف یو ټاکلی هدف حالت ته رسیدل ، یا د انعام فعالیت اعظمي کول دي؟
  • ایا یوازې یو استازی شتون لري یا څو اجنټان شتون لري؟ ایا اجنټان همکار یا خود غرضه دي؟ ایا دوی په جلا توګه خپل پلانونه جوړوي، یا پالنونه د ټولو استازو لپاره په مرکزي توګه جوړ شوي؟

د پلان جوړونې ترټولو ساده ممکنه ستونزه، چې د کلاسیک پلان جوړونې ستونزې په نوم پیژندل کیږي، په لاندې ډول تعریف شوي:

  • یو پیژندل شوی او ځانګړی لومړنی حالت
  • نه ختمیدونکې کړنلارې
  • ناگزیر اقدامات
  • کوم چې یو ځل اخیستل کیدی شي
  • او یو استازی
  • څرنګه چې ابتدايي حالت په ناڅرګنده توګه پیژندل شوی، او ټول ټاکونکي کړنې کولی شي د هرې کړنې وروسته د نړۍ حالت په سمه توګه اټکل کړي، د کتنې مسله د کلاسیک پلان سره هیڅ تړاو نلري.
  • سربیره پردې، پالنونه د عملونو د ترتیب په توګه تعریف کیدی شي، ځکه چې اړین عملونه تل دمخه پیژندل کیږي.
  • د اجنټ له کنټرول څخه بهر د نامعلومو کړنو یا نورو پیښو سره، احتمالي اعدامونه یوه ونه جوړوي، او پالن جوړونکي باید د ونې د هر نوډ لپاره مناسب اقدامات مشخص کړي.
  • د مارکوف پریکړې پروسې (MDP) د ستونزو سره پلان کوي:
  • نه ختمیدونکې کړنلارې
  • بې ځایه فعلونه د احتمالاتو سره، بشپړ مشاهده
  • ناگزیر اقدامات،
  • د انعام فعالیت اعظمي کړئ
  • او یو استازی

کله چې بشپړ مشاهده د جزوي مشاهدې په ځای بدله شي، پلان جوړونه د یوې برخې د لید وړ پریکړې کولو پروسې (POMDP) سره مطابقت لري.

که چیرې له یو څخه ډیر اجنټ شتون ولري، موږ د څو اجنټ پالن جوړونه لرو، کوم چې د لوبې تیوري سره نږدې تړاو لري.

د خپلواکې ساحې پلان جوړونه[سمول]

د AI پلان جوړونې کې، پالن جوړونکي عموما د ډومین ماډل داخلوي (د ممکنه کړنو یوه ټولګه چې د ډومین استازیتوب کوي) او همدارنګه ځانګړې ستونزه چې د وضعیت او ابتدايي هدف لخوا حل کیږي، د هغو کسانو په مقابل کې چې هیڅ داخل نه وي. د ډومین تعریف. دا پلان جوړونکي د "ډومین خپلواک" په نوم یادیږي ترڅو پدې حقیقت ټینګار وکړي چې دوی کولی شي د ډیری ډومینونو څخه د پلان کولو ستونزې حل کړي. په عادي مثالونو کې د بلاک سټیکینګ، لوژستیک، د کاري فلو مدیریت، او د روبوټ کاري پالن کول شامل دي. پدې توګه یو واحد ډومین - خپلواک پلانر په دې ټولو مختلف ډومینونو کې د پلان کولو ستونزې حل کولو لپاره کارول کیدی شي. د لارې ډیاګرام، له بلې خوا، د ډومین ځانګړي ډیاګرام ځانګړی دی

د ډومین ماډلینګ ژبې پلان کول[سمول]

هغه ژبې چې معمولا د پلان کولو ډومینونو استازیتوب کولو لپاره کارول کیږي او ځانګړي پلان جوړونې ستونزې لکه STRIPS او PDDL د کلاسیک پلان کولو لپاره ، د مثال متغیرونو پراساس دي. د نړۍ هر ممکنه دولت د دولت متغیرونو ته د ارزښتونو ټاکلو هدف لري، او عملونه مشخص کوي چې د دولت متغیر ارزښتونه څنګه بدلیږي کله چې دا عمل ترسره شي. څرنګه چې د دولت متغیراتو سیټ د دولت ځای رامینځته کوي چې په سیټ کې خورا لوی اندازه لري ، پلان جوړونه لکه د ډیری نورو کمپیوټري ستونزو په څیر ، د ابعاد او ګډې چاودنې له لعنت سره مخ کیږي.

د پالن جوړونې د ستونزو د بیانولو لپاره یوه بدیل ژبه د هراړخیز کاري شبکو څخه ده، چیرې چې د دندو یوه ټولګه ورکول کیږي، هره دنده یا د ابتدايي کړنالرې په واسطه پلي کیدی شي یا د نورو دندو په یوه ټولګه کې تخریب کیدی شي. پدې کې اړین ندي چې دولتي متغیرونه شامل کړي، که څه هم په ډیرو واقعیتي غوښتنلیکونو کې دولتي متغیرونه د کاري شبکو تشریح ساده کوي.

د پلان کولو الګوریتم[سمول]

کلاسیک ترتیب[سمول]

  • ترتیب کول په فضا کې د فضا حالت مخ په وړاندې کوي، شاید د پرمختللي اټکل سره
  • شاته ترتیبي لټون، شاید د دولتي محدودیتونو په کارولو سره وده ومومي (STRIPS، Graphplan وګورئ)
  • جزوی ترتیب

د نورو ستونزو کمول[سمول]

  • د سټپلان ستونزې کمول.
  • د موډل چک کول کمول - دواړه په اصل کې د دولتي ځای ټرانسل ستونزې دي، او د کلاسیک ترتیب ستونزه د ماډل چک کولو ستونزو فرعي کلاس سره مطابقت لري.

د وخت پلان[سمول]

د وخت پلان کول د کلاسیک پلان کولو په څیر حل کیدی شي. اصلي توپیر دا دی چې ډیری لنډمهاله ځړول شوي عملونه په یو وخت کې ترسره کیدی شي، او د دولت تعریف باید د اوسني مطلق وخت او د هر فعال عمل اجرا کولو پرمختګ په اړه معلومات شامل کړي. برسېره پردې، د منطقي یا حقیقي وخت سره پالن کولو کې، د دولت ځای ممکن لامحدود وي، د کلاسیک پلان کولو یا د بشپړ وخت سره پالن کولو برعکس. د وخت پلان کول د مهال ویش له ستونزو سره نږدې تړاو لري. د وخت پلان کول د اتوماتیک وخت په شرایطو هم پوهیدل کیدی شي.

احتمالي پلان جوړونه[سمول]

احتمالي نقشه کول د تکراري میتودونو لخوا حل کیدی شي لکه د ارزښت تکرار او د پالیسۍ تکرار ، کله چې د دولت ځای کافي وي. د جزوي مشاهدې سره، احتمالي نقشه په ورته ډول د تکراري میتودونو لخوا حل کیږي، مګر د ریاستونو پر ځای د باور ځای د محدود ارزښت دندو نمایندګي کاروي.

د غوره توب پر بنسټ پلان جوړونه[سمول]

د غوره توب پر بنسټ پالن جوړونه کې، هدف نه یوازې دا دی چې یو پالن جوړ کړي، بلکې د کارونکي لخوا ټاکل شوي غوره توبونه هم پوره کړي. د ډیر عام انعام پر بنسټ پالن کولو کې توپیرونه شتون لري، د بیلګې په توګه هغه چې د MDPs سره مطابقت لري. غوره توبونه اړین ندي چې دقیق شمیري ارزښت ولري.

مشروط پلان[سمول]

مشخص پلان جوړونه د STRIPS پلان جوړونې سیسټم سره معرفي شوه، کوم چې یو درجه بندي سکیم دی. د عمل نومونه په ترتیب سره تنظیم شوي، او دا د روبوټ لپاره یو پلان دی. درجه بندي پلان کول د اتوماتیک تولید شوي چلند ونې سره پرتله کیدی شي. [۲] نیمګړتیا دا ده چې د عادي چلند ونې د کمپیوټر برنامو په څیر څرګند ندي. دا پدې مانا ده چې د چلند ګراف یادښت د طرزالعمل حکمونه لري، مګر لوپس یا که بیا بیانات ندي. په هرصورت، مشروط نقشه کول د خطر څخه تیریږي او د کنټرول جریان ته ورته مفصل یادښت چمتو کوي، د نورو مشهور پروګرامینګ ژبو لکه پاسکال څخه. دا د برنامه ترکیب سره خورا ورته دی ، پدې معنی چې سکیم د سرچینې کوډ رامینځته کوي چې د تالیف کونکي لخوا اجرا کیدی شي.

د مشروط چارټ لومړنی مثال "Warplan-C" دی چې د 1970 لسیزې په مینځ کې معرفي شوی. د نورمال ترتیب او یو پیچلي پلان تر مینځ توپیر څه دی چې "که بیا" بیانونه لري؟ دا د ناڅرګندتیا سره راځي کله چې د پلان کار کوي. نظر دا دی چې پلان کولی شي د سینسر سیګنالونو ته عکس العمل وکړي چې پلان کونکي ته نامعلوم وي. پلان جوړونکی دوه اختیارونه دمخه چمتو کوي. د مثال په توګه، که هدف کشف شي، عمل A ترسره کیږي، که هدف ورک وي، عمل B ترسره کیږي. د مشروط پلان کولو اصلي ګټه د جزوي پلانونو اداره کولو وړتیا ده. بیا اجنټ اړ نه دی چې هر څه له پیل څخه تر پایه پلان کړي، مګر کولی شي ستونزه په برخو ویشي. دا د قضیې ځای کمولو کې مرسته کوي او ډیرې پیچلې ستونزې حل کوي.

بېړنۍ پلان جوړونه[سمول]

موږ د "اضطراري پلان کولو" په اړه خبرې کوو کله چې چاپیریال د سینسرونو له لارې کشف کیدی شي ، کوم چې غلط کیدی شي. نو دا یوه قضیه ده چیرې چې د پلان جوړونکي اجنټ د نامکمل معلوماتو لاندې عمل کوي. د اضطراري پلان جوړونې ستونزې لپاره، پالن نور د عملونو ترتیب نه دی بلکې د پریکړې ونې دی ځکه چې د پلان هر ګام د یو واحد بشپړ لید وړ حالت په پرتله د دولتونو سیټ لخوا نمایش کیږي، لکه څنګه چې په کلاسیک پلان کې. غوره شوي کړنې د سیسټم په حالت پورې اړه لري. د مثال په توګه، که باران وي، استازی ممکن د چترۍ اخیستل غوره کړي، او که باران نه وي، هغه ممکن دا غوره نه کړي.

مایکل ایل ویټمن په 1998 کې وښودله چې د شاخ کولو پروسیجرونو سره د پلان کولو ستونزه EXPTIME - بشپړیږي. د نژدي نقشه کولو یوه ځانګړې قضیه د FOND ستونزو لخوا نمایش کیږي - "په بشپړ ډول د لیدو وړ او غیر متمرکز". که هدف په LTLf کې مشخص شوی وي (لینیر وخت منطق په Finite Trace کې)، ستونزه تل EXPTIME او 2 EXPTIME بشپړوي که هدف د LDLf په کارولو سره مشخص شوی وي.

د ترتیب سره سم[سمول]

رسمی نقشه کول هغه وخت دی چې یو اجنټ د سیسټم حالت څخه ډاډه نه وي، او هیڅ مشاهده نشي کولی. اجنټ بیا د ریښتینې نړۍ په اړه عقیدې لري، مګر نشي کولی د سینس کولو کړنو سره تصدیق کړي، د بیلګې په توګه. دا ستونزې د کلاسیک پلان جوړونې په څیر تخنیکونو سره حل کیږي، [۳] مګر چیرې چې د دندې ځای د اوسني حالت په اړه د ناڅرګندتیا له امله د ستونزې اندازې سره متناسب وي.

بیا د اړونده پالن جوړونې ستونزې لپاره حل شتون لري، کوم چې د عملونو ترتیب دی. حسلم او جانسن ثابته کړې چې د منظم پلان کولو ستونزه د EXPSPACE - بشپړه ده، [۴] او 2EXPTIME - بشپړه ده کله چې ابتدايي وضعیت ناڅرګنده وي، او د سوداګرۍ پایلو کې هیڅ غیر متمرکز حالت شتون نلري.

د پلان جوړونې سیسټمونو پلي کول[سمول]

دا هم وګوره[سمول]

لیستونه[سمول]

  • نوي راڅرګند شوي تخنیکي تخنیکونه

سرچينې[سمول]

  1. کينډۍ:استشهاد
  2. کينډۍ:استشهاد بدورية محكمة
  3. . doi:10.1613/jair.2708. الوسيط |CitationClass= تم تجاهله (مساعدة); Cite journal requires |journal= (مساعدة); مفقود أو فارغ |title= (مساعدة)
  4. . doi:10.1007/10720246_24. د کتاب نړيواله کره شمېره 9783540446576. الوسيط |CitationClass= تم تجاهله (مساعدة); Cite journal requires |journal= (مساعدة); مفقود أو فارغ |title= (مساعدة)

بهرنۍ اړیکې[سمول]