د طبيعي ژبې پروسس کول
د طبیعي ژبې پروسس کول (انګلیسي: NLP) د کمپیوټر ساینس او ژبپوهنې ساحه ده چې د کمپیوټر او طبیعي ژبو ترمینځ متقابل عمل پورې اړه لري. [۱] [۲] [۳] کوم چې د مصنوعي ځيرکتيا د يوې برخې مالوماتي څانګه پورې اړه لري. د کمپیوټري ژبپوهنې له ساحې څخه د طبیعي ژبې پروسس کولو د همغږۍ او انحراف په اړه بحث شتون لري. د کمپیوټري ژبپوهنې انجمن کمپیوټري ژبپوهنه داسې تعریف کړې چې د طبیعي ژبې پروسس کولو نظري اړخونو باندې تمرکز کوي. د طبیعي ژبې پروسس کولو لپاره عصري الګوریتمونه د ماشین زده کړې ، په ځانګړې توګه د احصایوي ماشین زده کړې پر بنسټ والړ دي. د احصایې ماشین زده کړې الګوریتمونو کې عصري څېړنه د ژبپوهنې ، کمپیوټر ساینس، او احصایې په ګډون د يو شمېر متفاوت برخو پوهېدو ته اړتيا لري. د طبیعي متنونو تحلیل[سمول]لومړني سیسټمونه لکه SHRDLU ، چې د کلمو په ځانګړي چاپیریال کې کار کاوه، خورا مؤثره کار کاوه، څیړونکي خورا خوشبیني ته الرښوونه وکړه چې ژر تر ژره له مینځه تللي کله چې سیسټمونه د انساني ژبو پیچلتیا او ابهام په حقیقت کې په واقعیت کې پلي شوي. د طبیعي ژبې پوهه ځینې وختونه د بشپړ AI ستونزې په توګه ویل کیږي، ځکه چې د طبیعي ژبو پیژندل او درک کول د بهرنۍ نړۍ پراخه پوهه او د هغې د کنټرول وړتیا ته اړتیا لري. د "پوهې" مفهوم تعریف کول د طبیعي ژبې پروسس کې یو له اصلي ستونزو څخه دی. د طبیعي ژبې د پوهیدو او تحلیل سیسټمونو سره د ځینو ستونزو یوه بیلګه:
د جلا جملو د پوهېدو لپاره د مصنوعي ځيرکتيا مفهوم[سمول]د دې مرحلې پیل (شاوخوا 1970 AD) په کمپیوټر کې د یوې ټولې ژبې د نمایندګۍ احتمال کې د امید له لاسه ورکولو سره تړاو درلود ، او څیړونکو خپلې هڅې په ځانګړي ژبني جوړښتونو پورې محدودې کړې چې د سیمانټیک تحلیل ازموینو سره نږدې تړاو درلود. لومړي دوه پروګرامونه چې دا بدلون په ګوته کوي د وینګراډ لپاره شرډلو او د لرګیو لپاره قمري وو . دا مرحله په انفرادي جملو کې د پوهیدو هدف محدودولو سره هم مشخص کیږي پرته لدې چې دا جملې له بشپړ متن سره وصل کړي. د بشپړ طبیعي ژبې پروسس کولو برنامه معمولا د الګوریتم په شکل تنظیم کیږي ، په کوم کې چې تخمونه د پروسس کولو لپاره معلومات څرګندوي ، او مستطیلونه فرعي برنامې لري چې د دې شکلونو ترمینځ اړین بدلونونه ترسره کوي. څرنګه چې په دې اړه هیڅ عمومي موافقه شتون نلري چې داخلي نماینده ګي باید څه ولري یا د جملې معنی څه وي، د طبیعي ژبې پروسس په فرعي پروګرامونو ویشل په بشپړه توګه اختیاري دي، ځکه چې د تحلیل پروسه د تحلیل پروسې پای ته رسیدو دمخه پیل کیدی شي. برنامه په لازمي ډول انفرنشنل مرحلې لري. هغه څه چې معمولا د یو پروګرام لپاره اړین وي چې طبیعي ژبه کاروي د ډیټابیس څخه د معلوماتو استخراج کول دي، مګر ممکن د مبهم پوښتنو تشریح کولو لپاره یو پرمختللی پروګرام وي، او څیړونکي لکه کولن او کیسر د تفسیر مفهوم غوره کوي. د داخلي نمایندګۍ په اړه د ژوروالي مختلف درجې د طبیعي ژبې تحلیل کچه[سمول]لکه څنګه چې د لیکلو متنونو لپاره، د دوی تحلیل د څو مرحلو څخه تیریږي چې د تحلیل میتود او د ژبې بډایتوب پورې اړه لري، د بیلګې په توګه ، د عربي ژبې پروسس کول تحلیل ته اړتیا لري چې ټولې درجې پکې شاملې وي. د تحلیل ترټولو عام کچه لاندې مرحلې تعقیبوي: مورفولوژیکي تحلیل[سمول]دا د کلمې تحلیل کوي ترڅو د هغې ریښه، د هغې مورفولوژیکي وزن او هغه څه چې د زیاتوالي، کمښت، تورونو، بدیل، یوځای کولو، یا انعطاف په شرایطو کې پیښ شوي، د دې سره تړلې سابقې او د هغو ډولونو په اړه پوهیدل. مخکینی، او هغه ضمیرونه یا ضمیمې چې دوی تعقیبوي، او د دې ضمیرونو او ضمیمو اجزا، او پخپله د کلمې ډول پیژني؛ یو اسم، فعل، حروف او نور مورفولوژیکي توضیحات چې د عربي کلمې هرې برخې پورې اړه لري. ګرامري تحلیل[سمول]دا هغه برخه ده چې د یو بل سره د کلمو اړیکې، د جملې جوړښت، او نور ګرامري معلومات پورې اړه لري، او دا په مورفولوژیکي مرحله پورې اړه لري. سیمانټیک تحلیل[سمول]دا هغه برخه ده چې د جملې په معنی پوهیدو پورې اړه لري په منطقي توګه په جمله کې د خبرو موضوع د ریښتینې نړۍ معلوماتو سره وصل کوي. [۴] مثالونه[سمول]د مورفولوژیکي تحلیل بېلګې[سمول]کلمه: هغه وویل. دا څو مورفولوژیکي بڼې لري کله چې تحلیل شي، په لاندې ډول دي:
د ګرامر پروګرامونو بیلګې[سمول]د مصنوعي استخباراتو په تاریخ کې ترټولو مشهور برنامه شارډلو بلاسچیک دی چې په MIT کې د ټیری وینګراد لخوا رامینځته شوی. دا برنامه د یو روبوټ کار انډول کوي چې د مختلف شکلونو ډیری شیانو اداره کولو وړتیا لري ، لکه کیوبونه او پیرامایډونه چې په میز کې ایښودل شوي ، او دا کولی شي د یو شخص سره په طبیعي ژبه خبرې وکړي او د دې شیانو په اړه د هغه پوښتنو ته ځواب ووایی. وینوګراد په خپل پروګرام کې د هالیډې سیسټمیک ګرامر څخه اخیستل شوي ژبپوهنې قواعد شامل کړي، کوم چې د منطقي شبکو یو سیسټم دی چې د نحوي واحدونو ځانګړي ځانګړتیاوې څرګندوي، په ځانګړې توګه د فعلونو قضیې، د دوی دورې، او د دوی جوړښت (د پیژندل شوي او ناپېژندل شوي) ). ځینې سیمانټیک معنی د ژبپوهنې تحلیل په جریان کې کارول کیږي، کوم چې د جملې د ممکنه جوړښتونو شمیر کې کمښت المل کیږي په پرتله چې موږ یوازې د نحوي معیارونو پلي کول. دلته د ریښتیني ShardLo ډیالوګ یوه بیلګه ده:د پروګرام کارونکي: د شنو کیوبونو په سر کې څومره شیان دي؟ شارډلو: زه ډاډه نه یم چې تاسو د "سر پر سر" جمله کې "د شنو کیوبونو په سر" کې څه معنی لرئ. ایا ستاسو مطلب دا دی:
د پروګرام کاروونکي: 2 شاردلو: درې شیان دي د برنامه کارونکی: ایا تاسو مخکې له دې چې په کوچني مکعب کې شنه اهرام ځای په ځای کړئ کوم اهرام ته لاس ورکړی؟ شارډلو: هو، شنه کیوب. د سافټویر کاروونکي: تاسو دا کله پورته کړی؟ شاردلو: کله چې زه سور بلاک، لوی سور بلاک او لوی شنه بلاک جوړوم. د پروګرام کارونکی: ولې دې پورته کړ؟ شاردلو: ما دا پورته کړه چې له دې څخه ځان خلاص کړم.
دا یو برنامه ده چې د طبیعي ژبې ډیټابیس سره د خبرو اترو لپاره د Augmented Transition Network (ATN) په نوم پیژندل شوي میتود کارولو باندې تکیه کوي. دا ډیټابیس د سپوږمۍ د ډبرو د نمونو په اړه معلومات لري چې د NASA د خلابازانو لخوا راټول شوي. هغه پوښتنې چې برنامه ته لارښوونه کیږي په 3 مرحلو کې تحلیل کیږي:
په برنامه کې د ګرامر قواعدو سربیره شاوخوا 3,500 کلمې شاملې دي. د ژبپوهنې تحلیلي سافټویر کولی شي د ضمیرونو د اړیکو محدود پوهاوی وړاندې کړي هغه شیانو ته چې دوی ورته اشاره کوي، په بیله بیا په اصلي بند کې د اړونده بندونو په څیر ځای پرځای شوي ترتیبات. Lunar د ټیکنالوژۍ له امله د طبیعي ژبې پروګرامونو په پراختیا کې خورا لوی اغیزه درلوده د Augmented Transition Network (ATN) په کارولو سره، کوم چې په تیرو لسو کلونو کې د طبیعي ژبې پروسس کولو کې ترټولو مشهور میتود ګرځیدلی. د پوښتنو بیلګې چې په ګوته کیدی شي پدې کې شامل دي:
د سیمانټیک پروګرامونو بیلګې[سمول]
دا یو برنامه ده چې د طبیعي ژبې جملې د فکري همغږۍ په بڼه بدلوي. د برنامه اصلي برخه کولی شي په کې شاملې جملې تمثیل کړي یا د هغه فکري نړۍ په اړه توضیحات رامینځته کړي چې دا په دې نړۍ کې د ځانګړي شیانو یا د هغه خلکو انګیزې معاینه کولو سره رامینځته کوي چې پکې اوسیږي. دلته د مارګي پارافراسینګ یوه بیلګه ده:د ننوتلو جملې: جان مریم په غوسه کړ پایلې:
دلته د مارګي رامینځته کولو مثال دی: ابتدايي جمله: جان مریم ته اسپرین ورکړل پایلې:
سکریپټ[سمول]د مارګي برنامه یو لوی شمیر انګیرنې رامینځته کوي چې د پوښتنې وړ موادو له شرایطو څخه بهر راځي ، او په حقیقت کې دا خطر شتون لري چې یو ترکیبي چاودنه به د احتمالي شمیر محدودولو هڅه ناکامه کړي . دا ممکنه وه چې د متنونو یا سناریوګانو د مفکورې په کارولو سره د پرله پسې جملو سره اړیکه ونیسئ او محدودیتونه وضع کړئ لکه د علت اړیکو . راجر شینک او رابرټ ابیلسن لومړی کس و چې د سناریو کارولو مفکوره یې وړاندې کړه، لنډیز دا دی چې سناریو د پیښو د کوډ شوي ترتیب څخه جوړه شوې ده چې ځینې عامه پیښې مشخصوي، لکه فلمونو ته تلل، رستورانت ته., یا د ویښتو ویښتو ته. دا مفهوم د مالین مینسکي لخوا د چوکاټ مفهوم ته خورا نږدې دی. اصلي ټکی چې شینک او ابیلسن یې کوي دا دی چې د مختلف پیښو لپاره د سناریو پیژندل د هغه لارې د پوهیدو لپاره اړین شرط دی چې د هرې کیسې مختلف پیښې یو له بل سره تړلي دي. سناریو د مختلفو پیښو تر مینځ علتي اړیکې بیانوي، او دا کمپیوټر ته دا توان ورکوي چې پایلې ته ورسیږي، د هغه شیانو اټکل وکړي چې په ښکاره توګه ندي ویل شوي، او په کیسه کې خالي ځایونه ډک کړئ لکه څنګه چې یو انسان لوستونکی به ورته ویل کیږي، په شمول د امکان په شمول. تېروتنه لاندې مثال د رستورانت سناریو يوه برخه ښيي عمومي چاپېريال ښيي پداسې حال کې چې پاتې یې یو شمیر کلیدي پیښې لري: د پیرودونکي ننوتل ، د خواړو انتخاب او ترتیب ، خواړه ، تادیه او روانیدل. د مختلفو شرایطو او شرایطو سره سم د خوړو غوره کولو او ترتیب کولو لپاره درې فرعي سناریوګانې شتون لري. شتمنۍ: میزونه، مینو، لوښي، پیسې، بیلونه. . . افراد: پیرودونکي، مېلمه پال، خزانه دار، مدیر، پخليوال. . . د ننوتلو اړتیاوې:
پايله:
د سکریپټ میکانیزم یوه بېلګه[سمول]SAM په بیل پوهنتون کې د راجر شینک او د هغه د همکارانو لخوا د سکریپټ میکانیزم لپاره ولاړ دی. دا پروګرام کولی شي د داستان متن په لاندې ډول پوه او ولیکي: "یو موټر د تیرې جمعې په ماښام د انټرسټیټ 6 څخه د اصلي خنډ سره ټکر وکړ. مسافر، فرانسیس ډارک د وارینګټن، په سمدستي توګه ووژل شو، لکه څنګه چې ډاکټر لویس پاستور لخوا ټاکل شوی و. چلوونکی، اندریو مارویل، د 59 منځنۍ سړک، لنکاسټر، د ژغورنې ډلې لخوا روغتون ته یوړل شو او دوه ورځې وروسته کور ته د تلو اجازه ورکړل شوه. هیڅ تورونه ندي راوړل شوي، او د پولیسو انسپکټر سیکسټن بلیک به د پیښې شرایط وڅیړي. » کمپیوټر ته د دې متن په ننوتلو سره، پروګرام لاندې لنډیز وړاندې کړ: "څلور ورځې وړاندې، یو موټر په 6 روټ کې د اصلي خنډ سره ټکر شو، او فرانسس ډارک، د وارینګټن اوسیدونکی ووژل شو. چلوونکی، اندریو مارول، چې د لانکاسټر په ۵۹ مډل سټریټ کې اوسېدونکی هم ټپي شوی دی، پولیسو د چا په وړاندې کوم تور نه دی لګولی.» هغه په هسپانوي کې د پروګرام لنډیز هم تولید کړ. هغه وتوانید چې د پیښې اړوند پوښتنې په لاندې ډول ځواب کړي:
هو، فرانسیس ډارک ووژل شو
هو، انډریو مارول په سطحي ډول ټپي شوی و
ځکه چې موټر له اصلي خنډ سره ټکر شو
هو، هغه اندریو مارول روغتون ته یوړ
د ژغورنې ډلې مارول روغتون ته یوړل د SAM برنامه د موټر حادثې سناریو د فرعي سناریو سره کاروي لکه د امبولانس سناریو ، کوم چې د دې پایلې رامینځته کولو کې مرسته کړې چې د انډریو مارویل زخم سطحي و ، یوه جمله چې په اصلي متن کې شتون نلري ، د ځینې لاملونو اړیکو رامینځته کولو سره ، په ځانګړي توګه د "ترمنځ" یو موټر له خنډ سره ټکر شوی او "چلونکی ټپي شوی دی." په دې کې شک نشته چې دا یوه څرګنده پایله ده. دلته یو مهم ټکی دا دی چې برنامه نه یوازې د پیښې اړین عناصر استخراجوي ، بلکه مختلف جملې بدلوي بلکه په ساده ډول ورته جملې تکراروي لکه څنګه چې دوی په اصلي متن کې څرګند شوي. په حقیقت کې، SAM اصلي متن د ژبې له سطحي بڼې څخه خپلواک داخلي نمایش ته ژباړي، او د دې داخلي نمایندګۍ څخه په مختلفو طبیعي ژبو کې لنډیز رامینځته کوي. په هسپانوي کې لنډیز د دې مثال دی. د طبیعي ژبې پروسس کولو اصلي لارښوونې[سمول]
د طبیعي ژبې پروسس اصلي ساحې[سمول]
بهرنۍ اړیکې[سمول]
سرچينې[سمول]
تصنيف:بوابة اللغة/مقالات متعلقة تصنيف:بوابة تقانة المعلومات/مقالات متعلقة تصنيف:بوابة علم الحاسوب/مقالات متعلقة تصنيف:بوابة لسانيات/مقالات متعلقة تصنيف:جميع المقالات التي تستخدم شريط بوابات |