Jump to content

د طبيعي ژبې پروسس کول

د ويکيپېډيا، وړیا پوهنغونډ له خوا

د طبیعي ژبې پروسس کول (انګلیسي: NLP) د کمپیوټر ساینس او ژبپوهنې ساحه ده چې د کمپیوټر او طبیعي ژبو ترمینځ متقابل عمل پورې اړه لري. [۱] [۲] [۳] کوم چې د مصنوعي ځيرکتيا د يوې برخې مالوماتي څانګه پورې اړه لري.

د کمپیوټري ژبپوهنې له ساحې څخه د طبیعي ژبې پروسس کولو د همغږۍ او انحراف په اړه بحث شتون لري. د کمپیوټري ژبپوهنې انجمن کمپیوټري ژبپوهنه داسې تعریف کړې چې د طبیعي ژبې پروسس کولو نظري اړخونو باندې تمرکز کوي. د طبیعي ژبې پروسس کولو لپاره عصري الګوریتمونه د ماشین زده کړې ، په ځانګړې توګه د احصایوي ماشین زده کړې پر بنسټ والړ دي. د احصایې ماشین زده کړې الګوریتمونو کې عصري څېړنه د ژبپوهنې ، کمپیوټر ساینس، او احصایې په ګډون د يو شمېر متفاوت برخو پوهېدو ته اړتيا لري.

د طبیعي متنونو تحلیل[سمول]

لومړني سیسټمونه لکه SHRDLU ، چې د کلمو په ځانګړي چاپیریال کې کار کاوه، خورا مؤثره کار کاوه، څیړونکي خورا خوشبیني ته الرښوونه وکړه چې ژر تر ژره له مینځه تللي کله چې سیسټمونه د انساني ژبو پیچلتیا او ابهام په حقیقت کې په واقعیت کې پلي شوي.

د طبیعي ژبې پوهه ځینې وختونه د بشپړ AI ستونزې په توګه ویل کیږي، ځکه چې د طبیعي ژبو پیژندل او درک کول د بهرنۍ نړۍ پراخه پوهه او د هغې د کنټرول وړتیا ته اړتیا لري. د "پوهې" مفهوم تعریف کول د طبیعي ژبې پروسس کې یو له اصلي ستونزو څخه دی.

د طبیعي ژبې د پوهیدو او تحلیل سیسټمونو سره د ځینو ستونزو یوه بیلګه:

  • جمله "موږ بيزوګانو ته کیله ځکه ورکړه چې دوی وږي وو" او جمله "مونږ بندرونو ته کیله ورکړه ځکه چې پخه شوې وه" ورته ګرامري جوړښت لري ، مګر ضمیر "ه" په لومړي کې د "ځکه" کلمه کې. بندر ته اشاره کوي، او په دویمه کې دا کیلې ته اشاره کوي: نو د جملې په سمه توګه پوهیدل د کیلې د ځانګړتیاوو او د بندرونو د چلند له پوهیدو پرته ممکن ندي.

د جلا جملو د پوهېدو لپاره د مصنوعي ځيرکتيا مفهوم[سمول]

د دې مرحلې پیل (شاوخوا 1970 AD) په کمپیوټر کې د یوې ټولې ژبې د نمایندګۍ احتمال کې د امید له لاسه ورکولو سره تړاو درلود ، او څیړونکو خپلې هڅې په ځانګړي ژبني جوړښتونو پورې محدودې کړې چې د سیمانټیک تحلیل ازموینو سره نږدې تړاو درلود. لومړي دوه پروګرامونه چې دا بدلون په ګوته کوي د وینګراډ لپاره شرډلو او د لرګیو لپاره قمري وو . دا مرحله په انفرادي جملو کې د پوهیدو هدف محدودولو سره هم مشخص کیږي پرته لدې چې دا جملې له بشپړ متن سره وصل کړي.

د بشپړ طبیعي ژبې پروسس کولو برنامه معمولا د الګوریتم په شکل تنظیم کیږي ، په کوم کې چې تخمونه د پروسس کولو لپاره معلومات څرګندوي ، او مستطیلونه فرعي برنامې لري چې د دې شکلونو ترمینځ اړین بدلونونه ترسره کوي.

څرنګه چې په دې اړه هیڅ عمومي موافقه شتون نلري چې داخلي نماینده ګي باید څه ولري یا د جملې معنی څه وي، د طبیعي ژبې پروسس په فرعي پروګرامونو ویشل په بشپړه توګه اختیاري دي، ځکه چې د تحلیل پروسه د تحلیل پروسې پای ته رسیدو دمخه پیل کیدی شي. برنامه په لازمي ډول انفرنشنل مرحلې لري.

هغه څه چې معمولا د یو پروګرام لپاره اړین وي چې طبیعي ژبه کاروي د ډیټابیس څخه د معلوماتو استخراج کول دي، مګر ممکن د مبهم پوښتنو تشریح کولو لپاره یو پرمختللی پروګرام وي، او څیړونکي لکه کولن او کیسر د تفسیر مفهوم غوره کوي. د داخلي نمایندګۍ په اړه د ژوروالي مختلف درجې

د طبیعي ژبې تحلیل کچه[سمول]

لکه څنګه چې د لیکلو متنونو لپاره، د دوی تحلیل د څو مرحلو څخه تیریږي چې د تحلیل میتود او د ژبې بډایتوب پورې اړه لري، د بیلګې په توګه ، د عربي ژبې پروسس کول تحلیل ته اړتیا لري چې ټولې درجې پکې شاملې وي. د تحلیل ترټولو عام کچه لاندې مرحلې تعقیبوي:

مورفولوژیکي تحلیل[سمول]

دا د کلمې تحلیل کوي ترڅو د هغې ریښه، د هغې مورفولوژیکي وزن او هغه څه چې د زیاتوالي، کمښت، تورونو، بدیل، یوځای کولو، یا انعطاف په شرایطو کې پیښ شوي، د دې سره تړلې سابقې او د هغو ډولونو په اړه پوهیدل. مخکینی، او هغه ضمیرونه یا ضمیمې چې دوی تعقیبوي، او د دې ضمیرونو او ضمیمو اجزا، او پخپله د کلمې ډول پیژني؛ یو اسم، فعل، حروف او نور مورفولوژیکي توضیحات چې د عربي کلمې هرې برخې پورې اړه لري.

ګرامري تحلیل[سمول]

دا هغه برخه ده چې د یو بل سره د کلمو اړیکې، د جملې جوړښت، او نور ګرامري معلومات پورې اړه لري، او دا په مورفولوژیکي مرحله پورې اړه لري.

سیمانټیک تحلیل[سمول]

دا هغه برخه ده چې د جملې په معنی پوهیدو پورې اړه لري په منطقي توګه په جمله کې د خبرو موضوع د ریښتینې نړۍ معلوماتو سره وصل کوي. [۴]

مثالونه[سمول]

د مورفولوژیکي تحلیل بېلګې[سمول]

کلمه: هغه وویل. دا څو مورفولوژیکي بڼې لري کله چې تحلیل شي، په لاندې ډول دي:

  1. هغه وويل: "هغه وويل" د تيرې زمانې فعل دى، له ريښې څخه: قل.
  2. ويې ويل: "هغه وويل" د تيرې زمانې فعل دى، له ريښې څخه: قل.
  3. هغه وویل: "هغه وویل" د درې اړخیز فعل څخه فعال برخه اخیستونکی دی: هغه وویل، له ریښې څخه: qā lī y.
  4. هغه وویل: "هغه وویل" د درې اړخیز فعل برخه ده: ووایه، له ریښې څخه: ql l.

د ګرامر پروګرامونو بیلګې[سمول]

د مصنوعي استخباراتو په تاریخ کې ترټولو مشهور برنامه شارډلو بلاسچیک دی چې په MIT کې د ټیری وینګراد لخوا رامینځته شوی. دا برنامه د یو روبوټ کار انډول کوي چې د مختلف شکلونو ډیری شیانو اداره کولو وړتیا لري ، لکه کیوبونه او پیرامایډونه چې په میز کې ایښودل شوي ، او دا کولی شي د یو شخص سره په طبیعي ژبه خبرې وکړي او د دې شیانو په اړه د هغه پوښتنو ته ځواب ووایی. وینوګراد په خپل پروګرام کې د هالیډې سیسټمیک ګرامر څخه اخیستل شوي ژبپوهنې قواعد شامل کړي، کوم چې د منطقي شبکو یو سیسټم دی چې د نحوي واحدونو ځانګړي ځانګړتیاوې څرګندوي، په ځانګړې توګه د فعلونو قضیې، د دوی دورې، او د دوی جوړښت (د پیژندل شوي او ناپېژندل شوي) ). ځینې سیمانټیک معنی د ژبپوهنې تحلیل په جریان کې کارول کیږي، کوم چې د جملې د ممکنه جوړښتونو شمیر کې کمښت المل کیږي په پرتله چې موږ یوازې د نحوي معیارونو پلي کول.

دلته د ریښتیني ShardLo ډیالوګ یوه بیلګه ده:

د پروګرام کارونکي: د شنو کیوبونو په سر کې څومره شیان دي؟

شارډلو: زه ډاډه نه یم چې تاسو د "سر پر سر" جمله کې "د شنو کیوبونو په سر" کې څه معنی لرئ. ایا ستاسو مطلب دا دی:

  1. په مستقیم ډول په سطحه
  2. د کیوبونو په سر کې هرچیرې.

د پروګرام کاروونکي: 2

شاردلو: درې شیان دي

د برنامه کارونکی: ایا تاسو مخکې له دې چې په کوچني مکعب کې شنه اهرام ځای په ځای کړئ کوم اهرام ته لاس ورکړی؟

شارډلو: هو، شنه کیوب.

د سافټویر کاروونکي: تاسو دا کله پورته کړی؟

شاردلو: کله چې زه سور بلاک، لوی سور بلاک او لوی شنه بلاک جوړوم.

د پروګرام کارونکی: ولې دې پورته کړ؟

شاردلو: ما دا پورته کړه چې له دې څخه ځان خلاص کړم.

دا ښیي چې شارډلو د دې توان درلود چې هغه ستونزې حل کړي چې حل یې هغه څه ته اشاره کوي چې مخکې یې یادونه شوې وه. لکه د اسم یا اسم جمله پیژندل چې ضمیر ورته اشاره کوي. برنامه دا هم ښیې چې هغه د خپل شاوخوا چاپیریال څخه خبر دی او پدې توګه د مختلف عملونو ترمینځ د اړیکو په اړه پوښتنو ته ځواب ویلو توان لري.

دا یو برنامه ده چې د طبیعي ژبې ډیټابیس سره د خبرو اترو لپاره د Augmented Transition Network (ATN) په نوم پیژندل شوي میتود کارولو باندې تکیه کوي. دا ډیټابیس د سپوږمۍ د ډبرو د نمونو په اړه معلومات لري چې د NASA د خلابازانو لخوا راټول شوي.

هغه پوښتنې چې برنامه ته لارښوونه کیږي په 3 مرحلو کې تحلیل کیږي:

  1. ساختماني تحلیل، د امکان په صورت کې د پارس کولو ونې یا څو ونې جوړول.
  2. د ونې یا بوټي سیمانټیک تحلیل، د پوښتنې داخلي نمایندګي جوړوي.
  3. غوښتنې ته ځواب ورکول د پوښتنې په داخلي نمایندګي کې شامل دي. پدې کې د پوښتل شوي معلوماتو لټون کول او په طبیعي ژبه د ځواب چمتو کول شامل دي.

په برنامه کې د ګرامر قواعدو سربیره شاوخوا 3,500 کلمې شاملې دي. د ژبپوهنې تحلیلي سافټویر کولی شي د ضمیرونو د اړیکو محدود پوهاوی وړاندې کړي هغه شیانو ته چې دوی ورته اشاره کوي، په بیله بیا په اصلي بند کې د اړونده بندونو په څیر ځای پرځای شوي ترتیبات.

Lunar د ټیکنالوژۍ له امله د طبیعي ژبې پروګرامونو په پراختیا کې خورا لوی اغیزه درلوده د Augmented Transition Network (ATN) په کارولو سره، کوم چې په تیرو لسو کلونو کې د طبیعي ژبې پروسس کولو کې ترټولو مشهور میتود ګرځیدلی.

د پوښتنو بیلګې چې په ګوته کیدی شي پدې کې شامل دي:

  1. په خورا الکلین ډبرو کې د المونیم اوسط غلظت څومره دی؟
  2. په څو نمونو کې فاسفورس پینټوکسایډ شتون لري؟

د سیمانټیک پروګرامونو بیلګې[سمول]

دا یو برنامه ده چې د طبیعي ژبې جملې د فکري همغږۍ په بڼه بدلوي. د برنامه اصلي برخه کولی شي په کې شاملې جملې تمثیل کړي یا د هغه فکري نړۍ په اړه توضیحات رامینځته کړي چې دا په دې نړۍ کې د ځانګړي شیانو یا د هغه خلکو انګیزې معاینه کولو سره رامینځته کوي چې پکې اوسیږي.

دلته د مارګي پارافراسینګ یوه بیلګه ده:

د ننوتلو جملې: جان مریم په غوسه کړ

پایلې:

  1. جان مریم د هغې په وهلو سره ووژله.
  2. یوحنا مریم غوټه کړه او هغه مړه شوه ځکه چې هغه تنفس نشو کولی.
  3. مریم مړه شوه ځکه چې هغې تنفس نه شو کولی، او هغه تنفس نه شو کولی ځکه چې جان د هغې غاړې ته واچوله.

دلته د مارګي رامینځته کولو مثال دی:

ابتدايي جمله: جان مریم ته اسپرین ورکړل

پایلې:

  1. جان فکر کاوه چې مریم یو اسپرین غواړي.
  2. مریم ښه احساس نه کاوه.
  3. مریم غوښتل ښه شي.
یوه بله تیوري هم شتون لري چې د مصنوعي ذهانت په برخه کې د څیړونکو تر مینځ لوی بریالیتوب لري، په ځانګړې توګه هغه څوک چې نحوي تحلیل د معنی استخراج د ستونزې لپاره جامع حل نه ګڼي، کوم چې د چارلس فیلمور لخوا د نحوي قضیو تیوري ده.

سکریپټ[سمول]

د مارګي برنامه یو لوی شمیر انګیرنې رامینځته کوي چې د پوښتنې وړ موادو له شرایطو څخه بهر راځي ، او په حقیقت کې دا خطر شتون لري چې یو ترکیبي چاودنه به د احتمالي شمیر محدودولو هڅه ناکامه کړي . دا ممکنه وه چې د متنونو یا سناریوګانو د مفکورې په کارولو سره د پرله پسې جملو سره اړیکه ونیسئ او محدودیتونه وضع کړئ لکه د علت اړیکو .

راجر شینک او رابرټ ابیلسن لومړی کس و چې د سناریو کارولو مفکوره یې وړاندې کړه، لنډیز دا دی چې سناریو د پیښو د کوډ شوي ترتیب څخه جوړه شوې ده چې ځینې عامه پیښې مشخصوي، لکه فلمونو ته تلل، رستورانت ته., یا د ویښتو ویښتو ته. دا مفهوم د مالین مینسکي لخوا د چوکاټ مفهوم ته خورا نږدې دی.

اصلي ټکی چې شینک او ابیلسن یې کوي دا دی چې د مختلف پیښو لپاره د سناریو پیژندل د هغه لارې د پوهیدو لپاره اړین شرط دی چې د هرې کیسې مختلف پیښې یو له بل سره تړلي دي. سناریو د مختلفو پیښو تر مینځ علتي اړیکې بیانوي، او دا کمپیوټر ته دا توان ورکوي چې پایلې ته ورسیږي، د هغه شیانو اټکل وکړي چې په ښکاره توګه ندي ویل شوي، او په کیسه کې خالي ځایونه ډک کړئ لکه څنګه چې یو انسان لوستونکی به ورته ویل کیږي، په شمول د امکان په شمول. تېروتنه

لاندې مثال د رستورانت سناریو يوه برخه ښيي عمومي چاپېريال ښيي پداسې حال کې چې پاتې یې یو شمیر کلیدي پیښې لري: د پیرودونکي ننوتل ، د خواړو انتخاب او ترتیب ، خواړه ، تادیه او روانیدل. د مختلفو شرایطو او شرایطو سره سم د خوړو غوره کولو او ترتیب کولو لپاره درې فرعي سناریوګانې شتون لري.

شتمنۍ: میزونه، مینو، لوښي، پیسې، بیلونه. . .

افراد: پیرودونکي، مېلمه پال، خزانه دار، مدیر، پخليوال. . .

د ننوتلو اړتیاوې:

  • پیرودونکي باید وږی وي
  • پیرودونکي باید پیسې ولري

پايله:

  • پیرودونکي د ننوتلو دمخه د هغه په پرتله لږ پیسې لري
  • پیرودونکی نور وږی نه دی
  • خوشحاله پیرودونکي (شاید)
  • د رستورانت مدیر ډیرې پیسې لري

د سکریپټ میکانیزم یوه بېلګه[سمول]

SAM په بیل پوهنتون کې د راجر شینک او د هغه د همکارانو لخوا د سکریپټ میکانیزم لپاره ولاړ دی. دا پروګرام کولی شي د داستان متن په لاندې ډول پوه او ولیکي:

"یو موټر د تیرې جمعې په ماښام د انټرسټیټ 6 څخه د اصلي خنډ سره ټکر وکړ. مسافر، فرانسیس ډارک د وارینګټن، په سمدستي توګه ووژل شو، لکه څنګه چې ډاکټر لویس پاستور لخوا ټاکل شوی و. چلوونکی، اندریو مارویل، د 59 منځنۍ سړک، لنکاسټر، د ژغورنې ډلې لخوا روغتون ته یوړل شو او دوه ورځې وروسته کور ته د تلو اجازه ورکړل شوه. هیڅ تورونه ندي راوړل شوي، او د پولیسو انسپکټر سیکسټن بلیک به د پیښې شرایط وڅیړي. »

کمپیوټر ته د دې متن په ننوتلو سره، پروګرام لاندې لنډیز وړاندې کړ: "څلور ورځې وړاندې، یو موټر په 6 روټ کې د اصلي خنډ سره ټکر شو، او فرانسس ډارک، د وارینګټن اوسیدونکی ووژل شو. چلوونکی، اندریو مارول، چې د لانکاسټر په ۵۹ مډل سټریټ کې اوسېدونکی هم ټپي شوی دی، پولیسو د چا په وړاندې کوم تور نه دی لګولی.»

هغه په هسپانوي کې د پروګرام لنډیز هم تولید کړ. هغه وتوانید چې د پیښې اړوند پوښتنې په لاندې ډول ځواب کړي:

  • ایا څوک وژل شوي؟

هو، فرانسیس ډارک ووژل شو

  • ایا څوک ټپي شوی وو؟

هو، انډریو مارول په سطحي ډول ټپي شوی و

  • انډریو مارول ولې ټپي شو؟

ځکه چې موټر له اصلي خنډ سره ټکر شو

  • ایا هغه انډریو مارول روغتون ته وړی؟

هو، هغه اندریو مارول روغتون ته یوړ

  • انډریو څنګه مارول روغتون ته یوړل؟

د ژغورنې ډلې مارول روغتون ته یوړل

د SAM برنامه د موټر حادثې سناریو د فرعي سناریو سره کاروي لکه د امبولانس سناریو ، کوم چې د دې پایلې رامینځته کولو کې مرسته کړې چې د انډریو مارویل زخم سطحي و ، یوه جمله چې په اصلي متن کې شتون نلري ، د ځینې لاملونو اړیکو رامینځته کولو سره ، په ځانګړي توګه د "ترمنځ" یو موټر له خنډ سره ټکر شوی او "چلونکی ټپي شوی دی." په دې کې شک نشته چې دا یوه څرګنده پایله ده.

دلته یو مهم ټکی دا دی چې برنامه نه یوازې د پیښې اړین عناصر استخراجوي ، بلکه مختلف جملې بدلوي بلکه په ساده ډول ورته جملې تکراروي لکه څنګه چې دوی په اصلي متن کې څرګند شوي. په حقیقت کې، SAM اصلي متن د ژبې له سطحي بڼې څخه خپلواک داخلي نمایش ته ژباړي، او د دې داخلي نمایندګۍ څخه په مختلفو طبیعي ژبو کې لنډیز رامینځته کوي. په هسپانوي کې لنډیز د دې مثال دی.

د طبیعي ژبې پروسس کولو اصلي لارښوونې[سمول]

  • بنسټیز یا ژبني نصاب
  • احصایوي چلند، د کارپس پر بنسټ، تیسورس، یا ژبني بلاګ
  • د ژبني او احصایوي تګلارو پر بنسټ مخلوط چلند

د طبیعي ژبې پروسس اصلي ساحې[سمول]

  • د فونیټیک په اړه زده کړه وکړئ
  • د وینا نمونو په اړه زده کړه
  • مورفولوژیکي تحلیل
  • ګرامري تحلیل
  • سیمانټیک تحلیل
  • د کلماسافټ لخوا Archived 2018-01-16 at the Wayback Machine. د متن طبقه بندي
  • په متنونو پوهیدل
  • اتوماتیک شکل ورکول
  • له متنونو څخه وینا جوړول
  • د متن نسل
  • د متنونو لیکل
  • د متنونو اتومات لوستل
  • د وینا پیژندنه
  • مورفولوژیکي معاینه
  • دقیق املا
  • د متن بیاکتنه
  • د ماشین ژباړه
  • پوه شئ او پوښتنې ځواب کړئ
  • د معلوماتو ترلاسه کول
  • لنډیز
  • اتوماتیک لنډیز
  • د متن کان کیندنه
  • د معلوماتو لټون
  • هوښیار تعلیمي سیسټمونه

بهرنۍ اړیکې[سمول]

سرچينې[سمول]

  1. Implementing an online help desk system based on conversational agent Authors: Alisa Kongthon, Chatchawal Sangkeettrakarn, Sarawoot Kongyoung and Choochart Haruechaiyasak. Published by ACM 2009 Article, Bibliometrics Data Bibliometrics. Published in: Proceeding, MEDES '09 Proceedings of the International Conference on Management of Emergent Digital EcoSystems, ACM New York, NY, USA. کينډۍ:ردمك, کينډۍ:دوي Archived 14 June 2018[Date mismatch] at the Wayback Machine.
  2. Implementing an online help desk system based on conversational agent Authors: Alisa Kongthon, Chatchawal Sangkeettrakarn, Sarawoot Kongyoung and Choochart Haruechaiyasak. Published by ACM 2009 Article, Bibliometrics Data Bibliometrics. Published in: Proceeding, MEDES '09 Proceedings of the International Conference on Management of Emergent Digital EcoSystems, ACM New York, NY, USA. کينډۍ:ردمك, کينډۍ:دوي Archived 14 June 2018[Date mismatch] at the Wayback Machine.
  3. "The history of machine translation in a nutshell". 2005. د اصلي آرشيف څخه پر ۱۴ جون ۲۰۱۸ باندې. لاسرسي‌نېټه ۲۳ سپټمبر ۲۰۲۳. منځګړی |CitationClass= له پامه غورځول شوی (لارښود)
  4. کينډۍ:استشهاد بدورية محكمة

تصنيف:بوابة اللغة/مقالات متعلقة تصنيف:بوابة تقانة المعلومات/مقالات متعلقة تصنيف:بوابة علم الحاسوب/مقالات متعلقة تصنيف:بوابة لسانيات/مقالات متعلقة تصنيف:جميع المقالات التي تستخدم شريط بوابات