یونیکوډ [۱] ()کې د نړۍ په ډیرو ژبو کې د متن کوډ کولو او ښودلو او پروسس کولو یو کرکټر دی [۲] . هره ژبه د یونیکوډ بڼه لري.
دا معیار د کرکټرونو د نړیوال سیټ سره په همغږۍ کې تالیف شوی او د یونیکوډ سټنډرډ په نوم د کتاب په بڼه خپور شوی. د دې معیار په وروستي نسخه کې له 110,000 څخه ډیر حروف او 100 سمبولونه شامل دي، د بصری حوالې لپاره د کوډ ډیاګرامونو سیټ، د کوډ کولو میتودونه او د کرکټر کوډ کولو معیارونو سیټ، د کریکټ ملکیتونو شمیرل لکه لوی او کوچني توري، د کمپیوټر ډیټا سیټ. د فایل حوالې او یو شمیر اړوند توکي لکه د کرکټر توضیحات، یونیکوډ برابري ، رینډرینګ، ترتیب او دوه اړخیزه ښودنه (د متن د سمې ښودلو لپاره چې د ښي څخه کیڼ سکریپټ لري لکه عربي، فارسي او عبراني، او کیڼ څخه - صحیح سکریپټونه). د مارچ 2019 پورې، وروستی بیاکتنه یونیکوډ 12.0 دی.
د کرکټر کوډ کولو په متحد کولو کې د یونیکوډ بریا د سافټویر په نړیوال کولو او ځایی کولو کې د هغې پراخه کارونې لامل شوې. دا معیار په ډیری وروستیو ټیکنالوژیو کې پلي شوی دی په شمول: XML ، جاوا پروګرامینګ ژبه ، مایکروسافټ .NET چوکاټ او عصري عملیاتي سیسټمونه .
یونیکوډ د مختلف کوډونو لخوا پلي کیدی شي. ترټولو پراخه کارول شوي کوډونه عبارت دي له: UTF-8، او تخریب شوي UCS-2، او UTF-16.
UTF-8 کوډ کول د ASCII معیار کې د کوډ کولو لپاره یوازې 1 بایټ کاروي. د سکي کوډ کولو کې د کرکټرونو کوډ په دواړو کوډونو کې یو شان دی. دا کوډ کول په هر کرکټر کې اعظمي حد 4 بایټ کاروي. UCS-2 د ټولو کرکټرونو لپاره 2 بایټونه کاروي، نو دا نشي کولی ټول کرکټرونه په اوسني یونیکوډ معیار کې کوډ کړي. UTF-16 د UCS-2 کوډ کول پراخوي او د پاتې حروفونو لپاره 4 بایټ کاروي.
تاریخ او پرمختګ [ سمول ]
د یونیکوډ هدف د زاړه کرکټر کوډ کولو محدودیتونه لرې کول دي ، لکه د ISO 8859 معیار لخوا تعریف شوي ، کوم چې په پراخه کچه په بیلابیلو هیوادونو کې کارول کیږي ، مګر یو له بل سره مطابقت نلري. ډیری زاړه کوډونه یو عام ستونزه لري چې دوی د دوه ژبو متنونو پروسس کولو ته اجازه ورکوي (عموما د لاتیني حروفونو او محلي سمبولونو کارول)، مګر له دوو څخه ډیرو ژبو پروسس کولو ته اجازه نه ورکوي.
د متن پروسس کولو کې د یونیکوډ رول د عکس پر ځای د هر کرکټر لپاره ځانګړی کوډ چمتو کول دي. په بل عبارت، یونیکوډ یو کرکټر په مجازی بڼه وړاندې کوي او د کرکټر د عکس (د اندازې، شکل، فونټ یا سټایل په ګډون) د جوړولو کار بل سافټویر ته پریږدي لکه ویب براوزر یا د کلمې پروسیسر.
یونیکوډ د معیاري کولو نړیوال سازمان سره یوځای رامینځته شوی او د ISO/IEC 10646: نړیوال کرکټر سیټ لاندې د نورو سره د کرکټر ریپرټویر شریکوي. یونیکوډ او ISO/IEC 10646 د کرکټر کوډ کولو په توګه څنګ په څنګ کار کوي. مګر د یونیکوډ معیار د پلي کونکي لپاره خورا ډیر معلومات لري ، او د داسې شیانو په اړه نور توضیحات پکې شامل دي لکه د بټ کوډ کول ، لنډیز ، او د کرکټر رینډینګ. د یونیکوډ معیار کې د کرکټر مشخصات لوی شمیر شامل دي ، پشمول د دوه اړخیز متن لیکلو ملاتړ. د دې دوه معیارونو لخوا کارول شوي شرایط یو څه توپیر لري.
د یونیکوډ کنسورشیم لومړی ځل په 1991 کې د یونیکوډ معیاري نسخه (1.0 نسخه) خپره کړه، او له هغه وخت راهیسې په منظمه توګه نوې نسخې خپروي. د یونیکوډ معیار وروستۍ نسخه، نسخه 13.0، د 2020 په مارچ کې خپره شوه او د کنسورشیم ویب پاڼې څخه په بریښنایی بڼه کې شتون لري. د معیار وروستۍ نسخه په بشپړ ډول د کتاب په بڼه خپره شوې (د کوډ ډیاګرامونو په شمول) په 2006 کې 5.0 نسخه وه، مګر د 5.2 نسخه (2009) راهیسې د معیار اصلي ځانګړتیا د غوښتنې سره سم د چاپ شوي کاغذ په توګه خپره شوې. د معیاري هرې نسخې ټول متن، په شمول د اصلي ځانګړتیاوو، معیاري ضمیمو او کوډ ډیاګرامونو په شمول، په وړیا توګه د یونیکوډ ویب پاڼه کې په PDF بڼه کې شتون لري [۳] .
تر دې دمه ، د یونیکوډ معیار لاندې لوی او کوچني نسخې خپرې شوي. تازه شوي نسخې، چې د کرکټرونو په ریپرټویر کې هیڅ بدلون نه لري، په دریم نمبر سره نښه شوي (د مثال په توګه "4.0.1 نسخه") او په لاندې جدول کې نه پریښودل کیږي [۴] .
يونيکوډ نسخه
نسخه
نېټه
کتاب
نسخه ISO/IEC 10646 متناظر
Scripts
کرکټرونه
د یونیکوډ په هره نسخه کې چمتو شوي د [tablenote ۱]
مهمې نسخې
1.0.0
October 1991
ISBN 0-201-56788-1 (Vol. 1)
24
7,161
په لومړۍ ټولګه کې لاندې توري شامل دي: عربي، ارمنيايي ، بنګالي، بوپوموفو، سيريليک ، ديوناگري ، جورجيا، يوناني او کاپټیک] , گجراتی ، گرم ، هنگول ، عبراني، هیراگانا، Canada , Katakana, Lao , [لاتین لیکل شوی ] ]، تايي، او تبتي.[۵]
1.0.1
June 1992
ISBN 0-201-60845-6 (Vol. 2)
25
28,359
له اولينو ټولګو CJK Unified Ideographs ګڼل کيږي.[۶]
1.1
June 1993
ISO/IEC 10646-1:1993
24
34,233
4,306 بل سېلاب هانگولی په لومړنۍ ټولګه کې 2,350کرکټره ورزيات شول. تبتي حذف شول.[۷]
2.0
July 1996
ISBN 0-201-48345-9
ISO/IEC 10646-1:1993 plus Amendments 5, 6 and 7
25
38,950
ماصلي هنګولیان سیلاب ګروپ لیرې شو او د 11,172 سیلاب ډلو یو نوی ځای جوړ شو. تبتی بیا د یوې نوې ډلې سره او په بل ځای کې اضافه شوی.
. د کرکټرونو لپاره د بدیل میکانیزم تعریف شوی. پاڼې 15 او 16 en:Private_use_(Unicode) وټاکل شوه.[۸]
2.1
May 1998
ISO/IEC 10646-1:1993 plus Amendments 5, 6 and 7, as well as two characters from Amendment 18
25
38,952
ايورو نښه Object Replacement Character زياته شوه.[۹]
3.0
September 1999
ISBN 0-201-61633-5
ISO/IEC 10646-1:2000
38
49,259
چروگکی ، گعز، خمری، مغولی ، برمه ای ، اوقام ، خط رونی، سینهالا، سریانی، تهانا ، سیلاب های مشترک غیربومی کانادایی and یی و همچنین الگوهای بریل نیز اضافه شدند.[۱۰]
3.1
March 2001
ISO/IEC 10646-1:2000
ISO/IEC 10646-2:2001
41
94,205
دسرت , گوتیک ، ایتالیایی باستانی، نمادهایی از موسیقی غربی و بیزانسی و 42711 CJK Unified Ideographs اضافه شدند.[۱۱]
3.2
March 2002
ISO/IEC 10646-1:2000 plus Amendment 1
ISO/IEC 10646-2:2001
45
95,221
فیلیپینی، بوید ، هاونو ، تاگالوگ ، و تاگبانوا اضافه شد.[۱۲]
4.0
April 2003
ISBN 0-321-18578-1
ISO/IEC 10646:2003
52
96,447
سیپروییت ، لیمبو ، B خطی ، عثمانی ،شاویان ، تای له ، اوگارتی، و شش نویسی اضافه شدند.[۱۳]
4.1
March 2005
ISO/IEC 10646:2003 plus Amendment 1
59
97,720
بوگینیز ، گلاگولیتی، خروشتی ،تای لو، فارسی باستانی، سیلهتی ، و تیفیناگ اضافه شدند. کپتی از یونانی جداشد. اعداد و نشانه های موسیقیایی یونان باستان نیز اضافه شدند .[۱۴]
5.0
July 2006
ISBN 0-321-48091-0
ISO/IEC 10646:2003 plus Amendments 1 and 2, as well as four characters from Amendment 3
64
99,089
بالیایی، خط میخی ،انکو ، پاسپا ، و فینیقی اضافه شد.[۱۵]
5.1
April 2008
ISO/IEC 10646:2003 plus Amendments 1, 2, 3 and 4
75
100,713
کاریان ، چام ، کایا لی ،لپ چا ،لیسی ، لیدی ، اولچیکی ، رجنگ ، شوراشترا ،ساندانی ، وای ، و همچنین نشانه هایی از صفحه فستوس، ماژونگ، دومینو اضافه شد.
به علاوه اضافاتی از برمه ای ، اختصارات کتابی ، و نسخ خطی میانه، و حرف بزرگ ẞ رانیز در بر داشت.[۱۶]
5.2
October 2009
ISBN 978-1-936213-00-9
ISO/IEC 10646:2003 plus Amendments 1, 2, 3, 4, 5 and 6
90
107,361
اوستایی، باموم ، هیروگلیف مصری ( در مجموعه نشانه های گاردینر 1071 کاراکتر وجود دارد)، آرامی پادشاهی ، پهلوی نوشتاری ، پارتی نوشتاری، جاوه ای ، کایتی ، فراسر ، میتئی ، عربستانی جنوبی باستانی، ترکی باستانی (اورخون)، سامری، تای تام، تای ویت اضافه شد. همچنین 4149 CJK Unified Ideographs به همراه توسعه جامو برای هانگولی و کاراکترهای وردیکت نیز اضافه شدند.[۱۷]
6.0
October 2010
ISBN 978-1-936213-01-6
ISO/IEC 10646:2010 plus the Indian rupee sign
93
109,449
بتک ، براهمی، ماندایی ،علائم راهنمایی و رانندگی، نقشه، نشانه های شیمیایی ، شکلک ها، و 222 CJK Unified Ideographs اضافه شد.[۱۸]
6.1
January 2012
ISBN 978-1-936213-02-3
ISO/IEC 10646:2012
100
110,181
چامکا ، مروئیت ، پولارد ، شارادا ، سرنگ سمپن ، و تکری اضافه شدند.[۱۹]
6.2
September 2012
ISBN 978-1-936213-07-8
ISO/IEC 10646:2012 plus the Turkish lira sign
100
110,182
نشان لیره ترکیه اضافه شد.[۲۰]
6.3
September 2013
ISBN 978-1-936213-08-5
ISO/IEC 10646:2012 plus six characters
100
110,187
5 کاراکتر برای متن دوسویه اضافه شد.[۲۱]
7.0
June 2014
ISBN 978-1-936213-09-2
ISO/IEC 10646:2012 plus Amendments 1 and 2, as well as the Ruble sign
123
113,021
باسا، آلابانیای قفقاز، دوپلویان ، الباسان ، گرانتا، خوجکی ، خودابادی ،
خطی آ ، ماهاجانی ، مانوی، منده کیکاکویی ، مودی ، مرو ، نبطی، عربی شمالی باستانی ، پرمیک باستانی ، پاهاو ، تدمیری، پو چین هاو ، پهلوی نیایشی ، سیدام ، تیرهوتا ، وارانگ ، نشان گذارهای پارگرافی .[۲۲]
8.0
June 2015
ISBN 978-1-936213-10-8
ISO/IEC 10646:2014 plus Amendment 1, as well as the Lari sign , nine CJK unified ideographs, and 41 emoji characters[۲۳]
129
120,737
آهوم ، آناتولی ، هاتران ، مولتانی ، لهستانی باستانی ، زبان اشاره ، چروکی نشانه ای ، 5771 CJK Unified Ideographs دیگر، و مجموعه کوچک نویسی چروگکی و پنج نشانه مقیاس فیتزپاتریک.[۲۴]
9.0
June 2016
ISBN 978-1-936213-13-9
ISO/IEC 10646:2014 plus Amendments 1 and 2, as well as Adlam, Newa, Japanese TV symbols, and 74 emoji and symbols[۲۵]
135
128,237
آدلام ، بایکسوکی ، ژانگ ژانگ ، پراکال ، اوساژ ، تانگوت ، ایموجی.[۲۶] [۲۷]
10.0
June 2017
ISBN 978-1-936213-16-0
ISO/IEC 10646:2017 plus 56 emoji characters, 285 hentaigana characters, and 3 Zanabazar Square characters[۲۸]
139
136,755
زانابازار ، سویومبو ، ماسارام گوندی ، نوشو، هنتایگانا ، هیراگانا، 7494 CJK Unified Ideographs دیگر، و ایموجی
11.0
June 2018
ISBN 978-1-936213-19-1
ISO/IEC 10646:2017 plus Amendment 1, as well as 46 Mtavruli Georgian capital letters, 5 CJK unified ideographs, and 66 emoji characters.[۲۹]
146
137,439
دوگری ، خدرولی ، گونجالا ، حنیفی ، ایندی ، ماکاسارس ، مدفدری ، سغدی، مایا ، 5 CJK Unified Ideographs با اولویت بالا، نشانه های شطرنج چینی، نشنه پنج ستاره ، و 146 ایموجی دیگر[۳۰]
12.0
March 2019
ISBN 978-1-936213-22-1
ISO/IEC 10646:2017 plus Amendments 1 and 2, as well as 62 additional characters.[۳۱]
150
137,993
الیمایی ، ناندیناگاری ، نیاکنگ ، وانچو ، پولارد اضافاتی برای علامت های زبان یی و میائو چینی، حروف کوچکژاپنی هیراگانا و کاتاکانا، نشانه ها و شاخه های تاریخی تامیل ، حروف لائو برای پالی، حروف لاتین برای حرف نوشتار مصری و اوگاریتیک، نشانه ای هیروگلیف، و 161 ایموجی[۳۲]
12.1
May 2019
ISBN 978-1-936213-25-2
150
137,994
افزودن یک کارکتر در U+32FF برای شکل مربع اسم ریوا.[۳۳]
13.0
March 2020
ISBN 978-1-936213-26-9
ISO/IEC 10646:2020[۳۴]
154
143,924
زبان خوارزمی، دیوی ، خیطان ، کوردی یزیدی ، اضافات سری G CJK Unified Ideographs ، اضافات زبان عربی برای زبان هوسه و زبان ولوف و دیگر زبانهای افریقایی و نوشتار زبان هندکو و زبان پنجابی در پاکستان، بوپوموفو، و اضافتی برای کانوتی، نشانه های مدرک خلاقیت عمومی، کاراکترهای گرافیکی برای تلتکست و سیستم های رایانه ای دهه های 70 و 80، و همچنین 55 ایموجی.[۳۵]
په وینډوز کې یونیکوډ [ سمول ]
په وینډوز API کې، د یونیکوډ افعال د W ضمیمې سره راځي. (مثال: CreateWindowExW) لاحقه W د پراخه کریکټ اصطلاح لومړی توری دی. د پروګرامینګ ژبو کې، د ډیټا ډولونه چې د یونیکوډ ملاتړ کوي ورته نومونه لري لکه WCHAR، او ځینې وختونه ورته ملټي بایټ کرکټر ویل کیږي (به کې هم ویل کیږي.
اړوندې پوښتنې [ سمول ]
یونیکوډ داخل کړئ
د کرکټر کوډ کول
کرکټر
د یونیکوډ بڼه
بهرنۍ لینک [ سمول ]
«یونیکد چیست؟». ترجمهٔ روزبه پورنادر. کنسرسیوم یونیکد. دریافتشده در ۱۰ ژوئیهٔ ۲۰۰۹..mw-parser-output cite.citation{font-style:inherit}.mw-parser-output q{quotes:"\"""\"""'""'"}.mw-parser-output code.cs1-code{color:inherit;background:inherit;border:inherit;padding:inherit}.mw-parser-output .cs1-lock-free a{background:url("//upload.wikimedia.org/wikipedia/commons/thumb/6/65/Lock-green.svg/9px-Lock-green.svg.png")no-repeat;background-position:right .1em center;padding-right:1em;padding-left:0}.mw-parser-output .cs1-lock-limited a,.mw-parser-output .cs1-lock-registration a{background:url("//upload.wikimedia.org/wikipedia/commons/thumb/d/d6/Lock-gray-alt-2.svg/9px-Lock-gray-alt-2.svg.png")no-repeat;background-position:right .1em center;padding-right:1em;padding-left:0}.mw-parser-output .cs1-lock-subscription a{background:url("//upload.wikimedia.org/wikipedia/commons/thumb/a/aa/Lock-red-alt-2.svg/9px-Lock-red-alt-2.svg.png")no-repeat;background-position:right .1em center;padding-right:1em;padding-left:0}.mw-parser-output div[dir=ltr] .cs1-lock-free a,.mw-parser-output div[dir=ltr] .cs1-lock-subscription a,.mw-parser-output div[dir=ltr] .cs1-lock-limited a,.mw-parser-output div[dir=ltr] .cs1-lock-registration a{background-position:left .1em center;padding-left:1em;padding-right:0}.mw-parser-output .cs1-subscription,.mw-parser-output .cs1-registration{color:#555}.mw-parser-output .cs1-subscription span,.mw-parser-output .cs1-registration span{border-bottom:1px dotted;cursor:help}.mw-parser-output .cs1-hidden-error{display:none;font-size:100%}.mw-parser-output .cs1-visible-error{font-size:100%}.mw-parser-output .cs1-subscription,.mw-parser-output .cs1-registration,.mw-parser-output .cs1-format{font-size:95%}.mw-parser-output .cs1-kern-left,.mw-parser-output .cs1-kern-wl-left{padding-left:0.2em}.mw-parser-output .cs1-kern-right,.mw-parser-output .cs1-kern-wl-right{padding-right:0.2em}
مشارکتکنندگان ویکیپدیا. «Unicode». در دانشنامهٔ ویکیپدیای انگلیسی، بازبینیشده در ۱۱ ژوئن ۲۰۰۹.