कंप्यूटरसूचना प्रौद्योगिकी

एन्कोडिंग "यूनिकोड": चरित्र कोडिंग मानक

की कोशिश में हर इंटरनेट उपयोगकर्ता एक स्थापित करने के लिए या अपने कार्य के अन्य कम से कम एक बार स्क्रीन लिखा पर देखा लैटिन अक्षरों में शब्द "यूनिकोड।" यह क्या है, तो आप इस लेख को पढ़ने के द्वारा सीखना होगा।

परिभाषा

एन्कोडिंग "यूनिकोड" - वर्ण एन्कोडिंग मानक। यह यूनिकोड इंक गैर-लाभकारी संगठन द्वारा प्रस्तावित किया गया 1991 में। मानक एक दस्तावेज में पात्रों के विभिन्न प्रकार के सबसे बड़े संभव संख्या को एक साथ लाने के लिए बनाया गया है। पृष्ठ है, जो आधार पर उसके स्थापित किया गया था, विभिन्न भाषाओं (रूस से कोरियाई करने के लिए) और गणितीय संकेत से पत्र और वर्ण हो सकते हैं। इस मामले में, वर्ण सेट में पात्रों के सभी बिना किसी समस्या के प्रदर्शित होते हैं।

के निर्माण के लिए कारणों

एक समय की बात, लंबे समय से एक एकल प्रणाली की उपस्थिति से पहले "यूनिकोड" एन्कोडिंग दस्तावेज़ के लेखक की प्राथमिकताओं के आधार पर चुना जाता है। इस कारण से, अक्सर एक दस्तावेज़ को पढ़ने के लिए के लिए, यह अलग तालिकाओं का उपयोग करने के लिए आवश्यक था। कभी कभी यह कई बार है, जो बहुत औसत उपयोगकर्ता के जीवन पेचीदा करने के लिए आवश्यक है। पहले से ही उल्लेख किया है, 1991 में इस समस्या का समाधान यूनिकोड इंक के लिए एक गैर-लाभकारी संगठन आमंत्रित किया गया था वर्ण एन्कोडिंग के एक नए प्रकार की पेशकश करने के लिए। यह पुराना और मानकों की एक किस्म के गठबंधन करने के लिए डिजाइन किया गया था। "यूनिकोड" - एक एन्कोडिंग उस समय असंभव को प्राप्त ozvolila: एक उपकरण के पात्रों में से एक बड़ी संख्या का समर्थन करता है कि बनाने के लिए। परिणाम कई उम्मीदों को पार कर - वहाँ एक साथ दोनों अंग्रेजी और रूसी पाठ, लैटिन, और गणितीय अभिव्यक्ति वाले दस्तावेज़ों थे।

लेकिन जरूरत से पहले एक एकीकृत कोडिंग के निर्माण के पहले से ही उस समय मौजूदा मानकों की विशाल विविधता की वजह से समस्याओं कि पैदा हुए हैं की एक संख्या को हल करने। उनमें से सबसे आम:

  • Elvish लेखन, या "निरर्थक शब्द";
  • वर्ण सेट की सीमाओं;
  • समस्या codings को बदलने;
  • फ़ॉन्ट दोहराव।

छोटे ऐतिहासिक excursus

कल्पना कीजिए कि यार्ड 80 वें। कंप्यूटर हार्डवेयर इतना आम नहीं है और एक फार्म आज से अलग है। प्रत्येक ओएस अद्वितीय है और हर उत्साही की विशिष्ट आवश्यकताओं परिष्कृत है। जानकारी के आदान-प्रदान की आवश्यकता है एक अतिरिक्त पुनर्निमाण सब कुछ में बदल जाता है। अन्य ऑपरेटिंग सिस्टम के द्वारा बनाई गई एक दस्तावेज़ को पढ़ने के लिए कोशिश कर रहा है, अक्सर पात्रों में से एक अजीब सेट प्रदर्शित करता है, और खेल एन्कोडिंग के साथ शुरू होता है। यह हमेशा इसे जल्दी नहीं करता है, और कभी कभी आवश्यक दस्तावेज़ में असमर्थ छह महीने में खोलने के लिए, और यहां तक कि बाद में। जो लोग अक्सर जानकारी का आदान, खुद के लिए एक रूपांतरण सारणी पैदा करते हैं। और फिर काम पर उन्हें एक दिलचस्प विस्तार का पता चलता है: "में अपने मेरी से" आगे और पीछे उन्हें दो दिशाओं में बनाने की आवश्यकता,। स्रोत के अधिकार स्तम्भ में यह सुविधा प्रदान करें साधारण उलट कंप्यूटिंग मशीन नहीं कर सकते हैं, है, और बाएँ - परिणाम है, लेकिन इसके विपरीत नहीं। यदि आप देखते हैं दस्तावेज़ में कोई विशेष वर्ण का उपयोग करने की जरूरत है, वे पहले जोड़े जा सकते थे, और फिर एक और, और साथी वह इन पात्रों को करने के लिए एक नहीं हो जाते जरूरत है क्या करने के लिए समझाने के लिए "निरर्थक शब्दों वाला।" और यह नहीं भूलना चाहिए कि के लिए हर एन्कोडिंग को विकसित करने या अपने स्वयं के फोंट, जो ओएस में डुप्लिकेट की एक बड़ी संख्या की रचना हुई लागू करने के लिए किया था करते हैं।

आगे कल्पना कीजिए कि पृष्ठ पर फोंट, यदि आप एक छोटे नोट के साथ समान Times New Roman के 10 टुकड़े देखेंगे: UTF-8 के लिए, UTF-16, एएनएसआई, यूसीएस -2। अब आप समझते हैं कि सार्वभौमिक मानकों के विकास जरूरी था?

"के रचनाकारों के संस्थापक पिता"

यूनिकोड के निर्माण के मूल 1987 में पाया जा सकता है जब जेरोक्स से Dzho Bekker, ली कोलेंस और एप्पल से मार्क डेविस के साथ एक सार्वभौमिक वर्ण सेट का व्यावहारिक निर्माण के क्षेत्र में अनुसंधान शुरू किया। अगस्त 1988 में, Dzho Bekker 16-बिट बहुभाषी अंतरराष्ट्रीय कोडिंग प्रणाली के निर्माण के लिए एक मसौदा प्रस्ताव प्रकाशित किया।

कुछ महीने बाद यूनिकोड कार्यदल एक आम कोडिंग मानक के प्रारंभिक गठन पर काम के पूरा होने को सक्षम करने, केन Whistler और RLG से माइक Kernegana, सन माइक्रोसिस्टम्स और कई अन्य विशेषज्ञों की ग्लेन रेट शामिल करने के लिए विस्तार किया गया था।

सामान्य विवरण

यूनिकोड प्रतीक की अवधारणा पर आधारित। इस परिभाषा एक सार घटना है कि लेखन का एक विशेष रूप में मौजूद है और एक ग्रफीम (अपने "चित्रों") के माध्यम से महसूस किया को संदर्भित करता है के तहत। प्रत्येक चरित्र के लिए एक विशेष इकाई मानक से संबंधित "यूनिकोड" अद्वितीय कोड में दी गई है। उदाहरण के लिए ग्रफीम बी अंग्रेजी और रूसी वर्णमाला में भी है, लेकिन यह यूनिकोड 2 अलग वर्ण से मेल खाती है। वे रूपांतरण के अधीन करने के लिए कर रहे हैं लोअरकेस, टी। ई, जिनमें से प्रत्येक कुंजी डेटाबेस का वर्णन करता है, गुण का एक सेट और पूरा नाम।

यूनिकोड के लाभ

एन्कोडिंग "यूनिकोड" अन्य समकालीनों से "एन्क्रिप्शन" वर्ण के लिए चिह्नों का एक जबरदस्त स्टॉक नहीं है। तथ्य यह है कि अपने पूर्ववर्तियों 8 बिट था, कि 28 अक्षर के द्वारा समर्थित है, लेकिन नए डिजाइन पहले से ही 216 पात्रों था, कि एक बड़ा कदम आगे था। यह अनुमति दी एनकोड लगभग सभी मौजूदा और आम अक्षर।

"यूनिकोड" के आगमन के साथ अब एक रूपांतरण सारणी उपयोग करने की आवश्यकता: एक ही मानक के रूप में यह सिर्फ उन्हें के लिए की जरूरत को नकार दिया। इसी तरह, वे गुमनामी में डूब गया, और "निरर्थक शब्द" - एक भी मानक बाहर डुप्लिकेट फोंट बनाने की आवश्यकता उन्हें असंभव है, साथ ही नियम बना दिया।

यूनिकोड के विकास

बेशक, प्रगति जगह में नहीं है, और के बाद से पहली प्रस्तुति 25 साल के लिए पारित किया है। हालांकि, चारसेट "यूनिकोड" हठ दुनिया में अपनी स्थिति रहती है। कई मायनों में यह तथ्य यह है कि इसे लागू करने के लिए आसान हो गया है और फैल गया है करने के लिए संभव धन्यवाद किया गया है, मालिकाना (भुगतान) और खुला स्रोत सॉफ्टवेयर के डेवलपर्स पहचाना जा रहा।

हम है कि आज हम एक सदी पहले की तिमाही के रूप में एक ही कोड "यूनिकोड" देख विश्वास नहीं करना चाहिए। फिलहाल, यह संस्करण 5.h.h द्वारा बदल दिया गया था, और कोडित प्रतीकों की संख्या अधिक से अधिक मार्जिन के निशान से इनकार कर दिया का उपयोग कर अभी भी यूनिकोड-16 के लिए समर्थन बनाए रखने के लिए की संभावना पर 231. की वृद्धि हुई है (एन्कोडिंग, जहां उनकी सीमित संख्या 216 की अधिकतम राशि)। अपनी स्थापना के बाद और संस्करण 2.0.0 करने के लिए "यूनिकोड स्टैंडर्ड" अक्षर है कि यह लगभग 2 बार में शामिल की संख्या बढ़ गई। अवसरों और आने वाले वर्षों में सतत वृद्धि। संस्करण 4.0.0 के लिए पहले से ही मानक खुद को बढ़ाने के लिए की जरूरत है, और है कि किया गया था। नतीजतन, "यूनिकोड" रूप है, जिसमें आज हम जानते हैं मिल गया है।

और क्या यूनिकोड में है?

विशाल के अलावा, लगातार वर्णों की संख्या के साथ अद्यतन, "यूनिकोड" -Encoding पाठ जानकारी एक और उपयोगी विशेषता है। यह तथाकथित सामान्य है। के बजाय चरित्र से पूरे दस्तावेज चरित्र के माध्यम से स्क्रॉल, और पत्राचार तालिका के प्रतीक स्थानापन्न, मौजूदा सामान्य एल्गोरिदम में से एक का उपयोग करें। यह क्या है?

इसके बजाय एक ही चरित्र है, जो विभिन्न अक्षर में इसी तरह हो सकता है की एक नियमित जांच पर कंप्यूटर के संसाधनों को बर्बाद, एक विशेष कलन विधि का उपयोग की। यह आपको एक ऐसी ही प्रतीकों अलग कॉलम लुकअप तालिका बनाने के लिए और पहले से ही सभी डेटा पुनः जाँच करने के लिए फिर से अधिक से अधिक नहीं करने के लिए उन्हें लागू होते हैं, करने के लिए अनुमति देता है।

इस तरह के एल्गोरिदम विकसित किया है और चार कार्यान्वित किया जाता है। प्रत्येक रूपांतरण का सख्ती से निश्चित सिद्धांत, दूसरे से अलग से जगह लेता है, तो कॉल करने के लिए उनमें से किसी एक सबसे कुशल संभव नहीं है। प्रत्येक विशिष्ट जरूरतों के लिए डिजाइन, एम्बेडेड और सफलतापूर्वक इस्तेमाल किया गया था।

प्रसार मानक

अपने इतिहास एन्कोडिंग "यूनिकोड" के 25 वर्षों में मैं शायद दुनिया में सबसे बड़े पैमाने पर प्राप्त हुआ है। इस मानक के तहत कार्यक्रमों और वेब पृष्ठों के रूप में समायोजित कर रहे हैं। आवेदन की चौड़ाई का संकेत हो सकता है कि यूनिकोड अब इंटरनेट संसाधनों की 60% से अधिक द्वारा इस्तेमाल किया।

अब, आप जानते हैं, जब "यूनिकोड" मानक दिखाई दिया। यह क्या है, आप यह भी जानते हैं और आविष्कार का पूरा महत्व, विशेषज्ञों यूनिकोड इंक के एक समूह द्वारा किए गए सराहना करने में सक्षम हो से अधिक 25 साल पहले।

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 hi.birmiss.com. Theme powered by WordPress.