कंप्यूटरसूचना प्रौद्योगिकी

कंप्यूटर में पाठ जानकारी की एन्कोडिंग

कंप्यूटर - एक परिष्कृत उपकरण है जो आप के साथ, बनाने कनवर्ट करते हैं, और कर सकते हैं के बारे में जानकारी की दुकान। हालांकि, कंप्यूटर हमारे लिए बहुत समझ में आता है जिस तरह से काम नहीं करता है - ग्राफिक, पाठ और संख्यात्मक डेटा द्विआधारी सरणियों के रूप में संग्रहीत किया जाता है संख्या। इस लेख में हम कैसे पाठ जानकारी की एन्कोडिंग को ही देखेगा।

वर्णों के क्रम - हमारे लिए क्या एक कंप्यूटर का पाठ है। प्रत्येक प्रतीक शून्य और के एक विशिष्ट समूह का प्रतिनिधित्व करता है। प्रतीकों के तहत न केवल अपर और लोअर केस मतलब लैटिन के पत्र वर्णमाला, लेकिन यह भी विराम चिह्न, गणित के संकेत, विशेष वर्ण, विशेष प्रतीकों और यहां तक कि अंतरिक्ष।

शाब्दिक जानकारी के द्विआधारी एन्कोडिंग

आंतरिक नियंत्रक पर एक निश्चित कुंजी दबाकर एक विद्युत संकेत है कि एक में बदल जाती है भेजता बाइनरी कोड। कोड एक निश्चित प्रतीक है, जो स्क्रीन पर प्रदर्शित किया जाता है के साथ मिलान किया जाता है। करने के लिए प्रस्तुत करने के लिए लैटिन वर्णमाला एक डिजिटल स्वरूप ASCII अंतरराष्ट्रीय प्रणाली कोडिंग में बनाया गया था। यह 1 एक प्रतीक इस प्रकार शून्य और के आठ प्रतीक अनुक्रम के होते हैं की रिकॉर्डिंग के लिए बाइट की आवश्यकता है। रिकॉर्डिंग अंतराल - 00000000 से 11111111 के लिए, इस प्रणाली का उपयोग करते हुए पाठ में जानकारी का यानी कोडिंग हमें 256 वर्णों का प्रतिनिधित्व करने के लिए अनुमति देता है। ज्यादातर मामलों में, यह पर्याप्त है।

ASCII को दो भागों में बांटा गया है। पहले 127 वर्ण (00000000 से 01,111,111 करने के लिए) अंतरराष्ट्रीय कर रहे हैं और विशिष्ट प्रतीकों और अंग्रेजी वर्णमाला के अक्षरों कर रहे हैं। दूसरे भाग - विस्तार (10000000 से 11111111 के लिए) - राष्ट्रीय वर्णमाला, जिनमें से लेखन लैटिन से अलग है का प्रतिनिधित्व करने का इरादा है।

ASCII में एन्कोडिंग पाठ जानकारी बढ़ रही अनुक्रम, यानी, बड़े अक्षरों का क्रम संख्या, अधिक से अधिक अपने ASCII-कोड के मूल्य के सिद्धांत पर बनाया गया है। आंकड़े और तालिका के रूस हिस्सा ही सिद्धांत पर बनाया जाता है।

हालांकि, दुनिया में सिरिलिक अक्षरों के लिए एन्कोडिंग के कई प्रकार हैं। सबसे आम - KOI-8 (आठ बिट एन्कोडिंग कि पहले ruifitsirovannyh यूनिक्स ऑपरेटिंग सिस्टम में 70 के दशक में के लिए इस्तेमाल किया गया है), आईएसओ 8859-5 (अंतर्राष्ट्रीय मानकीकरण ब्यूरो द्वारा विकसित), सीपी 1251 (कोडिंग शाब्दिक में प्रयोग किया जाता है के बारे में जानकारी आधुनिक ओएस विंडोज़), और साथ ही यूनिकोड की 2-बाइट एन्कोडिंग है, जो 65,536 पात्रों को पेश करने के लिए इस्तेमाल किया जा सकता है। इस तरह के तथ्य यह है कि वे अलग अलग समय पर विकसित किए गए अलग ऑपरेटिंग सिस्टम और विभिन्न कारणों के लिए की वजह से एन्कोडिंग की एक किस्म। एक बेमेल उपयोगकर्ता एन्कोडिंग भ्रामक माउस का एक सेट देखेंगे से - इस वजह से, अक्सर कठिनाइयों जब एक मध्यम से पाठ स्थानांतरित किया है। मैं इस स्थिति को कैसे ठीक कर सकते हैं? वर्ड में, उदाहरण के लिए, जब एक दस्तावेज खोला जाता है, पाठ प्रदर्शन के साथ समस्याओं के बारे में संदेश और ट्रांसकोडिंग के लिए कई विकल्प प्रदान करता है।

इस प्रकार, कोडिंग और कंप्यूटर की आंत में शाब्दिक जानकारी का प्रसंस्करण - प्रक्रिया कठिन और समय लेने का आयोजन किया है। किसी भी वर्णमाला के सभी प्रतीकों केवल अंक की एक निश्चित अनुक्रम हैं बाइनरी सिस्टम की, एक कक्ष - इस जानकारी में से एक बाइट है।

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 hi.birmiss.com. Theme powered by WordPress.