कंप्यूटर, सूचना प्रौद्योगिकी

कंप्यूटर में पाठ जानकारी की एन्कोडिंग

कंप्यूटर - एक परिष्कृत उपकरण है जो आप के साथ, बनाने कनवर्ट करते हैं, और कर सकते हैं के बारे में जानकारी की दुकान। हालांकि, कंप्यूटर हमारे लिए बहुत समझ में आता है जिस तरह से काम नहीं करता है - ग्राफिक, पाठ और संख्यात्मक डेटा द्विआधारी सरणियों के रूप में संग्रहीत किया जाता है संख्या। इस लेख में हम कैसे पाठ जानकारी की एन्कोडिंग को ही देखेगा।

वर्णों के क्रम - हमारे लिए क्या एक कंप्यूटर का पाठ है। प्रत्येक प्रतीक शून्य और के एक विशिष्ट समूह का प्रतिनिधित्व करता है। प्रतीकों के तहत न केवल अपर और लोअर केस मतलब लैटिन के पत्र वर्णमाला, लेकिन यह भी विराम चिह्न, गणित के संकेत, विशेष वर्ण, विशेष प्रतीकों और यहां तक कि अंतरिक्ष।

शाब्दिक जानकारी के द्विआधारी एन्कोडिंग

आंतरिक नियंत्रक पर एक निश्चित कुंजी दबाकर एक विद्युत संकेत है कि एक में बदल जाती है भेजता बाइनरी कोड। कोड एक निश्चित प्रतीक है, जो स्क्रीन पर प्रदर्शित किया जाता है के साथ मिलान किया जाता है। करने के लिए प्रस्तुत करने के लिए लैटिन वर्णमाला एक डिजिटल स्वरूप ASCII अंतरराष्ट्रीय प्रणाली कोडिंग में बनाया गया था। यह 1 एक प्रतीक इस प्रकार शून्य और के आठ प्रतीक अनुक्रम के होते हैं की रिकॉर्डिंग के लिए बाइट की आवश्यकता है। रिकॉर्डिंग अंतराल - 00000000 से 11111111 के लिए, इस प्रणाली का उपयोग करते हुए पाठ में जानकारी का यानी कोडिंग हमें 256 वर्णों का प्रतिनिधित्व करने के लिए अनुमति देता है। ज्यादातर मामलों में, यह पर्याप्त है।

ASCII को दो भागों में बांटा गया है। पहले 127 वर्ण (00000000 से 01,111,111 करने के लिए) अंतरराष्ट्रीय कर रहे हैं और विशिष्ट प्रतीकों और अंग्रेजी वर्णमाला के अक्षरों कर रहे हैं। दूसरे भाग - विस्तार (10000000 से 11111111 के लिए) - राष्ट्रीय वर्णमाला, जिनमें से लेखन लैटिन से अलग है का प्रतिनिधित्व करने का इरादा है।

ASCII में एन्कोडिंग पाठ जानकारी बढ़ रही अनुक्रम, यानी, बड़े अक्षरों का क्रम संख्या, अधिक से अधिक अपने ASCII-कोड के मूल्य के सिद्धांत पर बनाया गया है। आंकड़े और तालिका के रूस हिस्सा ही सिद्धांत पर बनाया जाता है।

हालांकि, दुनिया में सिरिलिक अक्षरों के लिए एन्कोडिंग के कई प्रकार हैं। सबसे आम - KOI-8 (आठ बिट एन्कोडिंग कि पहले ruifitsirovannyh यूनिक्स ऑपरेटिंग सिस्टम में 70 के दशक में के लिए इस्तेमाल किया गया है), आईएसओ 8859-5 (अंतर्राष्ट्रीय मानकीकरण ब्यूरो द्वारा विकसित), सीपी 1251 (कोडिंग शाब्दिक में प्रयोग किया जाता है के बारे में जानकारी आधुनिक ओएस विंडोज़), और साथ ही यूनिकोड की 2-बाइट एन्कोडिंग है, जो 65,536 पात्रों को पेश करने के लिए इस्तेमाल किया जा सकता है। इस तरह के तथ्य यह है कि वे अलग अलग समय पर विकसित किए गए अलग ऑपरेटिंग सिस्टम और विभिन्न कारणों के लिए की वजह से एन्कोडिंग की एक किस्म। एक बेमेल उपयोगकर्ता एन्कोडिंग भ्रामक माउस का एक सेट देखेंगे से - इस वजह से, अक्सर कठिनाइयों जब एक मध्यम से पाठ स्थानांतरित किया है। मैं इस स्थिति को कैसे ठीक कर सकते हैं? वर्ड में, उदाहरण के लिए, जब एक दस्तावेज खोला जाता है, पाठ प्रदर्शन के साथ समस्याओं के बारे में संदेश और ट्रांसकोडिंग के लिए कई विकल्प प्रदान करता है।

इस प्रकार, कोडिंग और कंप्यूटर की आंत में शाब्दिक जानकारी का प्रसंस्करण - प्रक्रिया कठिन और समय लेने का आयोजन किया है। किसी भी वर्णमाला के सभी प्रतीकों केवल अंक की एक निश्चित अनुक्रम हैं बाइनरी सिस्टम की, एक कक्ष - इस जानकारी में से एक बाइट है।

कंप्यूटर, सूचना प्रौद्योगिकी

कंप्यूटर में पाठ जानकारी की एन्कोडिंग

Similar articles

कंप्यूटर

कंप्यूटर

कंप्यूटर

कंप्यूटर

कंप्यूटर

कंप्यूटर

Trending Now

स्वास्थ्य

गठन

गठन

गठन

भोजन और पेय

सरलता

Newest

यात्रा का

गठन

संबंधों

व्यापार

स्वास्थ्य

खाद्य और पेय पदार्थ