आधुनिक कंप्यूटर प्रौद्योगिकियां, सूचना विज्ञान,वर्णमाला की शक्ति, संख्या प्रणाली और कई अन्य अवधारणाओं का एक दूसरे के साथ सबसे सीधा संबंध है। आज बहुत कम उपयोगकर्ता इन मामलों से अच्छी तरह वाकिफ हैं। आइए स्पष्ट करने का प्रयास करें कि वर्णमाला की शक्ति क्या है, इसकी गणना कैसे करें और इसे व्यवहार में कैसे लागू करें। निःसंदेह भविष्य में यह व्यवहार में काम आ सकता है।
जानकारी कैसे मापी जाती है
वर्णमाला की शक्ति क्या है, और सामान्य तौर पर, यह क्या है, इस सवाल का अध्ययन शुरू करने से पहले, आपको शुरू करना चाहिए, इसलिए बोलने के लिए, खरोंच से।
निश्चित रूप से सभी जानते हैं कि आज हैंसंदर्भ मूल्यों के आधार पर किसी भी मात्रा को मापने के लिए विशेष प्रणाली। उदाहरण के लिए, दूरी और समान मात्रा के लिए, ये मीटर हैं, द्रव्यमान और वजन के लिए - किलोग्राम, समय अंतराल के लिए - सेकंड, आदि।
लेकिन आप टेक्स्ट वॉल्यूम के संदर्भ में जानकारी को कैसे मापते हैं? इसके लिए वर्णमाला की कार्डिनैलिटी की अवधारणा पेश की गई थी।
वर्णमाला की कार्डिनैलिटी क्या है: प्रारंभिक अवधारणा
इसलिए, यदि आप आम तौर पर स्वीकृत नियम का पालन करते हैं किकिसी भी मात्रा का अंतिम मान एक पैरामीटर है जो यह निर्धारित करता है कि मापी गई मात्रा में संदर्भ इकाई कितनी बार खड़ी है, हम निष्कर्ष निकाल सकते हैं: वर्णमाला की शक्ति किसी विशेष भाषा के लिए उपयोग किए जाने वाले वर्णों की कुल संख्या है।
इसे स्पष्ट करने के लिए, आइए इस प्रश्न को छोड़ दें कि कैसेसूचना प्रौद्योगिकी के दृष्टिकोण से, एक तरफ, वर्णमाला की शक्ति को कैसे खोजें, और प्रतीकों पर स्वयं ध्यान दें। मोटे तौर पर, प्रयुक्त प्रतीकों की पूरी सूची में अक्षर, संख्याएं, सभी प्रकार के कोष्ठक, विशेष वर्ण, विराम चिह्न आदि शामिल हैं। हालाँकि, यदि हम इस प्रश्न पर पहुँचते हैं कि कम्प्यूटरीकृत तरीके से वर्णमाला की शक्ति क्या है, तो हमें एक स्थान (शब्दों या अन्य वर्णों के बीच एक एकल अंतर) को भी शामिल करना चाहिए।
आइए रूसी भाषा को एक उदाहरण के रूप में लें, या यों कहें,कीबोर्ड विन्यास। उपरोक्त के आधार पर, पूरी सूची में 33 अक्षर, 10 अंक और 11 विशेष वर्ण हैं। इस प्रकार, वर्णमाला की कुल कार्डिनैलिटी 54 है।
पात्रों का सूचनात्मक भार
हालांकि, वर्णमाला की शक्ति की सामान्य अवधारणा अक्षरों, संख्याओं और प्रतीकों वाले पाठ की सूचना मात्रा की गणना का सार निर्धारित नहीं करती है। इसके लिए एक विशेष दृष्टिकोण की आवश्यकता है।
सिद्धांत रूप में, इसके बारे में सोचें, ठीक है, यह ऐसा हो सकता हैकंप्यूटर सिस्टम की दृष्टि से न्यूनतम सेट, इसमें कितने वर्ण हो सकते हैं? उत्तर: दो। और यही कारण है। तथ्य यह है कि प्रत्येक प्रतीक, चाहे वह अक्षर हो या संख्या, का अपना सूचनात्मक भार होता है, जिसके अनुसार मशीन पहचानती है कि उसके सामने क्या है। लेकिन कंप्यूटर केवल एक और शून्य के रूप में प्रतिनिधित्व को समझता है, जिस पर, वास्तव में, सभी सूचना विज्ञान आधारित हैं।
इस प्रकार, किसी भी प्रतीक को में दर्शाया जा सकता हैक्रमांक 1 और 0 वाले अनुक्रमों के रूप में, अर्थात्, एक अक्षर, संख्या या प्रतीक को दर्शाने वाले न्यूनतम अनुक्रम में दो घटक होते हैं।
एक मानक सूचना इकाई के रूप में ली गई सूचना भार को ही बिट (1 बिट) कहा जाता है। तदनुसार, 8 बिट 1 बाइट हैं।
द्विआधारी चरित्र प्रतिनिधित्व
तो, वर्णमाला की शक्ति क्या है, मुझे लगता है, पहले से हीथोड़ा स्पष्ट। अब आइए एक और पहलू को देखें, विशेष रूप से, बाइनरी कोड का उपयोग करके शक्ति का व्यावहारिक प्रतिनिधित्व। एक उदाहरण के रूप में, आइए सरलता के लिए केवल 4 वर्णों के साथ एक वर्णमाला लें।
दो अंकों के बाइनरी कोड में, अनुक्रम और उनके सूचनात्मक प्रतिनिधित्व को निम्नानुसार वर्णित किया जा सकता है:
क्रमांक | 1 | 2 | 3 | 4 |
बाइनरी कोड | 00 | 01 | 10 | 11 |
इसलिए - सबसे सरल निष्कर्ष: अक्षर N = 4 की शक्ति के साथ, एक वर्ण का वजन 2 बिट है।
यदि आप वर्णमाला के लिए तीन अंकों के बाइनरी कोड का उपयोग करते हैं, उदाहरण के लिए, 8 वर्णों के साथ, संयोजनों की संख्या इस प्रकार होगी:
क्रमांक | 1 | 2 | 3 | 4 | 5 वीं | 6 | 7 | 8 |
बाइनरी कोड | 000 | 001 | 010 | 011 | 100 | 101 | 110 | 111 |
दूसरे शब्दों में, वर्णमाला N = 8 की शक्ति के साथ, तीन अंकों के बाइनरी कोड के लिए एक वर्ण का वजन 3 बिट होगा।
वर्णमाला की शक्ति का पता कैसे लगाएं और कंप्यूटर अभिव्यक्ति में इसका उपयोग कैसे करें
आइए अब निर्भरता को देखने का प्रयास करें,जो कोड में वर्णों की संख्या और वर्णमाला की कार्डिनैलिटी को व्यक्त करता है। सूत्र, जहां एन वर्णमाला की वर्णानुक्रमिक कार्डिनैलिटी है, और बी बाइनरी कोड में वर्णों की संख्या है, इस तरह दिखेगा:
एन = 2ख
यानी 21= 2, 22= 4, 23= 8, 24= 16, आदि। मोटे तौर पर, बाइनरी कोड के वर्णों की आवश्यक संख्या ही प्रतीक का भार है। सूचना के संदर्भ में, यह इस तरह दिखता है:
वर्णमाला की शक्ति, N | 2 | 4 | 8 | 16 |
कोड वर्णों की संख्या, b | 1 बिट | 2 बिट | 3 बिट्स | 4 बिट |
सूचना मात्रा का मापन
हालाँकि, ये सबसे सरल उदाहरण थे, इसलिए बोलने के लिए, प्रारंभिक समझ के लिए कि वर्णमाला की शक्ति क्या है। चलिए सीधे अभ्यास पर चलते हैं।
इस स्तर पर कंप्यूटर प्रौद्योगिकी के विकास मेंटाइपिंग, अपरकेस, अपरकेस और लोअरकेस अक्षरों, सिरिलिक और लैटिन अक्षरों, विराम चिह्नों, कोष्ठकों, अंकगणितीय संकेतों आदि को ध्यान में रखते हुए। 256 वर्णों का प्रयोग किया गया है। इस तथ्य के आधार पर कि 256 2 . है8, यह अनुमान लगाना आसान है कि ऐसी वर्णमाला में प्रत्येक वर्ण का वजन 8, यानी 8 बिट या 1 बाइट है।
सभी ज्ञात मापदंडों के आधार पर, कोई भी कर सकता हैकिसी भी पाठ की सूचना मात्रा का मूल्य आसानी से प्राप्त करें जिसकी हमें आवश्यकता है। उदाहरण के लिए, हमारे पास एक कंप्यूटर टेक्स्ट है जिसमें 30 पृष्ठ हैं। एक पृष्ठ में रिक्त स्थान सहित ६० वर्णों या प्रतीकों की ५० पंक्तियाँ हैं।
इस प्रकार, एक पृष्ठ में ५० x . होगा६० = ३,००० बाइट्स की जानकारी, और संपूर्ण पाठ ३,००० x ५० = १५०,००० बाइट्स है। जैसा कि आप देख सकते हैं, छोटे पाठ भी बाइट्स में मापने के लिए असुविधाजनक हैं। पूरे पुस्तकालयों के बारे में क्या?
इस मामले में, वॉल्यूम को अधिक शक्तिशाली मात्रा में परिवर्तित करना बेहतर है - किलोबाइट्स, मेगाबाइट्स, गीगाबाइट्स, आदि। इस तथ्य के आधार पर कि, उदाहरण के लिए, 1 किलोबाइट 1024 बाइट्स (2 .) के बराबर है10), और मेगाबाइट - 210 किलोबाइट (1024 किलोबाइट), गणना करने में आसान,कि हमारे उदाहरण के लिए सूचनात्मक और गणितीय शब्दों में पाठ की मात्रा १५०,००० / १०२४ = १४६.४८४३७५ किलोबाइट, या लगभग ०.१४३०५ मेगाबाइट होगी।
आफ्टरग्लो के बजाय
सामान्य तौर पर, यह संक्षेप में है और वह सब कुछ जो चिंता का विषय हैयह देखते हुए कि वर्णमाला की शक्ति क्या है। यह जोड़ना बाकी है कि इस विवरण में विशुद्ध रूप से गणितीय दृष्टिकोण का उपयोग किया गया था। यह बिना कहे चला जाता है कि इस मामले में पाठ के शब्दार्थ भार को ध्यान में नहीं रखा गया है।
लेकिन, अगर हम विचार के मुद्दों को ठीक से देखेंऐसी स्थिति से जो किसी व्यक्ति को समझने के लिए कुछ देता है, इस संबंध में अर्थहीन संयोजनों या प्रतीकों के अनुक्रमों का एक सेट शून्य सूचना भार होगा, हालांकि, सूचना मात्रा की अवधारणा के दृष्टिकोण से, परिणाम की गणना अभी भी की जा सकती है।
सामान्य तौर पर, वर्णमाला की शक्ति के बारे में ज्ञान औरसंबंधित अवधारणाओं को समझना इतना कठिन नहीं है और इसे व्यावहारिक क्रियाओं के अर्थ में प्राथमिक रूप से लागू किया जा सकता है। इसके अलावा, किसी भी उपयोगकर्ता को लगभग हर दिन इसका सामना करना पड़ता है। यह एक उदाहरण के रूप में लोकप्रिय वर्ड एडिटर या समान स्तर के किसी अन्य को उद्धृत करने के लिए पर्याप्त है जो इस तरह की प्रणाली का उपयोग करता है। लेकिन इसे नियमित नोटपैड के साथ भ्रमित न करें। यहां वर्णमाला की शक्ति कम है, क्योंकि टाइप करते समय हम बड़े अक्षरों का प्रयोग नहीं करते हैं।