/ / पाठ के साथ काम करें। किसी फ़ाइल के एन्कोडिंग का निर्धारण कैसे करें

पाठ के साथ काम करें। किसी फ़ाइल की एन्कोडिंग का निर्धारण कैसे करें

आइए जानें कि फाइल एन्कोडिंग क्या है।सीधे शब्दों में कहें, एक एन्कोडिंग बाइट वर्णों का एक समूह है जो किसी विशेष भाषा में वर्णमाला वर्णमाला के अनुरूप होता है। प्रत्येक भाषा में ऐसे कोडिंग वर्णों का अपना विशिष्ट क्रम होता है। कभी-कभी एन्कोडिंग निर्धारित करने की आवश्यकता होती है। आइए इस पर एक टेक्स्ट दस्तावेज़ के उदाहरण पर विचार करें।

तुम्हे क्या चाहिए

विशिष्ट सॉफ्टवेयर टूल्स का एक संग्रह। एक शुरुआत के लिए, पर्याप्त एप्लिकेशन जैसे शब्द, KWrite, Firefox ब्राउज़र और पहचान उपकरण - एनसीए.

आप यूनिवर्सल एडिटर माइक्रोसॉफ्ट वर्ड का उपयोग करके फ़ाइल एन्कोडिंग निर्धारित कर सकते हैं। सबसे पहले, आपको इसे पैकेज से इंस्टॉल करना होगा कार्यालय। जब एप्लिकेशन इंस्टॉल हो जाए और डेस्कटॉप पर W आइकन का उपयोग करके खोला जा सके, तो अगले चरण पर आगे बढ़ें।

मान्यता का अगला चरण

एप्लिकेशन के नेविगेशन पैनल के माध्यम से बदले में "फ़ाइल" - "खोलें" आइटम खोलें। कीबोर्ड शॉर्टकट का उपयोग करके भी ऐसा ही किया जा सकता है Ctrl + ओ.

फिर, संवाद बॉक्स में, वांछित निर्देशिका और वास्तव में, पढ़ने के लिए फ़ाइल का चयन करें। माउस से इसे चुनने के बाद, "ओपन" बटन पर क्लिक करें।

जब किसी फ़ाइल का मिलान सेट नहीं होता है CP1251, एप्लिकेशन अपने आप निर्धारित करने का प्रयास करता हैएन्कोडिंग। संभावित मैचों की एक सूची प्रदर्शित की जाएगी। सूची के दाईं ओर प्रस्तावित वर्ण सेट में, किसी एक एन्कोडिंग का चयन करें। यदि चयन सही है, तो मान्यता प्राप्त पाठ नमूना तत्व में प्रदर्शित किया जाएगा।

KWrite के साथ एन्कोडिंग का पता कैसे लगाएं

वर्ड प्रोसेसिंग, वर्ड के लिए प्रीप्रोसेसर के अलावा, अन्य कार्यात्मक उपयोगिताओं हैं। उनमें से एक - केराइट (यूनिक्स सिस्टम के लिए एनालॉग)। ताकि आप भ्रमित न हों, मैं बिंदु से बिंदु "KWrite में दस्तावेज़ के एन्कोडिंग का निर्धारण" कार्य का वर्णन करूंगा।

  1. एप्लिकेशन में एक .txt फ़ाइल लोड हो रही है।
  2. उनमें से एक उपयुक्त होने तक एन्कोडिंग की गणना।
  3. चरण 2 करने के लिए, एन्कोडिंग मेनू में टूल विकल्प पर जाएं।

मोज़िला फ़ायरफ़ॉक्स ब्राउज़र, उद्देश्य एक ही है - एन्कोडिंग निर्धारित करने के लिए

सिद्धांत पाठ के साथ काम करने के लिए उपयोगिताओं के समान ही है। हम निष्पादन के लिए इंस्टॉल किए गए ब्राउज़र को लॉन्च करते हैं, और यदि यह इंस्टॉल नहीं है, तो इंस्टॉलर को mozilla.org से डाउनलोड करें।

फिर, ओपन प्रोग्राम विंडो में, आपको खोलने की जरूरत है"फ़ाइल" मेनू के माध्यम से एक पाठ दस्तावेज़, "फ़ाइल खोलें" सबमेनू। यदि चयनित फ़ाइल विरूपण के बिना प्रदर्शित होती है और पाठ पठनीय है, तो एन्कोडिंग को निर्धारित करना मुश्किल नहीं होगा।

ऐसा करने के लिए, "व्यू" - "एन्कोडिंग" पर जाएं, वर्णों के कई सेट प्रदर्शित होते हैं, और जिसके विपरीत "चेक मार्क" होता है वह ब्राउज़र द्वारा परिभाषित एन्कोडिंग होता है।

यदि पाठ सही ढंग से पहचाना नहीं गया था, तो "उन्नत" उपखंड का चयन करें, उसमें एन्कोडिंग के साथ प्रयोग करें, या "स्वतः" मान का चयन करें।

विशिष्ट सॉफ्टवेयर - एनका के साथ काम करना

ऐसे कई इलेक्ट्रॉनिक उपकरण भी हैं जो बिना स्वरूपित पाठ के एन्कोडिंग को निर्धारित करना संभव बनाते हैं।

उन लोगों के लिए जो यूनिक्स के तहत काम करने के आदी हैं,एनका उपयोगिता। इसे पैकेज मैनेजर सेवा का उपयोग करके स्थापित किया जा सकता है। एक बार जब आपको एक उपलब्ध पैकेज श्रेणी मिल जाए, तो आप सॉफ़्टवेयर स्थापित करना शुरू कर सकते हैं।

मान्यता भाषाओं की सूची प्रदर्शित करने के लिए, टर्मिनल का उपयोग करके enca --list भाषाएँ कमांड चलाएँ।

यदि आपको (g) कुंजी के बाद किसी पाठ फ़ाइल की एन्कोडिंग निर्धारित करने की आवश्यकता है, तो उसका नाम दर्ज करें, और (L) विकल्प के बाद, लगभग उसी तरह से पहचान भाषा दर्ज करें:

enca -L रूसी -g /home/vic/temp/myfile.txt.

आइए संक्षेप में बताएं कि एन्कोडिंग के बारे में क्या कहा गया है

मुझे विश्वास है कि उपरोक्त उपयोगिताओं उपयोगकर्ता के लिए टेक्स्ट दस्तावेज़ों को डीकोड करने के लिए उपकरणों का पर्याप्त सेट बन जाएंगी।

अब तक, वास्तव में, यह सब इस बारे में है कि कैसे पहचाना जाएएन्कोडिंग। मानक उद्देश्यों के लिए, मुझे लगता है कि निर्दिष्ट सॉफ़्टवेयर ठीक है। निर्धारण के लिए और अधिक विशिष्ट तरीके हैं, लेकिन उनका विचार इस लेख के दायरे से बाहर है।

Microsoft Word के लिए, मान्यता का स्रोत सरल पाठ और जटिल स्वरूपण वाला दस्तावेज़ दोनों हो सकता है।