ทำงานกับข้อความ วิธีตรวจสอบการเข้ารหัสไฟล์

มาดูกันว่าการเข้ารหัสไฟล์คืออะไรพูดง่ายๆคือการเข้ารหัสคือชุดของอักขระไบต์ที่สอดคล้องกับตัวอักษรในภาษาใดภาษาหนึ่ง แต่ละภาษามีลำดับเฉพาะของอักขระการเข้ารหัสดังกล่าว บางครั้งมีความจำเป็นในการกำหนดการเข้ารหัส ลองพิจารณาสิ่งนี้โดยใช้ตัวอย่างของเอกสารข้อความ

อะไรที่คุณต้องการ

ชุดเครื่องมือซอฟต์แวร์เฉพาะ สำหรับการเริ่มต้นแอปพลิเคชั่นที่เพียงพอเช่น คำ, KWrite, เบราว์เซอร์ Firefox และเครื่องมือจดจำ - enca.

คุณสามารถกำหนดการเข้ารหัสไฟล์โดยใช้โปรแกรมแก้ไขสากล Microsoft Word ขั้นแรกคุณต้องติดตั้งจากแพ็คเกจ สำนักงาน. เมื่อติดตั้งแอปพลิเคชันแล้วและสามารถเปิดได้โดยใช้ไอคอน W บนเดสก์ท็อปให้ดำเนินการในขั้นตอนต่อไป

ขั้นตอนต่อไปของการรับรู้

เปิดรายการ "ไฟล์" - "เปิด" ผ่านแผงการนำทางของแอปพลิเคชัน สามารถทำได้โดยใช้แป้นพิมพ์ลัด Ctrl + O.

จากนั้นในกล่องโต้ตอบให้เลือกไดเร็กทอรีที่ต้องการและในความเป็นจริงไฟล์ที่จะอ่าน เมื่อเลือกด้วยเมาส์แล้วให้คลิกปุ่ม "เปิด"

เมื่อไฟล์ไม่มีชุดการจับคู่ CP1251แอปพลิเคชันพยายามตรวจสอบด้วยตัวเองการเข้ารหัส รายการการแข่งขันที่เป็นไปได้จะปรากฏขึ้น ในชุดอักขระที่แนะนำทางด้านขวาของรายการให้เลือกหนึ่งในการเข้ารหัส หากการเลือกถูกต้องข้อความที่รู้จักจะแสดงในองค์ประกอบตัวอย่าง

วิธีกำหนดการเข้ารหัสด้วย KWrite

นอกจากตัวประมวลผลล่วงหน้าสำหรับการประมวลผลคำแล้ว Word ยังมียูทิลิตี้การทำงานอื่น ๆ หนึ่งในนั้น - KWrite (อะนาล็อกสำหรับระบบยูนิกซ์) เพื่อไม่ให้คุณสับสนฉันจะอธิบายงาน "กำหนดการเข้ารหัสของเอกสารใน KWrite" ทีละจุด

  1. การโหลดไฟล์. txt ลงในแอปพลิเคชัน
  2. การแจงนับการเข้ารหัสจนกว่าหนึ่งในนั้นจะเหมาะสม
  3. ในการดำเนินการขั้นตอนที่ 2 ไปที่ตัวเลือกเครื่องมือในเมนูการเข้ารหัส

เบราว์เซอร์ Mozilla Firefox จุดประสงค์เหมือนกัน - เพื่อกำหนดการเข้ารหัส

หลักการจะเหมือนกับในยูทิลิตี้สำหรับการทำงานกับข้อความ เราเปิดตัวเบราว์เซอร์ที่ติดตั้งเพื่อเรียกใช้งานและหากยังไม่ได้ติดตั้งให้ดาวน์โหลดตัวติดตั้งจาก mozilla.org

จากนั้นในหน้าต่างโปรแกรมที่เปิดอยู่คุณจะต้องเปิดเอกสารข้อความผ่านเมนู "ไฟล์" เมนูย่อย "เปิดไฟล์" หากไฟล์ที่เลือกแสดงโดยไม่มีความผิดเพี้ยนและข้อความสามารถอ่านได้การระบุการเข้ารหัสจะไม่ยาก

ในการดำเนินการนี้ให้ไปที่ "View" - "encoding" จะมีชุดอักขระแสดงขึ้นหลายชุดและอีกชุดหนึ่งที่อยู่ตรงข้ามกับ "เครื่องหมายถูก" คือการเข้ารหัสที่กำหนดโดยเบราว์เซอร์

หากระบบจำข้อความไม่ถูกต้องให้เลือกส่วนย่อย "ขั้นสูง" ทดลองด้วยการเข้ารหัสหรือเลือกค่า "อัตโนมัติ"

ซอฟต์แวร์เฉพาะทาง - ทำงานกับ enca

นอกจากนี้ยังมีอุปกรณ์ช่วยอิเล็กทรอนิกส์หลายอย่างที่ทำให้สามารถกำหนดการเข้ารหัสข้อความที่ไม่ได้จัดรูปแบบ

สำหรับผู้ที่คุ้นเคยกับการทำงานภายใต้ยูนิกซ์ไฟล์ยูทิลิตี้ enca สามารถติดตั้งได้โดยใช้บริการ Package Manager เมื่อคุณพบหมวดหมู่แพ็กเกจที่พร้อมใช้งานคุณสามารถเริ่มติดตั้งซอฟต์แวร์ได้

ในการแสดงรายการภาษาสำหรับการจดจำให้รันคำสั่ง enca --list languages ​​โดยใช้เทอร์มินัล

หากคุณต้องการกำหนดการเข้ารหัสของไฟล์ข้อความหลังปุ่ม (g) ให้ป้อนชื่อและหลังจากตัวเลือก (L) ให้ป้อนภาษาการจดจำในลักษณะเดียวกันโดยประมาณ:

enca -L รัสเซีย -g /home/vic/temp/myfile.txt

มาสรุปสิ่งที่ได้รับการกล่าวถึงเกี่ยวกับการเข้ารหัส

ฉันเชื่อว่ายูทิลิตี้ข้างต้นจะกลายเป็นชุดเครื่องมือที่เพียงพอสำหรับผู้ใช้ในการถอดรหัสเอกสารข้อความ

ที่จริงแล้วทุกอย่างเกี่ยวกับวิธีการรับรู้การเข้ารหัส สำหรับวัตถุประสงค์มาตรฐานฉันคิดว่าซอฟต์แวร์ที่ระบุนั้นใช้ได้ มีวิธีการตรวจจับเฉพาะทางมากกว่า แต่การพิจารณาอยู่นอกเหนือขอบเขตของบทความนี้

สำหรับ Microsoft Word แหล่งที่มาของการจดจำอาจเป็นข้อความธรรมดาหรือเอกสารที่มีการจัดรูปแบบที่ซับซ้อน