/ / 텍스트 작업. 파일 인코딩을 결정하는 방법

텍스트 작업. 파일 인코딩을 결정하는 방법

파일 인코딩이 무엇인지 알아 봅시다. 간단히 말해서 인코딩은 특정 언어의 알파벳 문자에 해당하는 바이트 문자 세트입니다. 각 언어에는 이러한 코딩 문자의 고유 한 시퀀스가 ​​있습니다. 때로는 인코딩을 결정해야 할 필요가 있습니다. 텍스트 문서의 예를 사용하여 이것을 고려해 봅시다.

무엇이 필요합니까

특정 소프트웨어 도구 모음입니다. 처음에는 다음과 같은 충분한 응용 프로그램 단어, KWrite, Firefox 브라우저 및 인식 도구- 엥카.

범용 편집기 Microsoft Word를 사용하여 파일 인코딩을 결정할 수 있습니다. 이전에는 패키지에서 설치해야합니다. 사무실. 응용 프로그램이 설치되고 바탕 화면의 W 아이콘을 사용하여 열 수있는 경우 다음 단계로 진행합니다.

인정의 다음 단계

애플리케이션 탐색 패널을 통해 차례로 "파일"- "열기"항목을 엽니 다. 키보드 단축키를 사용하여 동일한 작업을 수행 할 수 있습니다. Ctrl + O.

그런 다음 대화 상자에서 원하는 디렉터리와 실제로 읽을 파일을 선택합니다. 마우스로 선택한 후 "열기"버튼을 클릭합니다.

파일에 일치 세트가없는 경우 CP1251, 응용 프로그램이 스스로 결정하려고합니다.부호화. 가능한 일치 목록이 표시됩니다. 목록 오른쪽의 제안 된 문자 집합에서 인코딩 중 하나를 선택합니다. 선택이 올 바르면 인식 된 텍스트가 샘플 요소에 표시됩니다.

KWrite로 인코딩을 감지하는 방법

워드 프로세싱 용 전처리 기인 Word 외에도 다른 기능 유틸리티가 있습니다. 그들 중 하나 - KWrite (유닉스 시스템 용 아날로그). 혼동하지 않도록 "KWrite에서 문서 인코딩 결정"작업을 하나씩 설명하겠습니다.

  1. .txt 파일을 애플리케이션에로드합니다.
  2. 인코딩 중 하나가 적합 할 때까지 열거합니다.
  3. 2 단계를 수행하려면 인코딩 메뉴의 도구 옵션으로 이동합니다.

Mozilla Firefox 브라우저, 목적은 동일합니다-인코딩을 결정하는 것

원칙은 텍스트 작업을위한 유틸리티와 거의 동일합니다. 실행을 위해 설치된 브라우저를 실행하고 설치되지 않은 경우 mozilla.org에서 설치 프로그램을 다운로드합니다.

그런 다음 열린 프로그램 창에서 열어야합니다."파일"메뉴, "파일 열기"하위 메뉴를 통한 텍스트 문서. 선택한 파일이 왜곡없이 표시되고 텍스트를 읽을 수 있으면 인코딩을 결정하는 것이 어렵지 않습니다.

이렇게하려면 "보기"- "인코딩"으로 이동하면 여러 문자 집합이 표시되고 "확인 표시"가있는 반대쪽은 브라우저에서 정의한 인코딩입니다.

텍스트가 올바르게 인식되지 않으면 "고급"하위 섹션을 선택하거나 인코딩을 실험하거나 "자동"값을 선택하십시오.

전문 소프트웨어-enca와 협력

또한 서식이 지정되지 않은 텍스트의 인코딩을 확인할 수있는 여러 전자 보조 도구가 있습니다.

유닉스에서 작업하는 데 익숙한 사람들을 위해enca 유틸리티. 패키지 관리자 서비스를 사용하여 설치할 수 있습니다. 사용 가능한 패키지 범주를 찾으면 소프트웨어 설치를 시작할 수 있습니다.

인식 언어 목록을 표시하려면 터미널을 사용하여 enca --list languages ​​명령을 실행하십시오.

(g) 키 다음에 텍스트 파일의 인코딩을 결정해야하는 경우 이름을 입력하고 (L) 옵션 뒤에 거의 동일한 방식으로 인식 언어를 입력합니다.

enca -L 러시아어 -g /home/vic/temp/myfile.txt.

인코딩에 대해 말한 내용을 요약 해 보겠습니다.

위의 유틸리티는 사용자가 텍스트 문서를 디코딩하기에 충분한 도구 세트가 될 것이라고 생각합니다.

지금까지 사실은 인식하는 방법에 관한 것입니다.부호화. 표준 목적으로는 지정된 소프트웨어가 괜찮다고 생각합니다. 더 전문화 된 탐지 방법이 있지만 고려 사항은이 기사의 범위를 벗어납니다.

Microsoft Word의 경우 인식 소스는 간단한 텍스트와 복잡한 서식이있는 문서 일 수 있습니다.