/ / ASCII (정보 교환을위한 미국 표준 코드) 인코딩-라틴어의 기본 텍스트 인코딩

ASCII (정보 교환을위한 미국 표준 코드) 인코딩-기본 라틴 텍스트 인코딩

국제 전기 통신 연합에 따르면2016 년에는 35 억 명의 사람들이 일정한 규칙으로 인터넷을 사용했습니다. 대부분의 사람들은 모든 종류의 모니터에 표시되는 텍스트뿐만 아니라 PC 나 모바일 장치를 통해 보낸 메시지가 실제로 0과 1의 조합이라는 사실에 대해 생각조차하지 않습니다. 이러한 정보 표시를 인코딩이라고합니다. . 저장, 처리 및 전송을 제공하고 매우 용이하게합니다. 1963 년에 미국 ASCII 인코딩이 개발되었으며,이 문서를 다룹니다.

ASCII 인코딩

컴퓨터에서 정보 표시

전자 컴퓨팅의 관점에서기계 텍스트는 개별 문자의 모음입니다. 여기에는 대문자를 포함한 문자뿐만 아니라 구두점과 숫자도 포함됩니다. 또한 특수 문자 "=", "&", "("및 공백이 사용됩니다.

텍스트를 구성하는 문자 세트,알파벳이라고하며 숫자를 거듭 제곱 (N으로 표시)이라고합니다. 이를 결정하기 위해 표현식 N = 2 ^ b가 사용됩니다. 여기서 b는 특정 문자의 정보 가중치 또는 비트 수입니다.

256 자 용량의 알파벳이 필요한 모든 문자를 나타낼 수 있음이 입증되었습니다.

256은 2의 8 제곱이므로 각 문자의 가중치는 8 비트입니다.

8 비트 측정 단위를 1 바이트라고하므로 컴퓨터에 저장된 텍스트의 모든 문자에 대한 이진 코드는 1 바이트의 메모리를 차지한다고 말하는 것이 일반적입니다.

ASCII 인코딩 테이블

코딩은 어떻게 이루어지고 있습니까?

모든 텍스트는 개인의 기억에 입력됩니다.숫자, 문자, 문장 부호 및 기타 기호로 쓰여진 키보드 키를 사용하는 컴퓨터. 그것들은 바이너리 코드로 RAM으로 전송됩니다.

바이트 문자 인코딩은텍스트 처리를 수행하는 프로세서는 각 문자에 개별적으로 액세스합니다. 동시에 256 자이면 모든 문자 정보를 나타낼 수 있습니다.

ASCII 텍스트 인코딩

ASCII 문자 인코딩

영어로 된이 약어는 정보 교환을위한 미국 표준 코드를 나타냅니다.

컴퓨터 화의 여명기에도정보를 인코딩하는 다양한 방법을 생각할 수 있습니다. 그러나 한 컴퓨터에서 다른 컴퓨터로 정보를 전송하려면 단일 표준을 개발해야했습니다. 그래서 1963 년에 ASCII 인코딩 테이블이 미국에 등장했습니다. 그 안에 컴퓨터 알파벳의 모든 기호는 이진 표현의 서수와 연결됩니다. 처음에는 ASCII가 미국에서만 사용되었으며 나중에 PC의 국제 표준이되었습니다.

표 내용

ASCII 코드는 두 부분으로 나뉩니다. 이 표의 전반부 만 국제 표준으로 간주됩니다. 여기에는 0 (00000000으로 인코딩 됨)에서 127 (코드 01111111)까지의 서수를 가진 문자가 포함됩니다.

일련 번호

ASCII 텍스트 인코딩

상징

0 - 31

0000 0000 - 0001 1111

N이 0에서 31 사이 인 문자를 제어 문자라고합니다. 그들의 기능은 모니터 또는 인쇄 장치에 텍스트를 표시하는 과정을 "안내"하고 소리 신호를 제공하는 것입니다.

32 - 127

0010 0000 - 0111 1111

32에서 127 사이의 N 문자 (표준 부품표)-라틴 알파벳의 대문자와 소문자, 10 자리 숫자, 구두점, 다양한 괄호, 상업 및 기타 기호. 문자 32는 공백을 나타냅니다.

128 - 255

1000 0000 - 1111 1111

128에서 255 사이의 문자 N (대체 부분테이블 또는 코드 페이지)에는 각각 고유 한 번호가있는 다른 옵션이있을 수 있습니다. 코드 페이지는 라틴어와 다른 국가 알파벳을 지정하는 데 사용됩니다. 특히 러시아어 문자에 대한 ASCII 인코딩이 수행되는 것은 도움이됩니다.

인코딩 테이블에서 대문자와 소문자는 알파벳 순서로 서로 이어지고 숫자는 오름차순으로 표시됩니다. 이 원칙은 러시아 알파벳에도 적용됩니다.

제어 문자

ASCII 인코딩 테이블은 원래 생성되었습니다.텔레타이프와 같이 오랫동안 사용되지 않은 장치에 대한 정보를 수신하고 전송하기위한 것입니다. 이와 관련하여 인쇄 할 수없는 문자가이 장치를 제어하는 ​​명령으로 사용되는 문자 집합에 포함되었습니다. 유사한 명령이 모스 부호 등과 같은 컴퓨터 이전 메시징 방법에 사용되었습니다.

가장 일반적인 TTY 문자는 NUL (00, "zero")입니다. 오늘날까지 대부분의 프로그래밍 언어에서 여전히 사용되며 줄 종결자를 나타냅니다.

ASCII 인코딩 된 각 문자

ASCII가 사용되는 곳

미국 표준 코드는뿐만 아니라키보드에서 텍스트 정보를 입력합니다. 그래픽에서도 사용됩니다. 특히 ASCII Art Maker에서 다양한 확장 이미지는 ASCII 문자의 스펙트럼을 나타냅니다.

이러한 제품은 두 가지 유형이 있습니다.이미지를 텍스트로 변환하고 "그림"을 ASCII 그래픽으로 변환하여 그래픽 편집기의 기능을 수행합니다. 예를 들어, 유명한 이모티콘은 인코딩 문자의 대표적인 예입니다.

HTML 문서를 만들 때 ASCII를 사용할 수도 있습니다. 이 경우 특정 문자 집합을 입력 할 수 있으며 페이지를 볼 때이 코드에 해당하는 문자가 화면에 나타납니다.

특정 국가 별 표에 포함되지 않은 문자는 ASCII 코드로 대체되기 때문에 ASCII는 다국어 사이트 생성에도 필요합니다.

ASCII 인코딩으로 텍스트 정보를 인코딩하려면

일부 기능

텍스트 정보를 ASCII 인코딩으로 인코딩하기 위해 원래 7 비트가 사용되었지만 (하나는 비어 있음) 현재는 8 비트로 작동합니다.

위쪽 및 아래쪽 열의 문자는 단 하나의 비트 만 서로 다릅니다. 이렇게하면 검사의 복잡성이 크게 줄어 듭니다.

Microsoft Office에서 ASCII 적용

필요한 경우 이러한 종류의 텍스트 인코딩정보는 메모장 및 Office Word와 같은 Microsoft 텍스트 편집기에서 사용할 수 있습니다. 단,이 경우 입력시 일부 기능을 사용할 수 없습니다. 예를 들어 ASCII는 일반적인 모양과 모양을 무시하고 정보의 의미 만 유지하므로 굵게 표시 할 수 없습니다.

ASCII 인코딩 러시아어 문자

표준화

ISO는 ISO 8859 표준을 채택했습니다.이 그룹은 다른 언어 그룹에 대한 8 비트 인코딩을 정의합니다. 특히 ISO 8859-1은 미국 및 서유럽 국가에 대한 표인 확장 ASCII입니다. 그리고 ISO 8859-5는 러시아어를 포함하여 키릴 문자에 사용되는 표입니다.

여러 역사적 이유로 ISO 8859-5는 매우 짧은 시간 동안 사용되었습니다.

러시아어의 경우 현재 인코딩이 실제로 사용됩니다.

  • CP866 (코드 페이지 866) 또는 DOS, 대체 GOST 인코딩이라고도합니다. 지난 세기의 90 년대 중반까지 활발하게 사용되었습니다. 현재로서는 실제로 사용되지 않습니다.
  • KOI-8. 인코딩은 1970 년대와 80 년대에 개발되었으며현재는 Runet의 메일 메시지에 대해 일반적으로 허용되는 표준입니다. Linux를 포함한 Unix 운영 체제에서 널리 사용됩니다. KOI-8의 "러시아어"버전을 KOI-8R이라고합니다. 또한 우크라이나어와 같은 다른 키릴 어 버전도 있습니다.
  • 코드 페이지 1251 (CP 1251, Windows-1251). Windows에서 러시아어 지원을 제공하기 위해 Microsoft에서 개발했습니다.

최초의 표준 CP866의 주요 장점확장 ASCII에서와 동일한 위치에 의사 그래픽 문자를 유지했습니다. 이를 통해 잘 알려진 Norton Commander와 같은 외국에서 만든 텍스트 프로그램을 수정하지 않고 실행할 수 있습니다. 현재 CP866은 FAR Manager를 포함하여 전체 화면 텍스트 모드 또는 텍스트 창에서 작동하는 Windows에서 개발 된 프로그램에 사용됩니다.

CP866 인코딩으로 작성된 컴퓨터 텍스트는 최근에 매우 드물지만 Windows에서 러시아어 파일 이름에 사용되는 것은 바로이 인코딩입니다.

"유니 코드"

현재 가장 널리 퍼진정확히이 인코딩을 받았습니다. 유니 코드 코드는 영역으로 나뉩니다. 첫 번째 (U + 0000 ~ U + 007F)에는 코드가있는 ASCII 문자가 포함됩니다. 그 다음에는 문장 부호 및 기술 기호뿐만 아니라 다양한 국가 문자의 기호 영역이 이어집니다. 또한 일부 "유니 코드"코드는 향후 새 문자를 포함해야하는 경우를 대비하여 예약됩니다.

ASCII 문자 인코딩

이제 ASCII에서 각각문자는 8 개의 0과 1의 조합으로 표시됩니다. 비전문가에게는이 정보가 불필요하고 흥미롭지 않은 것처럼 보일 수 있지만 PC의 "뇌에서"무슨 일이 일어나고 있는지 알고 싶지 않습니까?!