Fatos cognitivos sobre tudo / Computadores / Codificação ASCII (código padrão americano para intercâmbio de informações) - codificação de texto básica para o latim

Codificação ASCII (código padrão americano para intercâmbio de informações) - codificação de texto básica para o latim

De acordo com a União Internacional de Telecomunicações, emEm 2016, três bilhões e meio de pessoas usaram a Internet com certa regularidade. A maioria deles nem pensa no fato de que quaisquer mensagens enviadas por eles através de PCs ou dispositivos móveis, bem como textos que são exibidos em todos os tipos de monitores, são na verdade combinações de 0 e 1. Essa apresentação de informações é chamada de codificação . Ele fornece e facilita muito seu armazenamento, processamento e transmissão. Em 1963, foi desenvolvida a codificação ASCII americana, à qual este artigo é dedicado.

Apresentação de informações em um computador

Do ponto de vista de qualquer computação eletrônicao texto da máquina é uma coleção de caracteres individuais. Isso inclui não apenas letras, incluindo letras maiúsculas, mas também sinais de pontuação e números. Além disso, são usados os caracteres especiais "=", "&", "(" e espaços.

O conjunto de caracteres que compõem o texto,é chamado de alfabeto e seu número é chamado de potência (denotado como N). Para defini-lo, a expressão N = 2 ^ b é usada, onde b é o número de bits ou o peso informativo de um determinado caractere.

Está provado que um alfabeto com capacidade de 256 caracteres permite representar todos os caracteres necessários.

Como 256 é a oitava potência de dois, o peso de cada caractere é de 8 bits.

A unidade de medida de 8 bits é chamada de 1 byte, por isso é comum dizer que o código binário de qualquer caractere do texto armazenado no computador ocupa um byte de memória.

Como a codificação é feita

Todos os textos são inseridos na memória do pessoalcomputador por meio de teclas de teclado nas quais são escritos números, letras, sinais de pontuação e outros símbolos. Eles são transferidos para a RAM em um código binário, ou seja, cada caractere está associado a um código decimal familiar a uma pessoa, de 0 a 255, que corresponde a um código binário - de 00000000 a 11111111.

A codificação de caracteres de byte permiteo processador que executa o processamento do texto refere-se a cada caractere separadamente. Ao mesmo tempo, 256 caracteres são suficientes para representar qualquer informação de caractere.

Codificação de caracteres ASCII

Esta abreviatura em inglês significa código padrão americano para intercâmbio de informações.

Mesmo no início da informatização, tornou-se óbvio quevocê pode pensar em uma ampla variedade de maneiras de codificar informações. No entanto, para transferir informações de um computador para outro, era necessário desenvolver um único padrão. Então, em 1963, uma tabela de codificação ASCII apareceu nos Estados Unidos. Nele, qualquer símbolo do alfabeto do computador está associado ao seu número ordinal na representação binária. Inicialmente, o ASCII era usado apenas nos Estados Unidos e mais tarde se tornou o padrão internacional para PCs.

Conteúdo da tabela

Os códigos ASCII são divididos em 2 partes. Apenas a primeira metade desta tabela é considerada uma Norma Internacional. Inclui caracteres com números ordinais de 0 (codificados como 00000000) a 127 (código 01111111).

Número de série N	Codificação de texto ASCII	Símbolo
0 - 31	0000 0000 - 0001 1111	Os caracteres com N de 0 a 31 são chamados de caracteres de controle. Sua função é "guiar" o processo de exibição de texto em um monitor ou dispositivo de impressão, emitindo um sinal sonoro, etc.
32 - 127	0010 0000 - 0111 1111	Caracteres com N de 32 a 127 (parte padrãotabelas) - letras maiúsculas e minúsculas do alfabeto latino, números de 10 dígitos, sinais de pontuação, bem como vários colchetes, símbolos comerciais e outros. O personagem 32 denota um espaço.
128 - 255	1000 0000 - 1111 1111	Caracteres N de 128 a 255 (parte alternativatabelas ou página de código) podem ter opções diferentes, cada uma com seu próprio número. A página de código é usada para especificar alfabetos nacionais diferentes do latim. Em particular, é com a sua ajuda que a codificação ASCII para caracteres russos é realizada.

Na tabela de codificação, as letras maiúsculas e minúsculas seguem umas às outras em ordem alfabética e os números - em ordem crescente de valores. Este princípio também se aplica ao alfabeto russo.

Personagens de controle

A tabela de codificação ASCII foi criada originalmentepara receber e transmitir informações em um dispositivo que não tenha sido usado por um longo tempo, como um teletipo. A este respeito, caracteres não imprimíveis foram incluídos no conjunto de caracteres, usados como comandos para controlar este dispositivo. Comandos semelhantes foram usados em métodos de mensagens pré-computador, como código Morse, etc.

O caractere de "teletipo" mais comum é NUL (00, "zero"). Ainda é usado na maioria das linguagens de programação até hoje, denotando um terminador de linha.

Onde ASCII é usado

O Código Padrão Americano é necessário não sópara inserir informações de texto no teclado. Também é usado em gráficos. Especificamente, no ASCII Art Maker, imagens de várias extensões representam um espectro de caracteres ASCII.

Esses produtos são de dois tipos:desempenhando a função de editores gráficos, convertendo imagens em texto e convertendo "imagens" em gráficos ASCII. Por exemplo, o famoso emoticon é um excelente exemplo de um caractere de codificação.

ASCII também pode ser usado ao criar um documento HTML. Neste caso, pode-se inserir um determinado conjunto de caracteres e, ao visualizar a página, aparecerá na tela um caractere correspondente a este código.

O ASCII também é necessário para a criação de sites multilíngues, uma vez que os caracteres que não estão incluídos em uma tabela nacional específica são substituídos por códigos ASCII.

Alguns recursos

Para codificar informações de texto em codificação ASCII, foram usados originalmente 7 bits (um foi deixado vazio), mas hoje funciona como 8 bits.

As letras nas colunas superior e inferior diferem umas das outras por apenas um único bit. Isso reduz muito a complexidade da verificação.

Usando ASCII no Microsoft Office

Se necessário, este tipo de codificação de textoas informações podem ser usadas em editores de texto da Microsoft, como o Bloco de notas e o Office Word. Porém, ao digitar neste caso, não será possível utilizar algumas funções. Por exemplo, você não poderá negrito, pois o ASCII apenas preserva o significado da informação, ignorando sua aparência e forma geral.

estandardização

A ISO adotou os padrões ISO 8859.Este grupo define codificações de oito bits para diferentes grupos de idiomas. Especificamente, ISO 8859-1 é Extended ASCII, que é uma tabela para os Estados Unidos e Europa Ocidental. E ISO 8859-5 é uma tabela usada para o alfabeto cirílico, incluindo o idioma russo.

Por uma série de razões históricas, o padrão ISO 8859-5 está em uso há muito pouco tempo.

Para o idioma russo, no momento, as codificações são realmente usadas:

CP866 (página de código 866) ou DOS, que é freqüentemente referido como a codificação GOST alternativa. Foi usado ativamente até meados dos anos 90 do século passado. No momento, ele praticamente não é usado.
KOI-8. A codificação foi desenvolvida nas décadas de 1970 e 80, eno momento, é um padrão geralmente aceito para mensagens de correio no Runet. É amplamente utilizado no sistema operacional da família Unix, incluindo Linux. A versão "russa" do KOI-8 é chamada de KOI-8R. Além disso, existem versões para outras línguas cirílicas, como o ucraniano.
Página de código 1251 (CP 1251, Windows - 1251). Desenvolvido pela Microsoft para fornecer suporte para o idioma russo no ambiente Windows.

A principal vantagem do primeiro padrão CP866era a preservação de caracteres pseudo-gráficos nas mesmas posições do ASCII estendido. Isso possibilitou a execução sem alterações de programas de texto feitos no exterior, como o conhecido Norton Commander. No momento, o CP866 é usado para programas desenvolvidos em Windows que funcionam em modo de texto em tela cheia ou em janelas de texto, incluindo FAR Manager.

Textos de computador escritos na codificação CP866 são muito raros ultimamente, mas é precisamente essa codificação que é usada para nomes de arquivos russos no Windows.

"Unicode"

Atualmente o mais difundidorecebeu exatamente esta codificação. Os códigos Unicode são divididos em áreas. O primeiro (U + 0000 a U + 007F) inclui caracteres ASCII com códigos. Seguem-se as áreas de sinais de várias escritas nacionais, bem como sinais de pontuação e símbolos técnicos. Além disso, alguns dos códigos "Unicode" são reservados para o caso de haver necessidade de incluir novos caracteres no futuro.

Agora você sabe que em ASCII cadaum caractere é representado como uma combinação de 8 zeros e uns. Para não especialistas, essas informações podem parecer desnecessárias e desinteressantes, mas você não quer saber o que está acontecendo “no cérebro” do seu PC ?!