Datos cognitivos sobre todo / Computadoras / Codificación ASCII (código estándar americano para el intercambio de información): codificación de texto básica para el alfabeto latino

ASCII (código estándar estadounidense para el intercambio de información): la codificación básica del texto para latín

Según la Unión Internacional de Telecomunicaciones, enEn 2016, tres mil quinientos millones de personas utilizaron Internet con cierta regularidad. La mayoría de ellos ni siquiera piensa en el hecho de que los mensajes enviados por ellos a través de PC o dispositivos móviles, así como los textos que se muestran en todo tipo de monitores, son en realidad combinaciones de 0 y 1. Esta presentación de información se llama codificación. . Proporciona y facilita enormemente su almacenamiento, procesamiento y transmisión. En 1963, se desarrolló la codificación ASCII estadounidense, a la que está dedicado este artículo.

Presentación de información en una computadora

Desde el punto de vista de cualquier informática electrónicaEl texto de máquina es una colección de caracteres individuales. Estos incluyen no solo letras, incluidas letras mayúsculas, sino también signos de puntuación y números. Además, se utilizan caracteres especiales "=", "&", "(" y espacios.

El conjunto de caracteres que componen el texto,se llama alfabeto, y su número se llama potencia (denotado como N). Para definirlo se utiliza la expresión N = 2 ^ b, donde b es el número de bits o el peso informativo de un carácter en particular.

Se ha comprobado que un alfabeto con una capacidad de 256 caracteres puede representar todos los caracteres necesarios.

Dado que 256 es la octava potencia de dos, el peso de cada carácter es de 8 bits.

La unidad de medida de 8 bits se llama 1 byte, por lo que se acostumbra decir que el código binario de cualquier carácter del texto almacenado en la computadora ocupa un byte de memoria.

¿Cómo se hace la codificación?

Cualquier texto se ingresa en la memoria del personal.computadora por medio de teclas del teclado en las que se escriben números, letras, signos de puntuación y otros símbolos. Se transfieren a la RAM en un código binario, es decir, cada carácter está asociado con un código decimal familiar para los humanos, de 0 a 255, que corresponde a un código binario, de 00000000 a 11111111.

La codificación de caracteres byte permiteel procesador que realiza el procesamiento del texto, se refiere a cada carácter por separado. Al mismo tiempo, 256 caracteres son suficientes para representar cualquier información de carácter.

Codificación de caracteres ASCII

Esta abreviatura en inglés significa código estándar americano para el intercambio de información.

Incluso en los albores de la informatización, se hizo evidente quepuede pensar en una variedad de formas de codificar información. Sin embargo, para transferir información de una computadora a otra, se requirió desarrollar un estándar único. Entonces, en 1963, apareció una tabla de codificación ASCII en los Estados Unidos. En él, cualquier símbolo del alfabeto informático está asociado con su número ordinal en representación binaria. Inicialmente, ASCII se usaba solo en los Estados Unidos y luego se convirtió en el estándar internacional para PC.

Contenido de la tabla

Los códigos ASCII se dividen en 2 partes. Solo la primera mitad de esta tabla se considera una norma internacional. Incluye caracteres con números ordinales de 0 (codificados como 00000000) a 127 (código 01111111).

Número de serie H	Codificación de texto ASCII	Símbolo
0 - 31	0000 0000 - 0001 1111	Los caracteres con N de 0 a 31 se denominan caracteres de control. Su función es "guiar" el proceso de visualización de texto en un monitor o dispositivo de impresión, dando una señal sonora, etc.
32 - 127	0010 0000 - 0111 1111	Caracteres con N de 32 a 127 (parte estándartablas): letras mayúsculas y minúsculas del alfabeto latino, números de 10 dígitos, signos de puntuación, así como varios corchetes, símbolos comerciales y de otro tipo. El carácter 32 denota un espacio.
128 - 255	1000 0000 - 1111 1111	Caracteres N de 128 a 255 (parte alternativatablas o página de códigos) pueden tener diferentes opciones, cada una de las cuales tiene su propio número. La página de códigos se utiliza para especificar alfabetos nacionales que son diferentes del latín. En particular, es con su ayuda que se lleva a cabo la codificación ASCII para caracteres rusos.

En la tabla de codificación, las letras mayúsculas y minúsculas se suceden en orden alfabético y los números, en orden ascendente de valores. Este principio también se aplica al alfabeto ruso.

Personajes de control

La tabla de codificación ASCII se creó originalmentepara recibir y transmitir información en un dispositivo de este tipo que no se ha utilizado durante mucho tiempo, como un teletipo. En este sentido, en el juego de caracteres se han incluido caracteres no imprimibles, que se utilizan como comandos para controlar este dispositivo. Se utilizaron comandos similares en métodos de mensajería anteriores a la computadora como el código Morse, etc.

El carácter de "teletipo" más común es NUL (00, "cero"). Todavía se usa en la mayoría de los lenguajes de programación hasta el día de hoy, denotando un terminador de línea.

Donde se usa ASCII

El Código Estándar Americano es necesario no solopara ingresar información de texto desde el teclado. También se utiliza en gráficos. Específicamente, en ASCII Art Maker, las imágenes de varias extensiones representan un espectro de caracteres ASCII.

Estos productos son de dos tipos:realizando la función de editores gráficos convirtiendo imágenes en texto y convirtiendo "imágenes" en gráficos ASCII. Por ejemplo, el famoso emoticón es un excelente ejemplo de carácter codificado.

ASCII también se puede utilizar al crear un documento HTML. En este caso, puede ingresar un cierto conjunto de caracteres, y al ver la página, aparece un carácter en la pantalla que corresponde a este código.

ASCII también es necesario para la creación de sitios multilingües, ya que los caracteres que no están incluidos en una tabla nacional específica son reemplazados por códigos ASCII.

Algunas características

Para codificar información de texto en codificación ASCII, se usaron originalmente 7 bits (uno se dejó vacío), pero hoy funciona como 8 bits.

Las letras de las columnas superior e inferior se diferencian entre sí en un solo bit. Esto reduce en gran medida la complejidad del cheque.

Usando ASCII en Microsoft Office

Si es necesario, este tipo de codificación de textola información se puede utilizar en editores de texto de Microsoft como el Bloc de notas y Office Word. Sin embargo, al escribir en este caso, no será posible utilizar algunas funciones. Por ejemplo, no podrá poner en negrita, porque ASCII solo conserva el significado de la información, ignorando su apariencia y forma general.

Estandarización

ISO ha adoptado las normas ISO 8859.Este grupo define codificaciones de ocho bits para diferentes grupos de idiomas. Específicamente, ISO 8859-1 es ASCII extendido, que es una tabla para los Estados Unidos y los países de Europa occidental. E ISO 8859-5 es una tabla utilizada para el alfabeto cirílico, incluido el idioma ruso.

Por varias razones históricas, la norma ISO 8859-5 se ha utilizado durante muy poco tiempo.

Para el idioma ruso, por el momento, se utilizan codificaciones:

CP866 (página de códigos 866) o DOS, que a menudo se denomina codificación GOST alternativa. Se utilizó activamente hasta mediados de los 90 del siglo pasado. Por el momento, prácticamente no se usa.
KOI-8. La codificación se desarrolló en las décadas de 1970 y 1980, ypor el momento, es un estándar generalmente aceptado para mensajes de correo en Runet. Se usa ampliamente en el sistema operativo de la familia Unix, incluido Linux. La versión "rusa" de KOI-8 se llama KOI-8R. Además, existen versiones para otros idiomas cirílicos, como el ucraniano.
Página de códigos 1251 (CP 1251, Windows - 1251). Desarrollado por Microsoft para brindar soporte para el idioma ruso en el entorno de Windows.

La principal ventaja del primer CP866 estándarfue la preservación de caracteres pseudográficos en las mismas posiciones que en ASCII extendido. Esto hizo posible ejecutar sin modificaciones programas de texto creados en el extranjero, como el conocido Norton Commander. Por el momento, CP866 se utiliza para programas desarrollados bajo Windows que funcionan en modo de texto de pantalla completa o en ventanas de texto, incluido FAR Manager.

Los textos de computadora escritos en codificación CP866 son bastante raros últimamente, pero es precisamente esta codificación la que se usa para los nombres de archivos rusos en Windows.

"Unicode"

Actualmente el más extendidorecibió exactamente esta codificación. Los códigos Unicode se dividen en áreas. El primero (U + 0000 a U + 007F) incluye caracteres ASCII con códigos. A esto le siguen las áreas de signos de varias escrituras nacionales, así como los signos de puntuación y los símbolos técnicos. Además, algunos de los códigos "Unicode" están reservados en caso de que sea necesario incluir nuevos caracteres en el futuro.

Ahora sabes que en ASCII cadaun carácter se representa como una combinación de 8 ceros y unos. Para los no especialistas, esta información puede parecer innecesaria y poco interesante, pero ¿no quieren saber lo que está sucediendo “en el cerebro” de su PC?