/ / ASCII (amerikai szabványos információcsere-kód) kódolás - alapvető latin szövegkódolás

ASCII (az információcserére vonatkozó amerikai szabványkód) - alap szöveg kódolás a latin ábécé számára

A Nemzetközi Távközlési Unió szerint2016-ban három és fél milliárd ember használta az internetet változó gyakorisággal. Legtöbbjük még arra sem gondol, hogy a PC-n vagy a mobil eszközön keresztül küldött üzenetek, valamint a különféle monitorokon megjelenített szövegek valójában 0 és 1 kombinációi. Az információ reprezentációját kódolásnak hívják. Biztosítja és jelentősen megkönnyíti tárolásának, feldolgozásának és átvitelének végrehajtását. 1963-ban kifejlesztették az amerikai ASCII kódolást, amelyet ez a cikk szentel.

ASCII kódolás

Információk bemutatása számítógépen

Bármely elektronikus számítás szempontjábólA géptípus az egyes karakterek gyűjteménye. Nemcsak betűket, köztük nagybetűket, hanem írásjeleket és számokat is tartalmaznak. Ezenkívül a "=", "&", "(") speciális karakterek és szóközök kerülnek felhasználásra.

A szövegből álló sok karakter,ábécének hívják, és számukat energiának (N-vel jelölve) hívják. Ennek meghatározásához az N = 2 ^ b kifejezést kell használni, ahol b az adott karakter bitszáma vagy információs súlya.

Bizonyított, hogy a 256 karakterből álló ábécé lehetővé teszi az összes szükséges karakter ábrázolását.

Mivel a 256 a kettő nyolcadik teljesítményét képviseli, az egyes karakterek tömege 8 bit.

A 8 bites mértékegységet 1 bájtnak hívjuk, ezért szokásos mondani, hogy a számítógépen tárolt szöveg bármely karakterének bináris kódja egy bájt memóriát igényel.

ASCII kódoló táblázat

Hogyan történik a kódolás?

A szövegek bekerülnek a személyes memóriábaszámítógéppel a billentyűzeten keresztül, amelyre a számokat, betűket, írásjeleket és egyéb karaktereket írják. Ezeket a RAM-ba bináris kódban továbbítják, azaz minden karakterhez egy személy számára szokásos tizedes kódot rendelnek, 0-tól 255-ig, ami egy bináris kódnak felel meg - 00000000-tól 11111111-ig.

A karakterek byte-kódolása lehetővé teszia szövegfeldolgozó processzor, minden karakterhez külön hozzáférhet. Ugyanakkor 256 karakter elegendő bármilyen karakterinformáció megjelenítéséhez.

ASCII szövegkódolás

ASCII karakterkódolás

Ez az angol betűszó az információcsere amerikai szabványkódját jelenti.

Még a számítógépesítés hajnalán is nyilvánvalóvá váltAz információk kódolásához különféle lehetőségeket kínálhat. Ahhoz azonban, hogy az információkat egyik számítógépről a másikra továbbítsák, egységes szabványt kellett kidolgozni. Tehát 1963-ban megjelent az ASCII kódolótábla az USA-ban. Ebben a számítógépes ábécé bármelyik szimbólumához hozzárendelik sorozatszámát bináris ábrázolásban. Az ASCII kódolást kezdetben csak az Egyesült Államokban használták, majd a PC-k nemzetközi szabványává vált.

Tartalomjegyzék

Az ASCII-kódokat 2 részre osztják. A táblázatnak csak az első felét tekintik nemzetközi szabványnak. Magában foglalja a karaktereket, amelyek sorszáma 0-tól (kódolás: 00000000) 127-ig (kód 01111111).

Sorozatszám

H

ASCII szövegkódolás

Szimbólum

0 - 31

0000 0000 - 0001 1111

Azokat a karaktereket, amelyeknek N értéke 0–31, vezérlő karaktereknek nevezzük. Feladatuk, hogy "irányítsák" a szöveg monitoron vagy nyomtatón történő megjelenítésének folyamatát, hangjelzést adva stb.

32 - 127

0010 0000 - 0111 1111

Karakterek N-től 32-ig 127-ig (standard résztáblázatok) - a latin ábécé nagy- és kisbetűi, tízjegyű számok, írásjelek, valamint különféle zárójelek, kereskedelmi és egyéb szimbólumok. A 32 karakter szóközt jelöl.

128 - 255

1000 0000 - 1111 1111

N karakter 128 és 255 között (alternatív résztáblázatok vagy kódoldal) különböző opciókkal rendelkezhetnek, mindegyiknek megvan a maga száma. A kódlap segítségével megadhatjuk a latinától eltérő nemzeti ábécéket. Különösen az ő segítségével hajtják végre az orosz karakterek ASCII kódolását.

A kódoló táblázatban a nagy- és a kisbetűk ábécé sorrendben, a számok pedig az értékek növekvő sorrendjében követik egymást. Ez az elv az orosz ábécére is érvényes.

Vezérlő karakterek

Az ASCII kódoló táblázatot eredetileg hozták létreinformációk fogadására és továbbítására egy ilyen, sokáig nem használt eszközön, például egy teletípuson. Ebben a tekintetben nem nyomtatható karakterek kerültek a karakterkészletbe, amelyeket parancsként használnak az eszköz vezérléséhez. Hasonló parancsokat alkalmaztak olyan számítógép előtti üzenetküldési módszerekben, mint a Morse-kód stb.

A leggyakoribb "teletype" karakter a NUL (00, "nulla"). A mai napig a legtöbb programozási nyelvben használják, vonal-terminátort jelölve.

az egyes karaktereket kódoló ASCII-ben

Az ASCII használatakor

Az amerikai szabványkódra nemcsak szükség vana szöveges információk megadásához a billentyűzetről. Grafikában is használják. Pontosabban, az ASCII Art Maker alkalmazásban a különböző kiterjesztésű képek az ASCII karakterek spektrumát jelentik.

Ezek a termékek kétféle típusúak:a grafikus szerkesztők funkciójának ellátása a képek szöveggé alakításával és a "képek" ASCII grafikává alakításával. Például a híres hangulatjel kiváló példája egy kódoló karakternek.

Az ASCII HTML dokumentum létrehozásakor is használható. Ebben az esetben megadhat egy bizonyos karakterkészletet, és az oldal megtekintésekor egy olyan karakter jelenik meg a képernyőn, amely megfelel ennek a kódnak.

Az ASCII a többnyelvű webhelyek létrehozásához is szükséges, mivel az adott nemzeti táblázatban nem szereplő karaktereket az ASCII kódok helyettesítik.

a szöveges információk kódolása ASCII kódolásban

Néhány funkció

A szöveges információk ASCII kódolásban történő kódolásához eredetileg 7 bitet használtak (az egyiket üresen hagyták), de ma 8 bitesként működik.

A felső és az alsó oszlop betűi csak egyetlen bit különböznek egymástól. Ez nagymértékben csökkenti az ellenőrzés bonyolultságát.

Az ASCII használata a Microsoft Office alkalmazásban

Szükség esetén ez a fajta szövegkódolásaz információk felhasználhatók a Microsoft szövegszerkesztõiben, például a Jegyzettömbben és az Office Wordben. Ebben az esetben azonban gépeléskor nem lehet egyes funkciókat használni. Például nem fog tudni félkövérrel szerepelni, mert az ASCII csak megőrzi az információk jelentését, figyelmen kívül hagyva azok általános megjelenését és alakját.

Orosz karaktereket kódoló ASCII

Szabványosítás

Az ISO elfogadta az ISO 8859 szabványokat.Ez a csoport nyolc bites kódolást határoz meg a különböző nyelvcsoportokhoz. Pontosabban, az ISO 8859-1 kiterjesztett ASCII, amely az Egyesült Államok és a nyugat-európai országok táblázata. Az ISO 8859-5 pedig a cirill ábécé, az orosz nyelvet is tartalmazó táblázat.

Számos történelmi okból az ISO 8859-5 szabvány nagyon rövid ideig volt használatban.

Az orosz nyelv számára jelenleg kódolásokat használnak:

  • CP866 (Kód 866. oldal) vagy DOS, amelyet gyakran alternatív GOST kódolásnak neveznek. Aktívan használták a múlt század 90-es évek közepéig. Jelenleg gyakorlatilag nem használják.
  • KOI-8. A kódolást az 1970-es és 80-as években fejlesztették ki, ésjelenleg ez általánosan elfogadott szabvány a Runet e-mail üzeneteinek. Széles körben használják a Unix család operációs rendszerében, beleértve a Linuxot is. A KOI-8 "orosz" változatát KOI-8R-nek hívják. Ezen kívül vannak más cirill nyelvek, például az ukrán nyelvű változatai is.
  • Kód 1251 oldal (CP 1251, Windows - 1251). A Microsoft fejlesztette ki, hogy támogassa az orosz nyelvet a Windows környezetben.

Az első szabványos CP866 fő előnyeaz álgrafikus karakterek megőrzése ugyanazon a pozíción volt, mint az Extended ASCII-ben. Ez lehetővé tette a külföldön készített szöveges programok, például a jól ismert Norton Commander módosítás nélküli futtatását. Jelenleg a CP866 a Windows alatt kifejlesztett programokhoz használható, amelyek teljes képernyős szöveges módban vagy szöveges ablakokban működnek, beleértve a FAR Manager programot is.

A CP866 kódolással írt számítógépes szövegek az utóbbi időben meglehetősen ritkák, de éppen ezt a kódolást használják az orosz fájlnevek számára a Windows rendszerben.

"Unicode"

Jelenleg a legelterjedtebbpontosan ezt a kódolást kapta. Az Unicode kódok területekre vannak osztva. Az első (U + 0000 - U + 007F) ASCII karaktereket tartalmaz kódokkal. Ezt követik a különféle nemzeti írások jeleinek, valamint az írásjelek és a technikai szimbólumok területei. Ezenkívül egyes "Unicode" kódok fenntartva vannak arra az esetre, ha a jövőben új karakterekre lenne szükség.

ASCII karakterkódolás

Most már tudja, hogy az ASCII-ben mindegyikegy karakter 8 nulla és egy kombinációjaként jelenik meg. Nem szakemberek számára ez az információ szükségtelennek és érdektelennek tűnhet, de nem akarja tudni, mi történik a számítógép „agyában”?