/ / ASCII kódovanie (americký štandardný kód pre výmenu informácií) - základné kódovanie textu pre latinskú abecedu

ASCII (americký štandardný kód na výmenu informácií) - základné kódovanie latinského textu

Podľa Medzinárodnej telekomunikačnej únie v roku 2006V roku 2016 používalo internet s určitou pravidelnosťou tri a pol miliardy ľudí. Väčšina z nich ani len nepomyslí na to, že všetky správy, ktoré odosielajú prostredníctvom počítačov alebo mobilných pomôcok, ako aj texty, ktoré sa zobrazujú na všetkých druhoch monitorov, sú vlastne kombináciami 0 a 1. Táto prezentácia informácií sa nazýva kódovanie. . Poskytuje a výrazne uľahčuje jeho ukladanie, spracovanie a prenos. V roku 1963 bolo vyvinuté americké kódovanie ASCII, ktorému sa tento článok venuje.

Kódovanie ASCII

Prezentácia informácií v počítači

Z pohľadu akýchkoľvek elektronických výpočtovstrojový text je zbierka jednotlivých znakov. Patria sem nielen písmená vrátane veľkých písmen, ale aj interpunkčné znamienka a čísla. Ďalej sa používajú špeciálne znaky "=", "&", "(" a medzery.

Sada znakov, ktoré tvoria text,sa nazýva abeceda a ich počet sa nazýva moc (označený ako N). Na jeho definovanie sa používa výraz N = 2 ^ b, kde b je počet bitov alebo informačná váha konkrétneho znaku.

Je dokázané, že abeceda s kapacitou 256 znakov vám umožňuje reprezentovať všetky potrebné znaky.

Pretože 256 je 8. mocninou z dvoch, váha každého znaku je 8 bitov.

Jednotka merania 8 bitov sa nazýva 1 bajt, takže sa bežne hovorí, že binárny kód ľubovoľného znaku v texte uloženom v počítači zaberá jeden bajt pamäte.

Tabuľka kódovania ASCII

Ako sa programuje?

Všetky texty sa ukladajú do pamäte osobypočítač pomocou klávesov klávesnice, na ktorých sú napísané čísla, písmená, interpunkčné znamienka a ďalšie symboly. Sú prenesené do pamäte RAM v binárnom kóde, to znamená, že každý znak je spojený s ľudským desiatkovým kódom známym od 0 do 255, čo zodpovedá binárnemu kódu - od 00000000 do 11111111.

Kódovanie znakov bajtov umožňujeprocesor vykonávajúci spracovanie textu, odkazujte na každý znak osobitne. Zároveň 256 znakov stačí na to, aby predstavovali akékoľvek informácie o znakoch.

Kódovanie textu ASCII

Kódovanie znakov ASCII

Táto skratka v angličtine znamená americký štandardný kód na výmenu informácií.

Už na úsvite informatizácie bolo zrejmé, žemôžete vymyslieť širokú škálu spôsobov kódovania informácií. Na prenos informácií z jedného počítača do druhého však bolo potrebné vyvinúť jediný štandard. V roku 1963 sa teda v Spojených štátoch objavila tabuľka kódovania ASCII. V ňom je akýkoľvek znak počítačovej abecedy spojený s jeho radovým číslom v binárnom vyjadrení. Spočiatku sa ASCII používal iba v Spojených štátoch a neskôr sa stal medzinárodným štandardom pre počítače.

Obsah tabuľky

Kódy ASCII sú rozdelené do 2 častí. Iba prvá polovica tejto tabuľky sa považuje za medzinárodný štandard. Zahŕňa znaky s radovými číslami od 0 (kódované ako 00000000) do 127 (kód 01111111).

Sériové číslo

H

Kódovanie textu ASCII

symbol

0 - 31

0000 0000 - 0001 1111

Znaky s N od 0 do 31 sa nazývajú kontrolné znaky. Ich funkciou je „usmerniť“ proces zobrazovania textu na monitore alebo tlačovom zariadení, vydávať zvukový signál atď.

32 - 127

0010 0000 - 0111 1111

Znaky s N od 32 do 127 (štandardná časťtabuľky) - veľké a malé písmená latinskej abecedy, 10-miestne čísla, interpunkčné znamienka a tiež rôzne zátvorky, obchodné a iné symboly. Znak 32 označuje medzeru.

128 - 255

1000 0000 - 1111 1111

Znaky N od 128 do 255 (alternatívna časťtabuľky alebo kódová stránka) môžu mať rôzne možnosti, z ktorých každá má svoje vlastné číslo. Kódová stránka sa používa na zadanie národných abeced, ktoré sa líšia od latinčiny. Najmä s jeho pomocou sa vykonáva kódovanie ASCII pre ruské znaky.

V kódovacej tabuľke nasledujú malé a malé písmená za sebou v abecednom poradí a číslice vo vzostupnom poradí podľa hodnôt. Tento princíp platí aj pre ruskú abecedu.

Kontrolné znaky

Tabuľka kódovania ASCII bola pôvodne vytvorenána príjem a prenos informácií na takom prístroji, ktorý sa dlho nepoužíval, napríklad na diaľkovom ovládači. Z tohto hľadiska boli do znakovej sady zahrnuté netlačiteľné znaky, ktoré sa používajú ako príkazy na ovládanie tohto zariadenia. Podobné príkazy sa používali aj v metódach zasielania správ pred počítačom, ako napríklad Morseova abeceda atď.

Najbežnejším znakom „teletypu“ je NUL (00, „nula“). Vo väčšine programovacích jazykov sa dodnes používa, čo označuje zakončenie riadku.

v ASCII kódovaní každého znaku

Kde sa používa kódovanie ASCII?

Americký štandardný kód je potrebný nielenna zadanie textových informácií z klávesnice. Používa sa aj v grafike. Konkrétne v programe ASCII Art Maker predstavujú obrázky rôznych rozšírení spektrum znakov ASCII.

Jedná sa o dva typy produktov:vykonávanie funkcie grafických editorov prevádzaním obrázkov do textu a prevádzaním „obrázkov“ do grafiky ASCII. Napríklad slávny emotikon je ukážkovým príkladom kódovacej postavy.

ASCII je možné použiť aj pri vytváraní dokumentu HTML. V takom prípade môžete zadať určitú skupinu znakov a pri prezeraní stránky sa na obrazovke objaví znak, ktorý zodpovedá tomuto kódu.

ASCII je tiež nevyhnutný na vytvorenie viacjazyčných stránok, pretože znaky, ktoré nie sú zahrnuté v konkrétnej národnej tabuľke, sú nahradené kódmi ASCII.

na kódovanie textových informácií v kódovaní ASCII

Niektoré funkcie

Na kódovanie textových informácií v kódovaní ASCII sa pôvodne použilo 7 bitov (jeden zostal prázdny), dnes však funguje ako 8-bitový.

Písmená v hornom a dolnom stĺpci sa navzájom líšia iba o jeden jediný bit. Toto výrazne znižuje zložitosť kontroly.

Používanie ASCII v Microsoft Office

V prípade potreby tento druh kódovania textutieto informácie možno použiť v textových editoroch spoločnosti Microsoft, ako sú napríklad Poznámkový blok a Office Word. Pri písaní v takom prípade však nebude možné použiť niektoré funkcie. Napríklad nebudete môcť písať tučným písmom, pretože ASCII zachováva iba význam informácií a ignoruje ich všeobecný vzhľad a tvar.

ASCII kódovanie ruských znakov

Štandardizácia

ISO prijala normy ISO 8859.Táto skupina definuje osembitové kódovanie pre rôzne jazykové skupiny. ISO 8859-1 je konkrétne Extended ASCII, čo je tabuľka pre USA a krajiny západnej Európy. A ISO 8859-5 je tabuľka používaná pre azbuku vrátane ruského jazyka.

Z mnohých historických dôvodov sa norma ISO 8859-5 používala veľmi krátko.

V súčasnosti sa v ruskom jazyku skutočne používajú kódovania:

  • CP866 (kódová stránka 866) alebo DOS, ktoré sa často označuje ako alternatívne kódovanie GOST. Aktívne sa používal až do polovice 90. rokov minulého storočia. Momentálne sa prakticky nepoužíva.
  • KOI-8. Kódovanie bolo vyvinuté v 70. A 80. Rokoch av súčasnosti je to všeobecne akceptovaný štandard pre poštové správy na Runete. Je široko používaný v OS rodiny Unix, vrátane Linuxu. „Ruská“ verzia KOI-8 sa nazýva KOI-8R. Okrem toho existujú verzie pre ďalšie azbuku, napríklad ukrajinčinu.
  • Kódová stránka 1251 (CP 1251, Windows - 1251). Vyvinutý spoločnosťou Microsoft s cieľom poskytnúť podporu ruského jazyka v prostredí systému Windows.

Hlavná výhoda prvého štandardu CP866bolo uchovanie pseudografických znakov na rovnakých pozíciách ako v rozšírenom ASCII. Vďaka tomu bolo možné spustiť bez úpravy textové programy zahraničnej výroby, napríklad známy Norton Commander. V súčasnosti sa CP866 používa pre programy vyvinuté v systéme Windows, ktoré pracujú v textovom režime na celú obrazovku alebo v textových oknách, vrátane FAR Manager.

Počítačové texty napísané v kódovaní CP866 sú v poslednej dobe pomerne zriedkavé, ale práve toto kódovanie sa používa pre ruské názvy súborov vo Windows.

Unicode

Momentálne najrozšírenejšídostal presne toto kódovanie. Kódy Unicode sú rozdelené do oblastí. Prvý (U + 0000 až U + 007F) obsahuje znaky ASCII s kódmi. Nasledujú oblasti znakov rôznych národných skriptov, ako aj interpunkčné znamienka a technické symboly. Niektoré z kódov „Unicode“ sú navyše vyhradené pre prípad, že bude v budúcnosti potrebné pridať nové znaky.

Kódovanie znakov ASCII

Teraz viete, že v ASCII každýznak je reprezentovaný ako kombinácia 8 núl a jednotiek. Pre neodborníkov sa môžu tieto informácie zdať zbytočné a nezaujímavé, ale nechcete vedieť, čo sa deje „v mozgu“ vášho počítača?!