Podľa Medzinárodnej telekomunikačnej únie v roku 2006V roku 2016 používalo internet s určitou pravidelnosťou tri a pol miliardy ľudí. Väčšina z nich ani len nepomyslí na to, že všetky správy, ktoré odosielajú prostredníctvom počítačov alebo mobilných pomôcok, ako aj texty, ktoré sa zobrazujú na všetkých druhoch monitorov, sú vlastne kombináciami 0 a 1. Táto prezentácia informácií sa nazýva kódovanie. . Poskytuje a výrazne uľahčuje jeho ukladanie, spracovanie a prenos. V roku 1963 bolo vyvinuté americké kódovanie ASCII, ktorému sa tento článok venuje.
Prezentácia informácií v počítači
Z pohľadu akýchkoľvek elektronických výpočtovstrojový text je zbierka jednotlivých znakov. Patria sem nielen písmená vrátane veľkých písmen, ale aj interpunkčné znamienka a čísla. Ďalej sa používajú špeciálne znaky "=", "&", "(" a medzery.
Sada znakov, ktoré tvoria text,sa nazýva abeceda a ich počet sa nazýva moc (označený ako N). Na jeho definovanie sa používa výraz N = 2 ^ b, kde b je počet bitov alebo informačná váha konkrétneho znaku.
Je dokázané, že abeceda s kapacitou 256 znakov vám umožňuje reprezentovať všetky potrebné znaky.
Pretože 256 je 8. mocninou z dvoch, váha každého znaku je 8 bitov.
Jednotka merania 8 bitov sa nazýva 1 bajt, takže sa bežne hovorí, že binárny kód ľubovoľného znaku v texte uloženom v počítači zaberá jeden bajt pamäte.
Ako sa programuje?
Všetky texty sa ukladajú do pamäte osobypočítač pomocou klávesov klávesnice, na ktorých sú napísané čísla, písmená, interpunkčné znamienka a ďalšie symboly. Sú prenesené do pamäte RAM v binárnom kóde, to znamená, že každý znak je spojený s ľudským desiatkovým kódom známym od 0 do 255, čo zodpovedá binárnemu kódu - od 00000000 do 11111111.
Kódovanie znakov bajtov umožňujeprocesor vykonávajúci spracovanie textu, odkazujte na každý znak osobitne. Zároveň 256 znakov stačí na to, aby predstavovali akékoľvek informácie o znakoch.
Kódovanie znakov ASCII
Táto skratka v angličtine znamená americký štandardný kód na výmenu informácií.
Už na úsvite informatizácie bolo zrejmé, žemôžete vymyslieť širokú škálu spôsobov kódovania informácií. Na prenos informácií z jedného počítača do druhého však bolo potrebné vyvinúť jediný štandard. V roku 1963 sa teda v Spojených štátoch objavila tabuľka kódovania ASCII. V ňom je akýkoľvek znak počítačovej abecedy spojený s jeho radovým číslom v binárnom vyjadrení. Spočiatku sa ASCII používal iba v Spojených štátoch a neskôr sa stal medzinárodným štandardom pre počítače.
Obsah tabuľky
Kódy ASCII sú rozdelené do 2 častí. Iba prvá polovica tejto tabuľky sa považuje za medzinárodný štandard. Zahŕňa znaky s radovými číslami od 0 (kódované ako 00000000) do 127 (kód 01111111).
Sériové číslo H | Kódovanie textu ASCII | symbol |
0 - 31 | 0000 0000 - 0001 1111 | Znaky s N od 0 do 31 sa nazývajú kontrolné znaky. Ich funkciou je „usmerniť“ proces zobrazovania textu na monitore alebo tlačovom zariadení, vydávať zvukový signál atď. |
32 - 127 | 0010 0000 - 0111 1111 | Znaky s N od 32 do 127 (štandardná časťtabuľky) - veľké a malé písmená latinskej abecedy, 10-miestne čísla, interpunkčné znamienka a tiež rôzne zátvorky, obchodné a iné symboly. Znak 32 označuje medzeru. |
128 - 255 | 1000 0000 - 1111 1111 | Znaky N od 128 do 255 (alternatívna časťtabuľky alebo kódová stránka) môžu mať rôzne možnosti, z ktorých každá má svoje vlastné číslo. Kódová stránka sa používa na zadanie národných abeced, ktoré sa líšia od latinčiny. Najmä s jeho pomocou sa vykonáva kódovanie ASCII pre ruské znaky. |
V kódovacej tabuľke nasledujú malé a malé písmená za sebou v abecednom poradí a číslice vo vzostupnom poradí podľa hodnôt. Tento princíp platí aj pre ruskú abecedu.
Kontrolné znaky
Tabuľka kódovania ASCII bola pôvodne vytvorenána príjem a prenos informácií na takom prístroji, ktorý sa dlho nepoužíval, napríklad na diaľkovom ovládači. Z tohto hľadiska boli do znakovej sady zahrnuté netlačiteľné znaky, ktoré sa používajú ako príkazy na ovládanie tohto zariadenia. Podobné príkazy sa používali aj v metódach zasielania správ pred počítačom, ako napríklad Morseova abeceda atď.
Najbežnejším znakom „teletypu“ je NUL (00, „nula“). Vo väčšine programovacích jazykov sa dodnes používa, čo označuje zakončenie riadku.
Kde sa používa kódovanie ASCII?
Americký štandardný kód je potrebný nielenna zadanie textových informácií z klávesnice. Používa sa aj v grafike. Konkrétne v programe ASCII Art Maker predstavujú obrázky rôznych rozšírení spektrum znakov ASCII.
Jedná sa o dva typy produktov:vykonávanie funkcie grafických editorov prevádzaním obrázkov do textu a prevádzaním „obrázkov“ do grafiky ASCII. Napríklad slávny emotikon je ukážkovým príkladom kódovacej postavy.
ASCII je možné použiť aj pri vytváraní dokumentu HTML. V takom prípade môžete zadať určitú skupinu znakov a pri prezeraní stránky sa na obrazovke objaví znak, ktorý zodpovedá tomuto kódu.
ASCII je tiež nevyhnutný na vytvorenie viacjazyčných stránok, pretože znaky, ktoré nie sú zahrnuté v konkrétnej národnej tabuľke, sú nahradené kódmi ASCII.
Niektoré funkcie
Na kódovanie textových informácií v kódovaní ASCII sa pôvodne použilo 7 bitov (jeden zostal prázdny), dnes však funguje ako 8-bitový.
Písmená v hornom a dolnom stĺpci sa navzájom líšia iba o jeden jediný bit. Toto výrazne znižuje zložitosť kontroly.
Používanie ASCII v Microsoft Office
V prípade potreby tento druh kódovania textutieto informácie možno použiť v textových editoroch spoločnosti Microsoft, ako sú napríklad Poznámkový blok a Office Word. Pri písaní v takom prípade však nebude možné použiť niektoré funkcie. Napríklad nebudete môcť písať tučným písmom, pretože ASCII zachováva iba význam informácií a ignoruje ich všeobecný vzhľad a tvar.
Štandardizácia
ISO prijala normy ISO 8859.Táto skupina definuje osembitové kódovanie pre rôzne jazykové skupiny. ISO 8859-1 je konkrétne Extended ASCII, čo je tabuľka pre USA a krajiny západnej Európy. A ISO 8859-5 je tabuľka používaná pre azbuku vrátane ruského jazyka.
Z mnohých historických dôvodov sa norma ISO 8859-5 používala veľmi krátko.
V súčasnosti sa v ruskom jazyku skutočne používajú kódovania:
- CP866 (kódová stránka 866) alebo DOS, ktoré sa často označuje ako alternatívne kódovanie GOST. Aktívne sa používal až do polovice 90. rokov minulého storočia. Momentálne sa prakticky nepoužíva.
- KOI-8. Kódovanie bolo vyvinuté v 70. A 80. Rokoch av súčasnosti je to všeobecne akceptovaný štandard pre poštové správy na Runete. Je široko používaný v OS rodiny Unix, vrátane Linuxu. „Ruská“ verzia KOI-8 sa nazýva KOI-8R. Okrem toho existujú verzie pre ďalšie azbuku, napríklad ukrajinčinu.
- Kódová stránka 1251 (CP 1251, Windows - 1251). Vyvinutý spoločnosťou Microsoft s cieľom poskytnúť podporu ruského jazyka v prostredí systému Windows.
Hlavná výhoda prvého štandardu CP866bolo uchovanie pseudografických znakov na rovnakých pozíciách ako v rozšírenom ASCII. Vďaka tomu bolo možné spustiť bez úpravy textové programy zahraničnej výroby, napríklad známy Norton Commander. V súčasnosti sa CP866 používa pre programy vyvinuté v systéme Windows, ktoré pracujú v textovom režime na celú obrazovku alebo v textových oknách, vrátane FAR Manager.
Počítačové texty napísané v kódovaní CP866 sú v poslednej dobe pomerne zriedkavé, ale práve toto kódovanie sa používa pre ruské názvy súborov vo Windows.
Unicode
Momentálne najrozšírenejšídostal presne toto kódovanie. Kódy Unicode sú rozdelené do oblastí. Prvý (U + 0000 až U + 007F) obsahuje znaky ASCII s kódmi. Nasledujú oblasti znakov rôznych národných skriptov, ako aj interpunkčné znamienka a technické symboly. Niektoré z kódov „Unicode“ sú navyše vyhradené pre prípad, že bude v budúcnosti potrebné pridať nové znaky.
Teraz viete, že v ASCII každýznak je reprezentovaný ako kombinácia 8 núl a jednotiek. Pre neodborníkov sa môžu tieto informácie zdať zbytočné a nezaujímavé, ale nechcete vedieť, čo sa deje „v mozgu“ vášho počítača?!