/ / ASCII-kodning (amerikansk standardkode for informationsudveksling) - grundlæggende tekstkodning for latin

ASCII (amerikansk standardkode til informationsudveksling) - den grundlæggende kodning af teksten for latin

Ifølge International Telecommunication Union, iI 2016 brugte tre en halv milliard mennesker internettet med en vis regelmæssighed. De fleste af dem tænker ikke engang over det faktum, at eventuelle beskeder sendt af dem gennem pc'er eller mobile gadgets, såvel som tekster, der vises på alle slags skærme, faktisk er kombinationer af 0 og 1. Denne præsentation af information kaldes kodning . Det giver og letter i høj grad implementeringen af ​​dets lagring, behandling og transmission. I 1963 blev den amerikanske ASCII-kodning udviklet, som denne artikel er helliget.

ASCII-kodning

Præsentation af information på en computer

Fra enhver elektronisk databehandlings synspunktmaskintekst er en samling af individuelle tegn. Disse omfatter ikke kun bogstaver, herunder store bogstaver, men også tegnsætningstegn og tal. Derudover bruges specialtegn "=", "&", "(" og mellemrum.

Det sæt af tegn, der udgør teksten,kaldes alfabetet, og deres tal kaldes potens (betegnes som N). For at definere det bruges udtrykket N = 2 ^ b, hvor b er antallet af bits eller informationsvægten af ​​et bestemt tegn.

Det er blevet bevist, at et alfabet med en kapacitet på 256 tegn kan repræsentere alle de nødvendige tegn.

Da 256 er 8. potens af to, er vægten af ​​hvert tegn 8 bit.

Måleenheden på 8 bits kaldes 1 byte, så det er sædvanligt at sige, at den binære kode af et hvilket som helst tegn i teksten, der er gemt på computeren, fylder en byte hukommelse.

ASCII-kodningstabel

Hvordan foregår kodning

Eventuelle tekster er indtastet i hukommelsen af ​​den personligecomputer ved hjælp af tastaturtaster, hvorpå der er skrevet tal, bogstaver, tegnsætningstegn og andre symboler. De overføres til RAM'en i en binær kode, det vil sige, at hvert tegn er forbundet med en decimalkode, der er kendt for en person, fra 0 til 255, hvilket svarer til en binær kode - fra 00000000 til 11111111.

Byte-tegnkodning tilladerprocessoren, der udfører behandlingen af ​​teksten, henvises til hvert tegn separat. Samtidig er 256 tegn nok til at repræsentere enhver tegninformation.

ASCII-tekstkodning

ASCII-tegnkodning

Denne forkortelse på engelsk står for amerikansk standardkode for informationsudveksling.

Selv ved computeriseringens begyndelse blev det tydeligt, atdu kan tænke på en lang række måder at kode information på. Men for at overføre information fra en computer til en anden, var det nødvendigt at udvikle en enkelt standard. Så i 1963 dukkede en ASCII-kodningstabel op i USA. I den er ethvert symbol i computeralfabetet forbundet med dets ordenstal i binær repræsentation. Oprindeligt blev ASCII kun brugt i USA og blev senere den internationale standard for pc'er.

Tabelindhold

ASCII-koder er opdelt i 2 dele. Kun den første halvdel af denne tabel betragtes som en international standard. Den indeholder tegn med ordenstal fra 0 (kodet som 00000000) til 127 (kode 01111111).

Serienummer

H

ASCII-tekstkodning

Symbol

0 - 31

0000 0000 - 0001 1111

Tegn med N fra 0 til 31 kaldes kontroltegn. Deres funktion er at "guide" processen med at vise tekst på en skærm eller udskrivningsenhed, give et lydsignal osv.

32 - 127

0010 0000 - 0111 1111

Tegn med N fra 32 til 127 (standarddeltabeller) - store og små bogstaver i det latinske alfabet, 10-cifrede tal, tegnsætningstegn samt forskellige parenteser, kommercielle og andre symboler. Tegnet 32 ​​angiver et mellemrum.

128 - 255

1000 0000 - 1111 1111

Tegn N fra 128 til 255 (alternativ deltabeller eller tegntabel) kan have forskellige muligheder, som hver har sit eget nummer. Kodetabellen bruges til at angive nationale alfabeter, der er forskellige fra latin. Det er især med dens hjælp, at ASCII-kodning for russiske tegn udføres.

I indkodningstabellen følger store og små bogstaver hinanden i alfabetisk rækkefølge, og tal - i stigende rækkefølge af værdier. Dette princip gælder også for det russiske alfabet.

Kontrolkarakterer

ASCII-kodningstabellen blev oprindeligt oprettettil modtagelse og transmission af information på en sådan enhed, der ikke har været brugt i lang tid, såsom en teletype. I denne henseende er tegn, der ikke kan udskrives, inkluderet i tegnsættet, der bruges som kommandoer til at styre denne enhed. Lignende kommandoer blev brugt i sådanne pre-computer meddelelsesmetoder som morsekode osv.

Det mest almindelige "teletype"-tegn er NUL (00, "nul"). Det bruges stadig i de fleste programmeringssprog den dag i dag, hvilket betegner en linjeterminator.

i ASCII-kodning af hvert tegn

Hvor ASCII bruges

American Standard Code er ikke kun nødvendigfor at indtaste tekstoplysninger fra tastaturet. Det bruges også i grafik. Specifikt i ASCII Art Maker repræsenterer billeder af forskellige udvidelser et spektrum af ASCII-tegn.

Disse produkter er af to typer:udføre funktionen som grafiske editorer ved at konvertere billeder til tekst og konvertere "billeder" til ASCII-grafik. For eksempel er det berømte humørikon et godt eksempel på en kodningskarakter.

ASCII kan også bruges ved oprettelse af et HTML-dokument. I dette tilfælde kan du indtaste et bestemt sæt tegn, og når du ser på siden, vil der vises et tegn på skærmen, der svarer til denne kode.

ASCII er også nødvendigt for at skabe flersprogede websteder, da tegn, der ikke er inkluderet i en specifik national tabel, erstattes af ASCII-koder.

at indkode tekstinformation i ASCII-kodning

Nogle funktioner

For at indkode tekstinformation i ASCII-kodning blev der oprindeligt brugt 7 bits (en blev efterladt tom), men i dag fungerer det som 8-bit.

Bogstaverne i den øverste og nederste kolonne adskiller sig kun fra hinanden med en enkelt bit. Dette reducerer i høj grad kompleksiteten af ​​checken.

Brug af ASCII i Microsoft Office

Hvis det er nødvendigt, denne form for tekstkodningoplysninger kan bruges i Microsofts teksteditorer som Notesblok og Office Word. Men når du skriver i dette tilfælde, vil det ikke være muligt at bruge nogle funktioner. For eksempel vil du ikke være i stand til at markere fed, fordi ASCII kun bevarer betydningen af ​​informationen og ignorerer dens generelle udseende og form.

ASCII-kodning af russiske tegn

Standardisering

ISO har vedtaget ISO 8859-standarder.Denne gruppe definerer otte-bit-kodninger for forskellige sproggrupper. Specifikt er ISO 8859-1 Extended ASCII, som er en tabel for USA og vesteuropæiske lande. Og ISO 8859-5 er en tabel, der bruges til det kyrilliske alfabet, inklusive det russiske sprog.

Af en række historiske årsager har ISO 8859-5-standarden været i brug i meget kort tid.

For det russiske sprog bruges i øjeblikket kodninger faktisk:

  • CP866 (kode side 866) eller DOS, som ofte omtales som den alternative GOST-kodning. Det blev aktivt brugt indtil midten af ​​90'erne af forrige århundrede. I øjeblikket er den praktisk talt ikke brugt.
  • KOI-8. Kodningen blev udviklet i 1970'erne og 80'erne, ogi øjeblikket er det en almindeligt accepteret standard for postbeskeder på Runet. Det er meget udbredt i OS i Unix-familien, inklusive Linux. Den "russiske" version af KOI-8 hedder KOI-8R. Derudover er der versioner til andre kyrilliske sprog, såsom ukrainsk.
  • Kode Side 1251 (CP 1251, Windows - 1251). Udviklet af Microsoft til at yde support til det russiske sprog i Windows-miljøet.

Den største fordel ved den første standard CP866var bevarelsen af ​​pseudografiske tegn på de samme positioner som i Extended ASCII. Dette gjorde det muligt at køre uden ændringer udenlandsk fremstillede tekstprogrammer, såsom den velkendte Norton Commander. I øjeblikket bruges CP866 til programmer udviklet under Windows, der fungerer i fuldskærmsteksttilstand eller i tekstvinduer, inklusive FAR Manager.

Computertekster skrevet i CP866-kodning er ret sjældne på det seneste, men det er netop denne kodning, der bruges til russiske filnavne i Windows.

"Unicode"

I øjeblikket den mest udbredtemodtog præcis denne kodning. Unicode-koder er opdelt i områder. Den første (U + 0000 til U + 007F) indeholder ASCII-tegn med koder. Dette efterfølges af områderne med tegn på forskellige nationale skrifter samt tegnsætningstegn og tekniske symboler. Derudover er nogle af "Unicode"-koderne reserveret, hvis der skulle være behov for at inkludere nye tegn i fremtiden.

ASCII-tegnkodning

Nu ved du det i ASCII hveret tegn er repræsenteret som en kombination af 8 nuller og enere. For ikke-specialister kan denne information virke unødvendig og uinteressant, men vil du ikke vide, hvad der sker "i hjernen" på din pc?!