Moderné počítačové technológie, informatika,sila abecedy, číselná sústava a mnohé ďalšie pojmy majú medzi sebou najpriamejšie súvislosti. Len veľmi málo používateľov sa dnes v týchto veciach dobre orientuje. Skúsme si ujasniť, aká je sila abecedy, ako ju vypočítať a aplikovať v praxi. V budúcnosti sa to v praxi nepochybne môže hodiť.
Ako sa merajú informácie
Predtým, ako začnete študovať otázku, aká je sila abecedy a vo všeobecnosti, čo to je, mali by ste začať takpovediac od nuly.
Určite každý vie, že dnes existujúšpeciálne systémy na meranie akýchkoľvek veličín, založené na referenčných hodnotách. Napríklad pre vzdialenosti a podobné množstvá sú to metre, pre hmotnosť a hmotnosť - kilogramy, pre časové intervaly - sekundy atď.
Ako však merať informácie z hľadiska objemu textu? Z tohto dôvodu bol zavedený koncept kardinality abecedy.
Aká je mohutnosť abecedy: počiatočný koncept
Ak sa teda budete riadiť všeobecne uznávaným pravidlom, žekonečná hodnota ľubovoľnej veličiny je parameter, ktorý určuje, koľkokrát je referenčná jednotka naskladaná v meranej veličine, môžeme dospieť k záveru: sila abecedy je celkový počet znakov použitých pre konkrétny jazyk.
Aby to bolo jasnejšie, nechajme otázku akoako nájsť silu abecedy, bokom a venovať pozornosť samotným symbolom, samozrejme, z pohľadu informačných technológií. Zhruba povedané, úplný zoznam použitých symbolov obsahuje písmená, čísla, všetky druhy zátvoriek, špeciálne znaky, interpunkčné znamienka atď. Ak však pristupujeme k otázke, aká je sila abecedy počítačovo, mali by sme zahrnúť aj medzeru (jedinú medzeru medzi slovami alebo inými znakmi).
Zoberme si ruský jazyk ako príklad, alebo skôr,rozloženie klávesnice. Na základe vyššie uvedeného úplný zoznam obsahuje 33 písmen, 10 číslic a 11 špeciálnych znakov. Celková mohutnosť abecedy je teda 54.
Informačná váha znakov
Všeobecný koncept sily abecedy však neurčuje podstatu výpočtu informačných objemov textu obsahujúcich písmená, čísla a symboly. To si vyžaduje osobitný prístup.
V zásade sa nad tým zamyslite, no, aj takto to môže byťminimálna množina z pohľadu počítačového systému, koľko znakov môže obsahovať? Odpoveď: dve. A preto. Faktom je, že každý symbol, či už je to písmeno alebo číslo, má svoju informačnú váhu, podľa ktorej stroj rozpozná, čo je pred ním. Ale počítač rozumie len reprezentácii vo forme jednotiek a núl, na ktorých je v podstate celá informatika založená.
Takto môže byť zastúpený akýkoľvek symbolvo forme sekvencií obsahujúcich čísla 1 a 0, to znamená, že minimálna sekvencia označujúca písmeno, číslo alebo symbol má dve zložky.
Samotná informačná váha, braná ako štandardná informačná jednotka, sa nazýva bit (1 bit). Podľa toho je 8 bitov 1 bajt.
Binárna reprezentácia znakov
Aká je teda sila abecedy, už si myslímtrochu jasné. Teraz sa pozrime na ďalší aspekt, konkrétne na praktické znázornenie sily pomocou binárneho kódu. Ako príklad si pre jednoduchosť zoberme abecedu len so 4 znakmi.
V dvojcifernom binárnom kóde možno sekvenciu a ich informačnú reprezentáciu opísať takto:
Sériové číslo | 1 | 2 | 3 | 4. |
Binárny kód | 00 | 01 | 10 | 11 |
Preto - najjednoduchší záver: so silou abecedy N = 4 je váha jedného znaku 2 bity.
Ak použijete trojmiestny binárny kód pre abecedu, napríklad s 8 znakmi, počet kombinácií bude nasledujúci:
Sériové číslo | 1 | 2 | 3 | 4. | 5 | 6 | 7 | 8 |
Binárny kód | 000 | 001 | 010 | 011 | 100 | 101 | 110 | 111 |
Inými slovami, pri mocnine abecedy N = 8 bude váha jedného znaku pre trojmiestny binárny kód 3 bity.
Ako nájsť silu abecedy a použiť ju v počítačovom vyjadrovaní
Teraz sa skúsme pozrieť na závislosť,ktorý vyjadruje počet znakov v kóde a mohutnosť abecedy. Vzorec, kde N je abecedná mohutnosť abecedy a b je počet znakov v binárnom kóde, bude vyzerať takto:
N = 2v
Teda 21= 2, 22= 4, 23= 8,24= 16 atď. Zhruba povedané, požadovaný počet znakov samotného binárneho kódu je váha symbolu. Z informatívneho hľadiska to vyzerá takto:
Sila abecedy, N | 2 | 4 | 8 | 16 |
Počet znakov kódu, b | 1 bit | 2 bity | 3 bity | 4 bity |
Meranie objemu informácií
Boli to však len tie najjednoduchšie príklady, takpovediac, na počiatočné pochopenie toho, v čom spočíva sila abecedy. Poďme priamo k praxi.
V tomto štádiu vývoja výpočtovej techniky prepísanie s prihliadnutím na veľké, veľké a malé písmená, cyrilické a latinské písmená, interpunkčné znamienka, zátvorky, aritmetické znaky atď. Je použitých 256 znakov. Na základe skutočnosti, že 256 je 28, je ľahké uhádnuť, že váha každého znaku v takejto abecede je 8, teda 8 bitov alebo 1 bajt.
Na základe všetkých známych parametrov sa dáľahko získame hodnotu objemu informácií akéhokoľvek textu, ktorý potrebujeme. Napríklad máme počítačový text obsahujúci 30 strán. Jedna strana obsahuje 50 riadkov po 60 znakov alebo symbolov vrátane medzier.
Jedna strana teda bude obsahovať 50 x60 = 3 000 bajtov informácií a celý text je 3 000 x 50 = 150 000 bajtov. Ako vidíte, dokonca aj malé texty sú nepohodlné na meranie v bajtoch. A čo celé knižnice?
V tomto prípade je lepšie previesť objem na výkonnejšie veličiny - kilobajty, megabajty, gigabajty atď. Na základe skutočnosti, že napríklad 1 kilobajt sa rovná 1 024 bajtom (210) a megabajt - 210 kilobajt (1024 kilobajtov), ľahko vypočítať,že množstvo textu v informačnom a matematickom vyjadrení pre náš príklad bude 150 000 / 1024 = 146,484375 kilobajtov alebo približne 0,14305 megabajtov.
Namiesto doslovu
Vo všeobecnosti je to v skratke a všetko, čo sa týkavzhľadom na to, aká je sila abecedy. Zostáva dodať, že pri tomto opise bol použitý čisto matematický prístup. Je samozrejmé, že v tomto prípade sa neberie ohľad na sémantické zaťaženie textu.
Ak však k otázkam úvahy pristúpime presnez pozície, ktorá dáva človeku čo chápať, bude mať v tomto ohľade množina nezmyselných kombinácií alebo sekvencií symbolov nulovú informačnú záťaž, hoci z hľadiska konceptu informačného objemu sa dá výsledok predsa len vypočítať.
Vo všeobecnosti poznatky o sile abecedy asúvisiace pojmy nie sú také náročné na pochopenie a dajú sa elementárne aplikovať v zmysle praktických úkonov. Zároveň sa s tým stretáva každý používateľ takmer každý deň. Stačí uviesť ako príklad populárny editor Word alebo akýkoľvek iný na rovnakej úrovni, ktorý takýto systém používa. Nemýľte si ho však s bežným Poznámkovým blokom. Tu je sila abecedy nižšia, pretože pri písaní sa povedzme nepoužívajú veľké písmená.