Moderne computerteknologi, informatik,kraften i alfabetet, nummersystemet og mange andre begreber har de mest direkte forbindelser med hinanden. Meget få brugere i dag er velbevandrede i disse sager. Lad os prøve at præcisere, hvad alfabetets magt er, hvordan man beregner det og anvender det i praksis. I fremtiden kan dette uden tvivl være nyttigt i praksis.
Hvordan information måles
Før man fortsætter med at studere spørgsmålet om, hvad alfabetets magt er, og generelt hvad det er, skal man så at sige starte fra starten.
Sikkert alle ved, at der i dag er derspecielle systemer til måling af eventuelle størrelser baseret på referenceværdier. For eksempel for afstande og lignende mængder er disse meter, for masse og vægt - kg, for tidsintervaller - sekunder osv.
Men hvordan måler du oplysninger i form af tekstvolumen? Det er for dette, at konceptet om alfabetets kardinalitet blev introduceret.
Hvad er alfabetets kardinalitet: indledende koncept
Så hvis du følger den almindeligt accepterede regel, atden endelige værdi af en hvilken som helst størrelse er en parameter, der bestemmer, hvor mange gange referencenheden stables i den målte størrelse, vi kan konkludere: alfabetets magt er det samlede antal tegn, der bruges til et bestemt sprog.
For at gøre det tydeligere, lad os lade spørgsmålet omhvordan man finder alfabetets magt bortset fra og opmærksom på selve symbolerne naturligvis set fra informationsteknologiens synspunkt. Groft sagt indeholder den komplette liste over brugte symboler bogstaver, tal, alle slags parenteser, specialtegn, tegnsætningstegn osv. Men hvis vi nærmer os spørgsmålet om, hvad alfabetets magt er på en computeriseret måde, bør vi også inkludere et mellemrum (et enkelt mellemrum mellem ord eller andre tegn).
Lad os tage russisk som et eksempel, eller rettere,tastatur layout. Baseret på ovenstående indeholder den komplette liste 33 bogstaver, 10 tal og 11 specialtegn. Således er alfabetets samlede kardinalitet 54.
Informationsvægt af tegn
Imidlertid bestemmer det generelle koncept om magt i alfabetet ikke essensen af beregningsinformationsvolumener af tekst, der indeholder bogstaver, tal og symboler. Dette kræver en særlig tilgang.
I princippet skal du tænke over det, ja, sådan kan det væreminimumssæt set fra et computersystem, hvor mange tegn kan det indeholde? Svar: to. Og det er derfor. Faktum er, at hvert tegn, det være sig et bogstav eller et tal, har sin egen informationsvægt, ifølge hvilken maskinen genkender, hvad der er foran den. Men computeren forstår kun repræsentationen i form af ener og nuller, som faktisk al informatik er baseret på.
Således kan ethvert symbol repræsenteres ii form af sekvenser, der indeholder tallene 1 og 0, dvs. minimumsekvensen, der angiver et bogstav, tal eller symbol, har to komponenter.
Selve informationsvægten, taget som en standardinformationsenhed, kaldes en bit (1 bit). Følgelig er 8 bit 1 byte.
Binær karakterrepræsentation
Så hvad er alfabetets kraft, tror jeg alleredelidt klar. Lad os nu se på et andet aspekt, især en praktisk repræsentation af magt ved hjælp af binær kode. Lad os som et eksempel tage et alfabet med kun 4 tegn for enkelhedens skyld.
I to-cifret binær kode kan sekvensen og deres informationsrepræsentation beskrives som følger:
Serienummer | 1. | 2. plads | 3. | 4. |
Binær kode | 00 | 01 | 10 | 11 |
Derfor - den enkleste konklusion: med kraften i alfabetet N = 4 er vægten af et enkelt tegn 2 bits.
Hvis du bruger en trecifret binær kode til et alfabet, f.eks. Med 8 tegn, vil antallet af kombinationer være som følger:
Serienummer | 1. | 2. plads | 3. | 4. | 5. plads | 6. | 7. | 8. plads |
Binær kode | 000 | 001 | 010 | 011 | 100 | 101 | 110 | 111 |
Med andre ord, med kraften i alfabetet N = 8, vil vægten af et tegn for en trecifret binær kode være 3 bit.
Sådan finder du alfabetets kraft og bruger det til computerudtryk
Lad os nu se på afhængigheden,der udtrykker antallet af tegn i koden og alfabetets kardinalitet. Formlen, hvor N er alfabetets alfabetiske kardinalitet, og b er antallet af tegn i binær kode, vil se sådan ud:
N = 2i
Det vil sige 21= 2, 22= 4, 23= 8, 24= 16 osv. Groft sagt er det krævede antal tegn i selve den binære kode symbolets vægt. Med hensyn til information ser det sådan ud:
Alfabetets magt, N | 2 | 4 | 8 | 16 |
Antal kode tegn, b | 1 bit | 2 bits | 3 bits | 4 bits |
Måling af informationsvolumen
Dette var dog bare de enkleste eksempler, så at sige, til en indledende forståelse af hvad alfabetets magt er. Lad os gå direkte til praksis.
På dette stadium i udviklingen af computerteknologi tilskrivning under hensyntagen til store, store og små bogstaver, kyrilliske og latinske bogstaver, tegnsætningstegn, parenteser, aritmetiske tegn osv. Der bruges 256 tegn. Baseret på det faktum, at 256 er 28, er det let at gætte, at vægten af hvert tegn i et sådant alfabet er 8, dvs. 8 bit eller 1 byte.
Baseret på alle kendte parametre kan mannemt få værdien af informationsvolumen for enhver tekst, vi har brug for. For eksempel har vi en computertekst, der indeholder 30 sider. En side indeholder 50 linjer med 60 tegn eller symboler inklusive mellemrum.
Således vil en side indeholde 50 x60 = 3.000 byte information, og hele teksten er 3.000 x 50 = 150.000 byte. Som du kan se, er selv små tekster ubelejlige at måle i bytes. Og hvad med hele biblioteker?
I dette tilfælde er det bedre at konvertere lydstyrken til kraftigere mængder - kilobytes, megabyte, gigabyte osv. Baseret på det faktum, at f.eks. 1 kilobyte er lig med 1024 byte (210) og megabyte - 210 kilobyte (1024 kilobyte), det er let at beregne,at mængden af tekst i informationsmæssige og matematiske termer for vores eksempel vil være 150.000/1024 = 146,484375 kilobyte eller ca. 0,14305 megabyte.
I stedet for et efterord
Generelt er dette kortfattet og alt det, der vedrørerovervejer hvad der er kraften i alfabetet. Det er fortsat at tilføje, at en rent matematisk tilgang blev brugt i denne beskrivelse. Det siger sig selv, at den semantiske belastning af teksten ikke tages i betragtning i dette tilfælde.
Men hvis vi nærmer os spørgsmålet om overvejelse nøjagtigtfra en position, der giver en person noget at forstå, vil et sæt meningsløse kombinationer eller sekvenser af symboler i denne henseende have nul informationsbelastning, selvom resultatet fra begrebet informationsvolumen stadig kan beregnes.
Generelt kendskab til alfabetets ogrelaterede begreber er ikke så vanskelige at forstå og kan anvendes elementært i form af praktiske handlinger. Desuden står enhver bruger overfor dette næsten hver dag. Det er tilstrækkeligt at nævne som et eksempel den populære Word-editor eller enhver anden af samme niveau, der bruger et sådant system. Men forveksl det ikke med en almindelig notesblok. Her er kraften i alfabetet lavere, da vi ikke skriver med store bogstaver, når vi skriver.