Faits cognitifs sur tout / Ordinateurs / Quelle est la puissance de l'alphabet ? Comment trouver la cardinalité de l'alphabet : une formule

Quelle est la puissance de l'alphabet? Comment trouver la cardinalité de l'alphabet: une formule

Technologies informatiques modernes, informatique,la puissance de l'alphabet, le système numérique et de nombreux autres concepts ont les liens les plus directs les uns avec les autres. Très peu d'utilisateurs aujourd'hui sont bien versés dans ces questions. Essayons de clarifier quel est le pouvoir de l'alphabet, comment le calculer et l'appliquer dans la pratique. À l'avenir, cela pourrait sans aucun doute s'avérer utile dans la pratique.

Comment l'information est mesurée

Avant de commencer à étudier la question de savoir quel est le pouvoir de l'alphabet, et en général, ce que c'est, vous devriez commencer, pour ainsi dire, à partir de zéro.

Tout le monde sait sûrement qu'aujourd'hui il y ades systèmes spéciaux pour mesurer des quantités quelconques, sur la base de valeurs de référence. Par exemple, pour les distances et quantités similaires, il s'agit de mètres, pour la masse et le poids - kilogrammes, pour les intervalles de temps - secondes, etc.

Mais comment mesurer l'information en termes de volume de texte ? C'est pour cela que le concept de cardinalité de l'alphabet a été introduit.

Quelle est la cardinalité de l'alphabet: concept initial

Donc, si vous suivez la règle généralement acceptée selon laquellela valeur finale de toute quantité est un paramètre qui détermine combien de fois l'unité de référence est empilée dans la quantité mesurée, nous pouvons conclure : la puissance de l'alphabet est le nombre total de caractères utilisés pour une langue particulière.

comment trouver la cardinalité de l'alphabet

Pour que ce soit plus clair, laissons la question de savoir commentcomment trouver le pouvoir de l'alphabet, à part, et faire attention aux symboles eux-mêmes, bien sûr, du point de vue de la technologie de l'information. En gros, la liste complète des symboles utilisés contient des lettres, des chiffres, toutes sortes de parenthèses, des caractères spéciaux, des signes de ponctuation, etc. Cependant, si nous abordons la question de la puissance de l'alphabet de manière informatisée, nous devrions également inclure un espace (un seul écart entre les mots ou d'autres caractères).

Prenons l'exemple de la langue russe, ou plutôt,clavier. Sur la base de ce qui précède, la liste complète contient 33 lettres, 10 chiffres et 11 caractères spéciaux. Ainsi, la cardinalité totale de l'alphabet est de 54.

Poids informationnel des caractères

Cependant, le concept général de la puissance de l'alphabet ne détermine pas l'essence du calcul des volumes d'informations de texte contenant des lettres, des chiffres et des symboles. Cela nécessite une approche particulière.

En principe, réfléchissez-y, eh bien, c'est comme ça que ça peut êtreminimum fixé du point de vue d'un système informatique, combien de caractères peut-il contenir ? Réponse : deux. Et c'est pourquoi. Le fait est que chaque symbole, qu'il s'agisse d'une lettre ou d'un chiffre, a son propre poids informationnel, selon lequel la machine reconnaît ce qui se trouve devant elle. Mais l'ordinateur ne comprend que la représentation sous forme de uns et de zéros, sur laquelle, en fait, toute l'informatique est basée.

Ainsi, tout symbole peut être représenté danssous forme de séquences contenant les chiffres 1 et 0, c'est-à-dire que la séquence minimale désignant une lettre, un chiffre ou un symbole a deux composantes.

Le poids d'information lui-même, pris comme unité d'information standard, est appelé un bit (1 bit). Par conséquent, 8 bits correspondent à 1 octet.

Représentation de caractères binaires

Alors, quelle est la puissance de l'alphabet, je pense, déjàun peu clair. Regardons maintenant un autre aspect, en particulier, une représentation pratique de la puissance en utilisant du code binaire. A titre d'exemple, prenons un alphabet avec seulement 4 caractères pour plus de simplicité.

En code binaire à deux chiffres, la séquence et leur représentation informationnelle peuvent être décrites comme suit :

Numéro de série	1er	2e	3e	4ème
Code binaire	00	01	10	11

D'où - la conclusion la plus simple : avec la puissance de l'alphabet N = 4, le poids d'un seul caractère est de 2 bits.

Si vous utilisez un code binaire à trois chiffres pour un alphabet, par exemple, avec 8 caractères, le nombre de combinaisons sera le suivant :

Numéro de série	1er	2e	3e	4ème	5e	6e	7e	8ème
Code binaire	000	001	010	011	100	101	110	111

Autrement dit, avec la puissance de l'alphabet N = 8, le poids d'un caractère pour un code binaire à trois chiffres sera de 3 bits.

Comment trouver la puissance de l'alphabet et l'utiliser dans l'expression informatique

Essayons maintenant de regarder la dépendance,qui exprime le nombre de caractères du code et la cardinalité de l'alphabet. La formule, où N est la cardinalité alphabétique de l'alphabet, et b est le nombre de caractères du code binaire, ressemblera à ceci :

N = 2^dans

c'est-à-dire 2¹= 2, 2²= 4, 2³= 8, 2⁴= 16, etc... En gros, le nombre requis de caractères du code binaire lui-même est le poids du symbole. En termes informatifs, cela ressemble à ceci:

Puissance de l'alphabet, N	2	4	8	16
Nombre de caractères de code, b	1 peu	2 bits	3 bits	4 bits

Mesure du volume d'informations

Cependant, ce n'étaient que les exemples les plus simples, pour ainsi dire, pour une première compréhension de la puissance de l'alphabet. Passons directement à la pratique.

A ce stade du développement de la technologie informatique pourdactylographie en tenant compte des lettres majuscules, majuscules et minuscules, des lettres cyrilliques et latines, des signes de ponctuation, des crochets, des signes arithmétiques, etc. 256 caractères sont utilisés. Basé sur le fait que 256 vaut 2⁸, il est facile de deviner que le poids de chaque caractère dans un tel alphabet est de 8, c'est-à-dire 8 bits ou 1 octet.

Sur la base de tous les paramètres connus, on peutobtenir facilement la valeur du volume d'informations de tout texte dont nous avons besoin. Par exemple, nous avons un texte informatique contenant 30 pages. Une page contient 50 lignes de 60 caractères ou symboles, espaces compris.

Ainsi, une page contiendra 50 x60 = 3 000 octets d'informations et le texte entier est de 3 000 x 50 = 150 000 octets. Comme vous pouvez le voir, même les petits textes sont difficiles à mesurer en octets. Qu'en est-il des bibliothèques entières ?

Dans ce cas, il est préférable de convertir le volume en quantités plus puissantes - kilooctets, mégaoctets, gigaoctets, etc. Basé sur le fait que, par exemple, 1 kilo-octet est égal à 1024 octets (2¹⁰) et mégaoctet - 2¹⁰ kilo-octet (1024 kilo-octets), facile à calculer,que la quantité de texte en termes d'information et mathématiques pour notre exemple sera de 150 000 / 1024 = 146,484375 kilo-octets, soit environ 0,14305 mégaoctet.

Au lieu d'une postface

En général, c'est en bref et tout ce qui concernecompte tenu de la puissance de l'alphabet. Il reste à ajouter qu'une approche purement mathématique a été utilisée dans cette description. Il va de soi que la charge sémantique du texte n'est pas prise en compte dans ce cas.

Mais, si nous abordons précisément les questions de considérationà partir d'une position qui donne à une personne quelque chose à comprendre, un ensemble de combinaisons ou de séquences de symboles dénuées de sens à cet égard n'aura aucune charge d'information, bien que, du point de vue du concept de volume d'information, le résultat puisse toujours être calculé.

En général, la connaissance de la puissance de l'alphabet etles concepts connexes ne sont pas si difficiles à comprendre et peuvent être appliqués élémentairement dans le sens d'actions pratiques. Dans le même temps, tout utilisateur est confronté à cela presque tous les jours. Qu'il suffise de citer comme exemple le populaire éditeur Word ou tout autre du même niveau qui utilise un tel système. Mais ne le confondez pas avec un bloc-notes ordinaire. Ici, la puissance de l'alphabet est plus faible car, par exemple, les majuscules ne sont pas utilisées lors de la frappe.