Låt oss ta reda på vad filkodningen är.I enklare termer är en kodning en uppsättning byttecken som motsvarar det alfabetiska alfabetet på ett visst språk. Varje språk har sin egen specifika sekvens av sådana kodningstecken. Ibland finns det ett behov av att bestämma kodningen. Låt oss överväga detta med hjälp av ett exempel på ett textdokument.
Vad behöver du
En samling specifika programverktyg. Till en början, tillräckligt med applikationer som Ord, KWrite, Firefox webbläsare och igenkänningsverktyg - enca.
Du kan bestämma filkodningen med universalredigeraren Microsoft Word. Tidigare måste det installeras från paketet Kontor. När applikationen är installerad och kan öppnas med W-ikonen på skrivbordet, fortsätt till nästa steg.
Nästa steg av erkännande
Öppna "File" - "Open" -objekten i tur och ordning genom navigationspanelen för applikationen. Detsamma kan göras med kortkommandot Ctrl + O.
Välj sedan önskad katalog i dialogrutan och faktiskt den fil som ska läsas. När du har valt den med musen klickar du på "öppna" -knappen.
När en fil inte har en matchuppsättning CP1251, försöker applikationen själv bestämmakodning. En lista över möjliga matchningar visas. Välj en av kodningarna i de föreslagna teckenuppsättningarna till höger om listan. Om valet är korrekt visas den igenkända texten i exempelelementet.
Hur man upptäcker kodning med KWrite
Förutom förbehandlaren för ordbehandling, Word, finns det andra funktionella verktyg. En av dem - KWrite (analog för unix-system). För att inte bli förvirrad kommer jag att beskriva uppgiften "bestämma kodningen av dokumentet i KWrite" punkt för punkt.
- Läser in en .txt-fil i programmet.
- Uppräkning av kodningar tills en av dem är lämplig.
- För att utföra steg 2, gå till verktygsalternativet i kodningsmenyn.
Mozilla Firefox webbläsare, syftet är detsamma - att bestämma kodningen
Principen är ungefär densamma som i verktyg för att arbeta med text. Vi startar den installerade webbläsaren för körning, och om den inte är installerad, ladda ner installationsprogrammet från mozilla.org.
Sedan i det öppna programfönstret måste du öppnaett textdokument via menyn "Arkiv", undermenyn "Öppna fil". Om den valda filen visas utan förvrängning och texten är läsbar blir det inte svårt att bestämma kodningen.
För att göra detta, gå till "Visa" - "kodning", det visas flera uppsättningar tecken, och den motsatta som det finns en "bock" är den kodning som definieras av webbläsaren.
Om texten inte känns igen korrekt markerar du "avancerad" underavsnitt, experimenterar med kodningar i den eller väljer "auto" -värdet.
Specialiserad programvara - arbetar med enca
Det finns också ett antal elektroniska hjälpmedel som gör det möjligt att bestämma kodningen av oformaterad text.
För dem som är vana att arbeta under unix,enca-verktyg. Den kan installeras med hjälp av tjänsten Package Manager. När du har hittat en tillgänglig paketkategori kan du börja installera programvaran.
För att visa en lista över igenkänningsspråk, kör kommandot enca - list språk med en terminal.
Om du behöver bestämma kodningen av en textfil efter (g) -tangenten, ange dess namn och ange igenkänningsspråket på ungefär samma sätt efter alternativet (L):
enca -L ryska -g /home/vic/temp/myfile.txt.
Låt oss sammanfatta vad som har sagts om kodning
Jag tror att ovanstående verktyg kommer att bli en tillräcklig uppsättning verktyg för användaren att avkoda textdokument.
Hittills handlar det faktiskt om hur man känner igenkodning. För standardändamål tycker jag att den angivna programvaran är bra. Det finns mer specialiserade detekteringsmetoder, men deras övervägande ligger utanför denna artikel.
För Microsoft Word kan källan till igenkänning vara både enkel text och ett dokument med komplex formatering.