/ / Darbs ar tekstu. Kā noteikt faila kodējumu

Darbs ar tekstu. Kā noteikt faila kodējumu

Let's uzzināt, kas ir faila kodējums.Vienkārši sakot, kodēšana ir baitu rakstzīmju kopa, kas atbilst burtu alfabētam noteiktā valodā. Katrai valodai ir sava īpaša šādu kodēšanas rakstzīmju secība. Dažreiz ir nepieciešams noteikt kodējumu. Uzskatiet to par teksta dokumenta piemēru.

Kas jums nepieciešams

Īpašu programmatūras rīku kolekcija. Sākumā pietiek ar daudzām lietojumprogrammām, piemēram, Vārds, KWrite, Firefox pārlūkprogramma un atpazīšanas ierīce - enca.

Failu kodējumu var noteikt, izmantojot universālo Microsoft Word redaktoru. Pirmkārt, tas ir jāinstalē no iepakojuma. Birojs. Kad programma ir instalēta un var atvērt, izmantojot ikonu W simbola veidā uz darbvirsmas, pārejiet uz nākamo soli.

Nākamais atzīšanas posms

Izmantojot lietojumprogrammas navigācijas paneli, pēc kārtas atveriet vienumus "Fails" - "Atvērt". To pašu var izdarīt, izmantojot īsinājumtaustiņu Ctrl + O.

Pēc tam dialoglodziņā atlasiet vajadzīgo direktoriju un faktiski lasāmo failu. Izvēloties to ar peli, noklikšķiniet uz pogas "atvērt".

Ja failā nav iestatīta atbilstība CP1251, lietojumprogramma mēģina noteikt patikodēšana. Tiks parādīts iespējamo atbilstību saraksts. Piedāvātajās rakstzīmju kopās saraksta labajā pusē atlasiet vienu no kodējumiem. Ja atlase ir pareiza, atpazītais teksts tiks parādīts parauga elementā.

Kā noteikt kodējumu ar KWrite

Papildus teksta apstrādes priekšapstrādes procesam Word ir arī citas funkcionālās utilītas. Viens no viņiem - KWrite (analogs unix sistēmām). Lai jūs neapjuktu, es aprakstīšu uzdevumu "noteikt dokumenta kodējumu KWrite" pa punktam.

  1. Notiek .txt faila ielāde lietojumprogrammā.
  2. Kodējumu uzskaitījums, līdz viens no tiem ir piemērots.
  3. Lai veiktu 2. darbību, dodieties uz rīku opciju kodēšanas izvēlnē.

Mozilla Firefox pārlūks, mērķis ir vienāds - noteikt kodējumu

Princips ir aptuveni tāds pats kā utilītprogrammās darbam ar tekstu. Mēs palaižam instalēto pārlūku izpildei un, ja tas nav instalēts, lejupielādējiet instalēšanas programmu no mozilla.org.

Tad atvērtajā programmas logā jums jāatverteksta dokumentu, izmantojot izvēlni "Fails", apakšizvēlni "Atvērt failu". Ja atlasītais fails tiek parādīts bez traucējumiem un teksts ir lasāms, kodējumu nebūs grūti noteikt.

Lai to izdarītu, dodieties uz sadaļu "Skatīt" - "kodēšana", tiek parādīti vairāki rakstzīmju komplekti, un viens, pret kuru atrodas "atzīme", ir pārlūkprogrammas definētais kodējums.

Ja teksts netika atpazīts pareizi, atlasiet apakšsadaļu “papildu”, eksperimentējiet ar tajā esošajiem kodējumiem vai atlasiet vērtību “automātiskais”.

Specializēta programmatūra - darbs ar enca

Ir arī vairāki elektroniski palīglīdzekļi, kas ļauj noteikt neformatēta teksta kodējumu.

Tiem, kas ir pieraduši strādāt ar unix,enca lietderība. To var instalēt, izmantojot pakotņu pārvaldnieka pakalpojumu. Kad esat atradis pieejamo pakotņu kategoriju, varat sākt programmatūras instalēšanu.

Lai parādītu atpazīšanas valodu sarakstu, palaidiet komandu enca - list languages, izmantojot termināli.

Ja pēc taustiņa (g) jānosaka teksta faila kodējums, ievadiet tā nosaukumu un pēc opcijas (L) aptuveni tādā pašā veidā ievadiet atpazīšanas valodu:

enca -L krievu -g /home/vic/temp/myfile.txt.

Apkoposim to, kas tika teikts par kodēšanu

Es uzskatu, ka iepriekš minētie utilīti kļūs par pietiekamu rīku komplektu, lai lietotājs varētu atšifrēt teksta dokumentus.

Līdz šim faktiski viss ir par to, kā atpazītkodēšana. Standarta vajadzībām es domāju, ka norādītā programmatūra ir piemērota. Ir vairāk specializētu noteikšanas metožu, taču to apsvēršana ir ārpus šī raksta darbības jomas.

Microsoft Word atpazīšanas avots var būt gan vienkāršs teksts, gan dokuments ar sarežģītu formatējumu.