/ / Рад са текстом. Како одредити кодирање датотеке

Рад са текстом. Како одредити кодирање датотеке

Откријмо шта је кодирање датотеке.Једноставно речено, кодирање је скуп бајт знакова који одговара абецеди на одређеном језику. Сваки језик има свој специфични низ таквих знакова кодирања. Понекад је потребно одредити кодирање. Размотрите ово као пример текстуалног документа.

Шта је потребно

Скуп специфичних софтверских алата. За почетак, апликације попут Ворд, КВрите, Фирефок прегледач и алати за препознавање - енца.

Кодирање датотеке можете одредити помоћу универзалног уређивача програма Мицрософт Ворд. Прво морате да га инсталирате из пакета. Канцеларија Када је апликација инсталирана и може се отворити помоћу иконе у облику В симбола на радној површини, пређите на следећи корак.

Следећа фаза препознавања

Кроз навигациони панел апликације, наизменично отварајте ставке „Датотека“ - „отвори“. Иста ствар се може учинити и комбинацијом тастатуре Цтрл + О.

Затим у дијалошком оквиру изаберите жељени директориј и, уствари, датотеку коју желите да прочитате. Након што га изаберете мишем, притисните дугме "отвори".

Када датотека нема постављен подударање ЦП1251, апликација покушава да самостално одредикодирање. Приказаће се листа могућих подударања. У предложеним групама знакова с десне стране листе одаберите једно од кодирања. Ако је избор извршен правилно, препознати текст биће приказан у елементу „сампле“.

Како одредити кодирање помоћу КВрите

Поред претпроцесора за обраду текста, Ворд, постоје и други функционални програми. Један од њих је Кврите (аналог за уник системе). Да се ​​не бисте збунили, описат ћу задатак „одредити кодирање документа у КВрите“ тачку по тачку.

  1. Учитавање .ткт датотеке у апликацију.
  2. Набрајање кодирања све док једно од њих не буде прикладно.
  3. Да бисте извели 2. корак, идите на опцију алата у менију кодирања.

Мозилла Фирефок прегледач, сврха је иста - утврђивање кодирања

Принцип је приближно исти као у услужним програмима за рад са текстом. Покрећемо инсталирани прегледач за извршење, а ако није инсталиран, преузмите програм за инсталирање са мозилла.орг.

Затим у отвореном прозору програма треба да отворитетекстуални документ кроз мени „Датотека“, подмени „Отвори датотеку“. Ако је изабрана датотека приказана без изобличења, а текст је читљив, неће бити тешко одредити кодирање.

Да бисте то урадили, идите на „Поглед“ - „кодирање“, тамо се приказује неколико скупова знакова, а онај насупрот коме постоји „квачица“ је кодирање које дефинише прегледач.

Ако текст није правилно препознат, изаберите пододељак „напредни“, експериментишите са кодирањима у њему или изаберите вредност „аутоматски“.

Специјализовани софтвер - рад са енцом

Постоји и низ електронских помагала која омогућавају одређивање кодирања неформатираног текста.

За оне који су навикли да раде под уник-ом,енца утилити. Може се инсталирати помоћу услуге Пацкаге Манагер. Када пронађете доступну категорију пакета, можете започети инсталирање софтвера.

Да бисте приказали листу језика за препознавање, покрените команду енца --лист лангуагес помоћу терминала.

Ако требате да одредите кодирање текстуалне датотеке након тастера (г), унесите њено име, а након опције (Л) унесите језик за препознавање на приближно исти начин:

енца -Л руски -г /хоме/виц/темп/мифиле.ткт.

Сумирајмо оно што је речено о кодирању

Верујем да ће горе наведени услужни програми постати довољан скуп алата за корисника за декодирање текстуалних докумената.

До сада је заправо све у томе како препознатикодирање. У стандардне сврхе мислим да је наведени софтвер у реду. Постоје више специјализованих метода откривања, али њихово разматрање превазилази опсег овог чланка.

За Мицрософт Ворд извор препознавања може бити једноставни текст или документ са сложеним форматирањем.