КомпютриИнформационни технологии

Кодиране на текст на информацията в компютъра

Компютър - изискан устройство, с което можете да създавате, конвертирате, и съхранява информация. Въпреки това, компютърът не работи много разбираем начин за нас - графичен, текст и числови данни се съхраняват като двоични масиви номера. В тази статия ще разгледаме как кодирането на информация за текста.

Какво за нас е текстът на един компютър - поредица от символи. Всеки символ представлява определен набор от нули и единици. Под символите, предназначени не само главни и малки букви букви от латинската азбука, но и препинателни знаци, аритметични знаци, специални знаци, специални символи и дори космически.

Двоично кодиране на текстова информация

Чрез натискане на определен клавиш на вътрешния контролер изпраща електрически сигнал, който се преобразува в двоичен код. Код е съчетана с определен символ, който се показва на екрана. За подаване на латинската азбука в цифров формат ASCII кодиране международна система е създадена. Тя изисква един байт за запис на един символ по този начин се състои от осем символ последователност от нули и единици. Интервалът за запис - от 00000000 до 11111111, т.е. кодиране на текстова информация с помощта на тази система ни позволява да представляват 256 знака. В повечето случаи, това е достатъчно.

ASCII е разделен на две части. Първите 127 знака (от 00 милиона до 01111111) са международни и са специфични символи и букви от английската азбука. Втората част - разширението (10000000-11111111) - има за цел да представлява националното азбука, писането на която е различна от латински.

Encoding текстова информация в ASCII е изградена на принципа на увеличаване на последователност, т.е., колкото по-голям номер на последователност от букви, толкова по-голяма стойност на неговия ASCII-код. Цифри и руската част на таблицата са изградени на същия принцип.

Въпреки това, в света има няколко типа на кодиране за кирилица. Най-често - е KOI-8 (осем-битово кодиране, която е била използвана в 70-те години в първия ruifitsirovannyh Unix операционната система), ISO 8859-5 (разработен от Международното бюро по стандартизация), CP 1251 (кодиране текстова информация, използвани в модерна операционна система Windows), както и 2-байт кодиране на Unicode, което може да се използва за въвеждане на 65536 символа. Такова разнообразие от кодировки, дължащи се на факта, че те са разработени в различни моменти, за различни операционни системи и различни съображения. Поради това, често имат трудности при прехвърляне на текст от една среда в друга - от несъответствие, кодиращ потребителят ще видите набор от объркващи икони. Как мога да поправя тази ситуация? В Word, например, когато отворите документ, съобщение за проблеми с текст дисплей и предлага няколко опции за транскодиране.

По този начин, кодиране и обработка на текстова информация в червата на компютъра - процесът е труден и отнема много време организирани. Всички символи на всяка азбука са само определена последователност от цифри на двоична система, една клетка - това е един байт информация.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 bg.birmiss.com. Theme powered by WordPress.