КомпютриИнформационни технологии

Encoding "Unicode": характер стандарт за кодиране

Всеки потребител на интернет, в опит да се създаде един или друг от неговата функция поне веднъж видях на екрана написани на латиница думата "Unicode". Какво е това, ще научите, като прочетете тази статия.

дефиниция

Encoding "Unicode" - кодиране на знаците стандарт. Той е предложен от Unicode Inc. организация с нестопанска цел през 1991. Стандартът има за цел да събере на едно място възможно най-голям брой различни видове герои в документ. Страница, която е създадена въз основа на тях, може да съдържа букви и знаци от различни езици (от руски на корейски) и математически знаци. В този случай, всички герои в набора от символи се извеждат без никакви проблеми.

Причините за създаването на

Имало едно време, много преди появата на единна система "Unicode" кодиране се избира въз основа на предпочитанията на автора на документа. Поради тази причина често да чете документ, че е необходимо да се използват различни таблици. Понякога е необходимо да се направи по няколко пъти, което значително усложнява живота на обикновения потребител. Както вече споменахме, решението на този проблем през 1991 г. е поканен да Unicode Inc. организация с нестопанска цел, за да предложи нов тип кодиране на знаците. Тя е проектирана да се съчетаят остаряла и разнообразие от стандарти. "Unicode" - кодиране, което ozvolila постигне немислимото в момента: да се създаде инструмент, който поддържа голям брой знаци. Резултатът надхвърли много очаквания - имало документи едновременно, съдържащи както английски и руски текст, латински, и математически изрази.

Но създаването на единна кодиране предшествано от необходимостта за решаване на редица проблеми, които са възникнали в резултат на огромното разнообразие от стандарти вече съществуващите по това време. Най-честите от тях:

  • Елфически писане, или "безсмислици";
  • ограниченията на набор от символи;
  • проблем трансформира кодирането;
  • шрифта дублиране.

Малък исторически екскурса

Представете си, че 80-то на двора. Компютърен хардуер не е толкова често, и е с форма, различна от днес. Въпреки че всяка OS е уникална и рафинирани специфичните нужди на всеки ентусиаст. Необходимо е за обмен на информация се превръща в допълнителен преработи всичко. Опитвайки се да се чете документ, създаден от друга операционна система, често показва странен набор от знаци, както и играта започва с кодирането. Тя не винаги го направи бързо, а понякога е необходимо документ може да бъде отворен за шест месеца, а дори и по-късно. Хората, които често обменят информация, да създадете за себе си една таблица за преобразуване. И след това да работят по тях се разкрива една интересна подробност: необходимостта от създаването им и в двете посоки ", от моя във вашия" напред-назад. Направи банална инверсия изчислителна машина не мога, защото в дясната колона на източника и ляво - резултатът, но не и обратното. Ако видите необходимостта от използване на специални знаци в документа, те трябваше да бъдат добавени на първо място, а след това друг, и да обясни на партньора, което той трябва да направи, за да тези знаци не се превърне в "безсмислици". И нека не забравяме, че за всяко кодиране трябваше да се развие или приложат свои собствени шрифтове, които са довели до създаването на огромен брой дубликати в операционната система.

Представете си още, че шрифтовете на страницата, ще видите 10 парчета от идентичен Times New Roman с малка забележка: за UTF-8, UTF-16, ANSI, UCS-2. Сега разбирам, че разработването на универсални стандарти е задължително?

"бащите-основатели на създателите на"

Произходът на създаването на Unicode, за да бъдат открити през 1987 г., когато Джо Бекер от Xerox, заедно с Лий Колинс и Марк Дейвис от Apple започва изследвания в областта на практическото създаване на универсален набор от символи. През август 1988 г., Джо Бекер публикуван проект на предложение за създаването на 16-битов многоезичен международна система за кодиране.

Няколко месеца по-късно Unicode работна група да обхване и Кен Уислър и Майк Kernegana от RLG, Глен Rayt на Sun Microsystems и няколко други специалисти, които дават възможност за приключването на работата по предварителния формирането на общ стандарт за кодиране.

общо описание

Най-Unicode основава на концепцията на символа. Под това определение се отнася до абстрактен феномен, който съществува в определена форма на писане и реализира чрез графема (техните "портрети"). Всеки герой е дадена в "Unicode" уникалния код, принадлежащ към конкретен елемент стандарт. Например графема Б също е на английски и руски азбуки, но това съответства на Unicode 2 различни герои. Те подлежат на преобразуване в малки букви, т. Е., всеки от които описва ключовата база данни, набор от свойства и пълното име.

Предимства на Unicode

От други съвременници, кодиращи "UNICODE" Има огромен запас от знаци за "криптиране" герои. Фактът, че неговите предшественици са имали 8 бита, които се поддържат от 28 знака, но новият дизайн е вече 216 знака, че е огромна крачка напред. Това позволи на кодиране почти всички съществуващи и общи азбуки.

С появата на "Unicode" вече не е необходимо да се използва таблица за преобразуване: като единен стандарт тя просто отрича необходимостта от тях. По същия начин те са потънали в забвение, а "безсмислици" - единен стандарт ги направи невъзможно, както и да попречат на необходимостта от създаване на дублиращи шрифтове.

развитие на Unicode

Разбира се, напредъкът не е на мястото си, а от първото представяне е преминал в продължение на 25 години. Въпреки това, набор от знаци "Unicode" упорито държи позицията си в света. В много отношения това е възможно благодарение на факта, че той е станал лесна за изпълнение и се е разпространил, да бъдат признати разработчиците на собственически (платен) и софтуер с отворен код.

Ние не трябва да се смята, че днес ние виждаме един и същи код "Unicode", тъй като преди четвърт век. В момента се заменя с версия 5.h.h, а броят на кодирани символи се увеличи до 231. На възможността за използване на по-голяма свобода марка не се все още поддържа подкрепа за Unicode-16 (кодиране, където максималният размер на ограничения брой 216). От самото си създаване и до версия 2.0.0 "The стандарта Unicode" се е увеличил броят на знаците, че това са включени почти 2 пъти. възможности и непрекъснат растеж през следващите години. За версия 4.0.0 вече е необходимо да се увеличи на самия стандарт, както и че е било направено. В резултат на това "Unicode" е намерил формата, в която го познаваме днес.

Какво друго е в Unicode?

В допълнение към по-голямата, непрекъснато се актуализира с броя на символите, "Unicode" -Encoding текстова информация е друга полезна черта. Това е така наречената нормализиране. Вместо да преминете през целия характер документ с характер и замества иконите на масата за кореспонденция, използвайте някой от съществуващите нормализация алгоритми. Какво е това?

Вместо да губите ресурсите на компютъра, на редовна проверка от същия характер, който може да бъде подобна на различни азбуки, с помощта на специален алгоритъм. Тя ви позволява да направите подобни символи отделна таблица за справка колона и се прилага вече за тях, а не отново и отново, за да провери отново всички данни.

Тези алгоритми са разработени и реализирани четири. Всяка реализация се осъществява чрез строго определен принцип, различен от другия, така че да се обадя на един от тях не е възможно най-ефективно. Всеки, предназначени за специфични нужди, е отстранена и се използва успешно.

Разпространение стандарт

През 25-те години на своята история кодиране "UNICODE" Получих може би най-разпространената в света. Съгласно този стандарт са регулирани програми и уеб-страници. Обхватът на приложение може да се посочи, че Unicode сега се използва от повече от 60% от Интернет ресурси.

Сега, знаете ли, когато се появи на "Unicode" стандарта. Какво е това, можете също така знаем и да можем да оценим напълно значението на изобретението, направено от група експерти Unicode Inc. Преди повече от 25 години.

Similar articles

 

 

 

 

Trending Now

 

 

 

 

Newest

Copyright © 2018 bg.birmiss.com. Theme powered by WordPress.