Юникод

Юникод
стандарт кодировки знаков, разработанный в 1991 организацией Unicode Consortium, который позволяет представить знаки в цифровой форме практически всех письменных языков. В документах Unicode могут соседствовать китайские иероглифы, математические символы, буквы греческого алфавита и кириллицы, при этом становятся ненужными кодовые страницы.
Коды в стандарте Unicode разделены на несколько областей. Область с кодами от U+0000 до U+007F содержит символы набора ASCII с соответствующими кодами. Далее расположены области знаков различных письменностей (например, под символы кириллицы выделены коды от U+0400 до U+052F), знаки пунктуации и технические символы. Часть кодов зарезервирована для использования в будущем. В Юникоде зарезервировано 1.114.112 (220+216) позиций символов, из которых сейчас используется около 90000. Первые 256 знакомест совпадают с кодовой таблицей ISO 8859-1 (Latin-1).
Юникод, подобно «таблице химических элементов Менделеева». Кодовое пространство разделено на 17 «плоскостей» по 65536 (216) символов: (0000–FFFF) Basic Multilingual Plane; (10000–1FFFF) Supplementary Multilingual Plane; (20000–2FFFF) Supplementary Ideographic Plane; плоскости 3-13 (30000–DFFFF) не используется; (E0000–EFFFF) Supplementary Special-purpose Plane; (F0000–FFFFF) зарезервировано для Private Use Area; (100000–10FFFF) зарезервировано для Private Use Area.
Основная многоязыковая плоскость «0» содержит символы практически для всех современных письменностей. Большая часть таблицы занята китайско-японско-корейскими иероглифами.
В Unicode 4.1 в этой плоскости представлены следующие символы:
Базовый латинский алфавит (0000—007F)
Международный фонетический алфавит (IPA) Extensions (0250—02AF)
Греческий и коптский алфавиты (0370—03FF)
Кириллица (0400—04FF), см. также Кириллица в Юникоде
Армянский алфавит (0530—058F)
Еврейский алфавит (0590—05FF)
Арабский алфавит (0600—06FF)
Сирийский алфавит (0700—074F)
Габули тана (0780—07BF)
Индийские письменности: деванагари, бенгали, гурмукхи, гуджарати, ория, тамили, телугу, каннада, малаяли, сингали (0900–0D7F)
Лао (0E80—0EFF)
Тибетская письменность (0F00—0FFF)
Бирманский алфавит (1000—109F)
Грузинский алфавит (10A0—10FF)
Амхарский язык (1200—137F)
Чероки (13A0—13FF)
Силлабарии аборигенов Канады (1400—167F)
Огам (1680—169F)
Международный фонетический алфавит (IPA) Extensions (0250—02AF)
Греческий и коптский алфавиты (0370—03FF)
Кириллица (0400—04FF), см. также Кириллица в Юникоде
Армянский алфавит (0530—058F)
Еврейский алфавит (0590—05FF)
Арабский алфавит (0600—06FF)
Сирийский алфавит (0700—074F)
Габули тана (0780—07BF)
Индийские письменности: деванагари, бенгали, гурмукхи, гуджарати, ория, тамили, телугу, каннада, малаяли, сингали (0900–0D7F)
Лао (0E80—0EFF)
Тибетская письменность (0F00—0FFF)
Бирманский алфавит (1000—109F)
Грузинский алфавит (10A0—10FF)
Амхарский язык (1200—137F)
Чероки (13A0—13FF)
Силлабарии аборигенов Канады (1400—167F)
Огам (1680—169F)
Руны (16A0—16FF)
Филиппинские письменности: тагалог, хануноо (мангьяна), бухид, тагбануа (1700–171F)
Кхмерский силлабарий (1780—17FF)
Монгольский алфавит (1800—18AF)
Лимбу (1900—194F)
Лы (1950—197F)
Тай-ныа (1980—19DF)
Буги (1A00—1A1F)
Математические операторы (2200—22FF)
Азбука Брайля (2800—28FF)
Глаголица (2C00—2C5F)
Коптский алфавит (2C80—2CFF)
Тифинаг (2D30—2D7F)
Хирагана (3040—309F)
Катакана (30A0—30FF)
Чжуинь (Бопомофо) (3100—312F)
Гексаграммы Ицзин (4DC0—4DFF)
Исское письмо (A000—A4 CF)
Силоти-нагри (A800—A82F)
Некоторые письменности будут добавлены в следующей версии Unicode. Эти письменности и предложенные диапазоны перечислены далее: Нко (мандиго) (07C0—07FF), Балийское (1B00—1B7F), Ронг-лепча (1C00—1C4F), Ол-Цемет (сантали) (2DE0—2DFF), Ваи (A500—A61F), Пагба (пассепа) (A840—A87F), Саураштри (AB00—AB5F)
Некоторые другие предложенные расширения: Авестийское и пехлеви (0800—085F), Чам (18B0—18FF), Батакское (1A20—1A5F), Ланна/юан, старое лы (1A80—1AEF), мейтхей/манипури (1C80—1CDF), Варанг-кшити (AA00—AA3F), Соранг-сомпенг (AA40—AA6F)

Грамматологический словарь. 2011.

Игры ⚽ Поможем написать курсовую

Полезное


Смотреть что такое "Юникод" в других словарях:

  • ЮНИКОД — (Unicode), 16 разрядная система кодирования, совместимая с системой ASCII, которая охватывает символы разных письменностей: латинской, кириллической, греческой, а также языков, использующих иероглифы. Система присваивает уникальный код любому… …   Энциклопедический словарь

  • юникод — Юникод, Уникод (Unicode)     Международный стандарт кодирования знаков, применяемый в современных форматах цифровых шрифтов [шрифт, описанный с помощью цифровых данных], основанный на расширенной (преимущественно 16 битной) кодировке знаков. Был… …   Шрифтовая терминология

  • ЮНИКОД — Универсальный код стандарт 16 разрядного кодирования символов. UNICODE включает 28 000 букв, знаков, слогов, параграфов всех национальных языков мира. (англ. Universal code) Словарь бизнес терминов. Академик.ру. 2001 …   Словарь бизнес-терминов

  • юникод — Стандарт кодирования символов, представляющих знаки письменных языков. [ГОСТ Р 54456 2011] Тематики телевидение, радиовещание, видео EN Unicode …   Справочник технического переводчика

  • Юникод — Юникод[1] или Уникод[2] (англ. Unicode)  стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков …   Википедия

  • ЮНИКОД — Юникод, или Уникод (англ. Unicode)  стандарт кодирования символов, позволяющий представить знаки практически всех письменных языков. Стандарт предложен в 1991 году некоммерческой организацией «Консорциум Юникода» (англ. Unicode Consortium,… …   Википедия

  • Юникод в операционных системах Microsoft — Одной из первых компаний, последовательно внедрявших Юникод, была Майкрософт  Windows NT была первой операционной системой, использовавшей Юникод в системных вызовах. Было выбрано двухбайтное представление символов (UCS 2); начиная с Windows …   Википедия

  • Юникод Шрифты — В Unicode 6.0 представлено 109449 позиций символов и 203 блока символов. Юникод Шрифт графический рисунок начертаний букв, знаков, иероглифов которые заключены в стандарте кодирования символов, позволяющие представить знаки многих письменных… …   Википедия

  • Юникод в операционных системах семейства Microsoft Windows — В этой статье отсутствует вступление. Пожалуйста, допишите вводную секцию, кратко раскрывающую тему статьи …   Википедия

  • Юникод в Microsoft Windows — Одной из первых компаний, последовательно внедрявших Юникод, была Майкрософт  Windows NT была первой операционной системой, использовавшей Юникод в системных вызовах. Было выбрано двухбайтное представление символов (UCS 2); начиная с Windows 2000 …   Википедия


Поделиться ссылкой на выделенное

Прямая ссылка:
Нажмите правой клавишей мыши и выберите «Копировать ссылку»