Алгоритм сортировки в Юникоде
-
Алгоритм сопоставления Unicode (UCA)
- Определен в техническом отчете Unicode № 10 для сопоставления двоичных ключей из текста.
- Позволяет эффективно сопоставлять и сортировать текст с учетом языка и игнорированием регистра.
-
Таблица элементов сопоставления Unicode (DUCET)
- Содержит порядок сопоставления по умолчанию, настраиваемый для разных языков.
- Данные таблицы хранятся в общем хранилище языковых данных Unicode (CLDR).
-
Реализация UCA в ICU
- UCA реализован в открытых компонентах для Unicode, ICU.
- ICU поддерживает адаптацию и настройки сопоставления из CLDR.
-
Дополнительные ресурсы
- Ссылки на ISO/IEC 14651, Европейские правила оформления заказов (EOR), CLDR и рекомендации.
- Упоминание о неработающих внешних ссылках и инструментах, таких как ICU Locale Explorer и msort.
Полный текст статьи: