Структурированный документ
-
Определение структурированного документа
- Структурированный документ использует разметку для идентификации различных значений, а не только форматирования.
- Компоненты документа могут быть названы «название главы», «пример кода» или «четверостишие», а не просто «Helvetica bold 24».
-
Преимущества структурированных документов
- Структурированные документы облегчают обработку и интеграцию с базами данных и поисковыми системами.
- Они поддерживают иерархические структуры, такие как списки и разделы, в отличие от систем, ориентированных только на форматирование.
- Высокопроизводительные системы поддерживают множество независимых и перекрывающихся наборов компонентов.
-
Правила и схемы структурированных документов
- Системы структурированного документооборота позволяют создавать правила для типов компонентов и их комбинаций.
- Существуют формальные языки для определения схем, такие как XSD, Relax NG и Schematron.
- Документ, соответствующий схеме, называется «действительным».
-
Примеры и использование структурированных документов
- HTML-схема, определенная W3C, является широко используемым способом представления структурированных документов.
- Схемы для специфических доменов, таких как JATS, TEI, UBL и EDI, основаны на XML.
- Структурные семантические теги, такие как <strong>, выражают логическую структуру документа, а не только его форматирование.
-
Семантическая разметка и контекст
- Семантическая разметка включает теги, которые выражают утверждения о масштабах и природе частей документа, а не только инструкции по представлению.
- В HTML существуют теги, которые выражают презентационную семантику, но современные версии разметки предпочитают описательную разметку.
-
Контекст и намерение в структурированных документах
- В разных контекстах и намерениях структура документа может иметь разное значение.
- В книге, посвященной типографике, курсив или жирный шрифт могут иметь смысл, отличный от их использования в других контекстах.
-
Дополнительные ресурсы
- Ссылки на другие статьи и понятия, связанные с структурированными документами.