WAP Binary XML (WBXML) — компактное бинарное представление XML. Разработано Open Mobile Alliance для передачи через беспроводные соединения с низкой скоростью. В данный момент WBXML рассматривается Консорциумом Всемирной паутины для включения в семейство стандартов WAP. Текущая версия 1.3.

WBXML сейчас используется в SyncML, WML, Wireless Village, OMA DRM, программировании телефонов через беспроводную связь.

Структура

править

Для кодирования чисел используется многобайтовое представление. Последний байт начинается с бита 0, остальные — с 1. Остальные 7 бит уже кодируют положительное целое число.

Файл начинается с байта с номером версии WBXML (версия 1.3 кодируется как 0x03). Далее идёт тип документа в виде ссылки на строку с именем (в таблице строк) или кода для хорошо известных типов, например, WML. Следующее число указывает на кодировку, коды которой указаны в «IANA Charset MIB» (RFC 3808). В конце заголовка идёт таблица строк (сначала длина, а потом содержимое). Строки в ней разделены символом NULL. Для большей компактности строки в названии тега, атрибутах и содержимом можно указать просто как смещения в этой таблице.

Если формат XML-документа заранее известен, то название тегов и атрибутов можно обозначить заранее обговорённым байтом. Чтобы использовать более 256 имён, они разделены на страницы, которые можно менять с помощью специальной команды: байт SWITCH_PAGE и байт с номером страницы.

Перед каждым тегом идёт байт, указывающий, имеет ли он атрибуты и содержимое (LITERAL, LITERAL_A, LITERAL_C или LITERAL_CA) и смещение в таблице строк. Или он может быть указан в виде байта, где первый бит указывает на наличие атрибутов, второй — содержимого, а остальные кодируют заранее договорённый код тега. Атрибуты указаны далее как обговорённый байт или LITERAL и ссылки на таблицу строк. Далее - строка с его значением и байт END. Строки, как в значении атрибута, так и в содержимом тега, могут быть либо байтом STR_T и смещением в таблице строк, либо STR_I и строкой с NULL на конце. Содержимое тега закрывается байтом END.

Тег может содержать и бинарные данные (например, изображение или сжатую информацию), которые кодируются в виде специального байта OPAQUE, длины данных и самого содержимого.

См. также

править

Ссылки

править

📚 Artikel Terkait di Wikipedia

Microsoft Word

Word 2007 «использует по умолчанию» формат, основанный на XML, — Microsoft Office Open XML. Спецификации форматов файлов Word 97-2007 были опубликованы

Matroska

что основан на EBML (Extensible Binary Meta Language — расширяемый двоичный метаязык) — двоичном аналоге языка XML. Использование EBML позволяет расширять

EBML

 Extensible Binary Meta Language — расширяемый бинарный метаязык) — двоичный формат файлов, при создании которого стояла задача создать аналог XML для двоичных

SyncML

использует разметку XML и различные протоколы для передачи данных. Реализация клиентских приложений для SyncML позволяет использовать WAP Binary XML для уменьшения

Список MIME-типов

application/soap+xml: SOAP (RFC 3902) application/font-woff: Web Open Font Format application/xhtml+xml: XHTML (RFC 3236) application/xml-dtd: DTD (RFC 3023)

XOP

(англ. XML-binary Optimized Packaging) — механизм, рекомендованный W3C для встраивания двоичных данных в набор информационных элементов XML (XML Information

Base64

или . и - для использования в токенах имён XML (Nmtoken), или _ и : в более ограниченных идентификаторах XML (Name). В некоторых случаях для URL применяется

Консорциум Всемирной паутины

XForms XHTML XInclude XLink XML XML Base XML Binary Characterization XML Encryption XML Key Management XML Query XML Schema XML Signature XPath XPointer