Языки разметки. xml и альтернативные форматы

      Комментарии к записи Языки разметки. xml и альтернативные форматы отключены

XML – одна из самых обширно применяемых в современном интернете разработок работы с данными. Но в чём именно она содержится, в состоянии сообщить только немногие пользователи Глобальной сети. Давайте попытаемся совместно разобраться в XML и других ему форматах.

Языки разметки. xml и альтернативные форматы

Что такое XML?

XML – это eXtensible Markup Language, что переводится как «расширенный язык разметки». Практически, это метод записи данных в структурированном виде, что будет читаем для пользователя, но наряду с этим удобен для обработки ПО. Вот пример данных в виде XML:

Хлеб Мука Дрожжи Тёплая вода Соль Смешать все ингредиенты и шепетильно замесить. Закрыть тканью и оставить на один час в тёплом помещении. Замесить ещё раз, положить на противень и поставить в духовку.

Додумались, что это? Кулинарный рецепт. Приблизительно так может смотреться запись рецепта в XML-базы данных. Давайте взглянуть на него внимательнее. Такая первая строка непременно присутствует во всех XML-документах, это подтверждение того, что формат вправду XML, и, помимо этого, в ней указывается кодировка знаков, применяемых в документе. По окончании неё уже направляться фактически содержимое документа. Мельчайший «кусочек» документа, ограниченной парой «скобок» именуется тегом. Такое наименование пришло из языка гипертекстовой разметки HTML, что употребляется во Глобальной паутине для оформления Web-страниц. При помощи тегов формируются элементы документа – эти, ограниченные парой тегов и . Элементы смогут содержать в себе атрибуты – к примеру, во второй строке отечественного с вами примера атрибутами элемента Recipe будут name, prep_time и cook_time. Кроме этого в этого элемента ещё находятся другие, положенные элементы – это содержимое элемента. Вместо пары тегов для обозначения границ элемента может употребляться один тег вида , но тогда у для того чтобы элемента не может быть положенных элементов.

Содержимое XML-документа возможно представить в виде древовидной структуры данных. Наряду с этим стандарт XML требует, дабы у этого дерева был «ствол» ? корневой элемент, что будет содержать в себя все остальные, и таковой корневой элемент должен быть единственным. Как и в HTML-разметке, особые знаки (амперсанд «», символы неравенства, кавычки и апостроф) должны быть записаны в виде особых символьных комбинаций, каковые именуются предопределёнными сущностями. Подобно возможно вставлять ссылки на сущности – это символическая замена какой-либо сущности (другими словами комбинации знаков) выражением вида «имя_сущности;» (без кавычек в документе). Наряду с этим ссылка возможно на предопределённую сущность либо на какую-то сущность, хранящуюся в DTD-документе.

Что такое DTD?

DTD (англ. Document Type Definition – описание типа документа) – документ, в котором описывается структура XML-документа. Описание документа при помощи DTD выглядит приблизительно следующим образом:

Тут мы видим следующую картину: корневой элемент – это list, а элементы, содержащиеся в него – это item. Значок «*» свидетельствует, что этих элементов возможно любое число, от 0 до фактически бесконечности. Любой элемент item содержит в себе элементы par1 и par2, причём значок вопроса свидетельствует, что присутствие par2 не есть необходимым.

Сейчас формат описания структуры DTD всё больше изменяется на XML Schema. Оба эти формата обрисовывают, какие конкретно элементы обязан содержать в себе XML-документ, какими атрибутами смогут владеть эти самые элементы и какого именно типа должны быть элементов и значения атрибутов. Синтаксисы DTD и Schema значительно отличаются. Посредством Schema то же самое возможно записать следующим образом:

Как видите, описание документа при помощи Schema больше похоже на саму XML-разметку (фактически, в случае, если присмотреться, это именно она и имеется).

JSON – первая альтернатива XML

Не обращая внимания на то, что XML – весьма распространённый метод записи данных, он не есть единственным и неповторимым в собственном роде. Одна из других текстовых форм записи данных именуется JSON. Расшифровывается эта сокращение как JavaScript Object Notation – что-то наподобие «запись объектов посредством JavaScript». Стоит подчернуть, что для пользователя данный формат, на мой взор, эргономичнее, чем XML. Чтобы это утверждение не смотрелось бездоказательным, приведу пример данных в JSON-представлении:

var earth = { planet : { name : earth, type : small, info: [ Earth is a small planet, third from the sun, Surface coverage of water is roughly two-thirds, Exhibits a remarkable diversity of climates and landscapes ] } };

Пользователю значительно несложнее, как говорится, отделить зёрна от плевел, чем при с XML, потому, что нет открывающих и закрывающих тегов. Это, кстати, приводит и к тому, что на громадных количествах данных экономится память, которую эти теги занимают. Программистам будет приятно выяснить, что JSON лучше, чем XML, подходит и для применения в AJAX. Главное его преимущество – в простоте обработки JSON-данных на стороне клиента.

Вторая альтернатива: YAML

YAML – это рекурсивная сокращение, которая расшифровывается как «YAML Ain’t Markup Language» (по-русски это будет звучать как «YAML не есть языком разметки»). Чем он наряду с этим есть, действительно, его создатели уточнять не берутся, но, пожалуй, определение «язык разметки» будет всё-таки достаточно подходящим. Чем YAML отличается от XML? Компактностью представления данных и удобством их редактирования для человека. Вот как выглядят эти, записанные посредством YAML:

— — — PRIVMSG — newUri — ‘^http://.*’ — — PRIVMSG — deleteUri — ^delete.* — — PRIVMSG — randomUri — ^random.*

YAML-разметка в громадных документах больше подходит для их ручного редактирования, потому, что тут теги не загромождают смысловую часть документа. на данный момент YAML используется деятельно в некоторых инструментах программирования, но в целом эта разработка ещё достаточно молода, а потому не через чур распространена.

Для чего необходимы XML, JSON, YAML?

XML и другие форматы сейчас начинают употребляться всё более деятельно в мире. И на другими словами множество объективных обстоятельств. Одной из основных эксперты в большинстве случаев именуют доступность этих форматов для чтения как человеком, так и компьютером. на данный момент в мире существует очень много инструментов для работы с XML, каковые смогут использовать как программисты, так и конечные пользователи ПО.

Кроме этого громадным плюсом XML и других аналогичных форматов есть то, что они разрешают обрисовывать эти фактически любой сложности и структуры, потому, что эти представляются в древовидной форме. К тому же, потому, что каждые данные в них – это легко текст, то и трудиться с ними возможно как с текстом: кодировать, набирать XML-документы в блокноте, а при утраты части данных остальные будут так же, как и прежде читабельны. Помимо этого, текст возможно применять на любой платформе.

Что касается XML, то весьма широкое использование данный стандарт отыскал во Глобальной паутине. На базе XML создана разработка XSL, благодаря которой XML-документы преобразуются особым образом, в соответствии со правилами и стандартами, в HTML-документы, каковые уже возможно отображать в браузере. Не смотря на то, что в действительности сущность разработке XSL существенно шире, и её возможно использовать для преобразования XML-документа в фактически любой формат. JSON и YAML употребляются до тех пор пока что реже, но у этих разработок громадной потенциал, который связан с развитием Web 2.0, и в сети возможно отыскать всё больше мест, где они кроме этого используются.

Язык разметки HTML


Интересные записи: