Протокол HTTP 1.1

параметры медиатипов только тогда, когда это требуется по определению

типа/подтипа.

Значения медиатипов регистрируются Internet Assigned Number Authority

(IANA). Процесс регистрации медиатипа определен в RFC 2048. Использование

не зарегистрированных медиатипов запрещено.

3.7.1 Канонизация и предопределенные значения типа text.

Медиатипы Интернет зарегистрированы в канонической форме. В общем

случае тело объекта, передаваемое HTTP сообщением, должно быть представлено

в соответствующей каноническиой форме до передачи; исключение составляют

типы "text", определяемые в следующем абзаце.

В канонической форме медиаподтипы типа "text" используют CRLF в

качестве метки конца строки. HTTP ослабляет это требование и позволяет

передавать текст размеченный таким образом, что еденичные CR или LF могут

быть метками конца строки, правда это правило должно быть выполнено для

всего тела объекта (entity-body). HTTP приложения должны воспринимать CRLF,

просто CR и просто LF как представление конца строки в текстовых типах,

переданных по HTTP. Кроме того, если текст представляется в кодовой

таблице, которая не использует октеты 13 и 10 для CR и LF соответственно,

что имеет место в некоторых многобайтовых кодовых таблицах, то HTTP

позволяет использовать любые последовательности октетов, определенные этим

набором символов для представления эквивалентов CR и LF в качестве кода

конца строки. Эта гибкость в отношении концов строк применима только к

текстовым типам в теле объекта; просто CR или просто LF не должны заменять

CRLF внутри любой управляющей структуры HTTP (например поля заголовка и

разделителей типа multipart).

Если тело объекта кодируется при помощи Content-Encoding, то основные

данные должны быть в определенной выше форме до кодирования.

Параметр "charset" используется с некоторыми медиатипами для указания

кодовой таблицы, используемой для представления данных. Если параметр

"charset" не указан отправителем, то при получении по HTTP медиаподтипы

типа "text" имеют значение "charset", по умолчанию равное "ISO-8859-1".

Данные в кодовых таблицах или их подмножествах, отличных от "ISO-8859-1",

должны быть помечены соответствующим значением "charset".

Некоторое программное обеспечение HTTP/1.0 неправильно

интерпретировало заголовок Content-Type без параметра "charset", как

означающее "должен предположить получатель". Отправители, желающие

предусмотреть такое поведение могут включать параметр "charset" даже когда

charset равен ISO-8859-1 и должны сделать это, если известно, что это не

запутает получателя.

К сожалению, некоторые старые HTTP/1.0 клиенты не работали правильно с

определением параметра "charset". HTTP/1.1 получатели должны отдавать

приоритет метке "charset", поставленной отправителем; и те агенты

пользователей, которые имеют возможность "предположить" charset должны при

первоначальном отображении документа использовать charset из поля content-

type, если они поддерживают такой charset, а затем использовать собственные

установки.

3.7.2 Типы Multipart.

MIME предусматривает ряд типов "multipart" - формирующих пакет из

одного или нескольких объектов внутри тела одного сообщения. Все типы

mulptipart используют общий синтаксис, определеный в MIME, и должны

содержать разделительный параметр частью значения медиатипа. Тело сообщения

- самостоятельный элемент протокола и, следовательно, должно использовать

только СRLF для представления концов строк между частями тела (body-parts).

В отличие от MIME, заключение (epilogue) любого multipart сообщения должно

быть пустым; HTTP приложения не должны передавать заключение (даже если

первоначальный multipart содержит заключение).

В HTTP части тела (body-parts) типа multipart могут содержать поля

заголовка, которые являются значащими в примнении к этой части. Поле

заголовка Content-Location следует включать в часть тела (body-part)

каждого включенного объекта, который может быть идентифицирован URL.

Вообще говоря, HTTP агенту пользователя належит действовать так же

как поступил бы MIME агент пользователя после получения типа multipart.

Если приложение получает незарегистрированный подтип multipart, оно должно

обрабатывать его как подтип "multipart/mixed".

Тип "multipart/form-data" был специально определен для передачи данных

формы, подходящих для обработки методом запроса POST, что описано в RFC

1867.

3.8 Маркеры продуктов (Product Tokens).

Маркеры продуктов используются, чтобы обеспечить коммуникационным

приложениям возможность идентифицировать себя названием и версией

программного обеспечения. Большинство полей, использующих маркеры продуктов

также допускает перечисление подпрограмм, которые формируют значительную

часть приложения, и которые перечисляются через пробел. В соответствии с

соглашением, подпрограммы перечисляются в порядке их значения для

идентификации приложения.

product = token ["/" product-version] product-version = token

Примеры:

User-Agent: CERN-LineMode/2.15 libwww/2.17b3 Server: Apache/0.8.4

Маркеры продуктов должны быть короткими и по сути - использование их

для рекламы или другой несущественной информации однозначно запрещено. Хотя

в лексеме product-version может встречаться любой символ, все же ее следует

использовать только для идентификатора версии (то есть, последовательным

версиям одной и той же программы надлежит иметь отличия только в части

product-version лексемы product.

3.9 Величины качества (Quality Values).

HTTP использует короткие числа "с плавающей точкой" для указания

относительной важности ("веса") различных оговоренных параметров. Вес - это

нормализованое вещественное число в диапазоне от 0 до 1, где 0 -

минимальное, а 1 - максимальное значение. HTTP/1.1 приложения не должны

генерировать более трех цифр после десятичной точки. Пользовательским

конфигурациям этих значений следует также ограничиваться этим режимом.

qvalue = ( "0" [ "." 0*3DIGIT ] ) | ( "1" [ "." 0*3("0") ] )

"Величины качества" - не корректное название, так как эти значения

просто представляют отношение снижения производительности к желательному

качеству.

3.10 Метки языков (Language Tags).

Метка языка идентифицирует естественный язык: разговорный, письменный,

или другой используемый людьми для обмена информацмей с другими людьми.

Машинные языки являются исключением. HTTP использует метки языков внутри

полей Accept-Language и Content-Language.

Синтаксис и запись меток языка в HTTP те же, что определены в RFC

1766. То есть, метка языка состоит из одной или нескольких частей: метка

первичного языка и, возможно пустой, ряд подчиненных меток:

language-tag = primary-tag *( "-" subtag )

primary-tag = 1*8ALPHA subtag = 1*8ALPHA

Внутри метки не допустимы пробелы и все метки не чувствительны к

регистру. Пространство имен меток языка управляется IANA. Например метки

содержат:

en, en-US, en-cockney, i-cherokee, x-pig-latin

Любая двухсимвольная первичная метка является меткой аббревеатуры

языка ISO 639, а любая двухсимвольная подчиненная метка является меткой

кода страны ISO 3166. (Последние три метки из вышеперечисленных - не

зарегистрированные метки; все, кроме последней - примеры меток, которые

скорее всего ьудут зарегистрированы в будущем.)

3.11 Метки объектов (Entity Tags).

Метки объектов используются для сравнения двух или более объектов

одного и того же запрошенного ресурса. HTTP/1.1 использует метки объектов в

полях заголовка ETag, If-Match, If-None-Match, и If-Range. Метка объекта

состоит из непрозрачной строки, заключенной в кавычки (opaque quoted

string), возможно предваренной индикатором слабости (weakness indicator).

entity-tag = [ weak ] opaque-tag

weak = "W/" opaque-tag = quoted-string

"Сильная метка объекта" ("strong entity tag") может быть

распространнена на два объекта ресурса, только тогда, когда они пооктетно

эквивалентны.

"Слабая метка объекта" ("weak entity tag"), обозначяемая префиксом

"W/", может быть распространена на два объекта ресурса только тогда, когда

объекты эквивалентны и могли бы заменять друг друга без значительного

изменения в семантике. Слабая метка объекта может использоваться только для

слабого сравнения (weak comparison).

Метка объекта должна быть уникальна среди всех версий всех объектов,

связанных с конкретным ресурсом. Данное значение метки объекта может

использоваться для объектов, полученных запросами различных URI без

предположения эквивалентности этих объектов.

3.12 Единицы измерения диапазонов (Range Units).

HTTP/1.1 позволяет клиенту запрашивать только часть объекта. HTTP/1.1

использует еденицы измерения диапазонов в полях заголовка Range и Content-

Range. Объект может быть разбит на части соответственно различным

структурным модулям.

range-unit = bytes-unit | other-range-unit

bytes-unit = "bytes" other-range-unit = token

Единственая еденица измерения диапазонов, определенная в HTTP/1.1 -

это "bytes". Реализации HTTP/1.1 могут игнорировать диапазоны, определенные

с использованием других едениц измерения. HTTP/1.1 был разработан, чтобы

обеспечения возможности реализации приложений, которые не зависят от знания

диапазонов.

4. HTTP сообщение (HTTP Message).

4.1 Типы сообщений.

HTTP сообщения делятся на запросы клиента серверу и ответы сервера

клиенту.

HTTP-message = Request | Response ; сообщения HTTP/1.1

Сообщения запроса и ответа используют обобщенный формат сообщения RFC

822 для пересылки объектов (полезной нагрузки сообщения). Оба типа

сообщений выглядят следующим образом: сначала идет начальная строка (start-

line), затем один или несколько полей заголовка (называемых также просто

"заголовки"), затем пустая строка (то есть строка, равная CRLF),

указывающая конец полей заголовка, а затем, возможно, тело сообщения.

generic-message = start-line *message-header CRLF [ message-body ]

start-line = Request-Line | Status-Line

В интересах ошибкоустойчивости, серверам следует игнорировать все

пустые строки, полученные перед строкой запроса (Request-Line). Другими

словами, если сервер читает поток протокола и в самом начале сообщения

получает CRLF, то ему следует этот CRLF игнорировать.

Некоторые ошибочные реализации HTTP/1.0 клиентов генерируют

дополнительные CRLF после запроса POST. Стоит вновь повторить, что это явно

запрещено нормальной записью Бекуса-Наура. HTTP/1.1 клиент не должен

добавлять дополнительные CRLF перед запросом и после него.

4.2 Заголовки сообщений.

Поля заголовков HTTP, которые включают поля общих заголовков (general-

header), заголовков запроса (request-header), заголовков ответа (response-

header), и заголовков объекта (entity-header), имеют такой же обобщенный

формат, как тот, что описан в разделе 3.1 RFC 822. Каждое поле заголовка

состоит из имени поля, двоеточия (":") и значения поля. Имена полей не

чувствительны к регистру. Значению поля может предшествовать любое число

LWS, хотя предпочтителен одиночный SP. Поля заголовка могут занимать

несколько строк. При этом каждая следующая строка продолжения начинается по

крайней мере одним SP или HT. Приложениям следует придерживаться "общей

формы" ("common form") при генерации HTTP конструкций, так как могут

существовать реализации, которые не в состоянии принимать что-либо кроме

общих форм.

message-header = field-name ":" [ field-value ] CRLF

field-name = token field-value = *( field-content | LWS )

field-content =

Порядок, в котором получены поля заголовка с различными именами не

имеет значения. Однако "хорошей практикой" является то, что сначала

посылаются поля общих заголовков, затем поля заголовков запроса или

заголовков ответа, и, наконец, поля заголовков объекта.

Несколько полей заголовка с одиннаковыми именами могут присутствовать

в сообщении тогда и только тогда, когда все значения полей, входящих в

заголовок, определяют разделенный запятыми список [то есть #(value)].

Должно быть возможно объединить несколько таких полей заголовка в одну пару

"имя поля: значение поля" (не измененяя этим семантику сообщения) путем

присоединения каждого последующего значения поля к первому через запятые.

Порядок, в котором получены поля с одинаковыми именами, имеет значение для

интерпретации объединенного значения поля, и, следовательно, прокси-сервер

не должен изменять порядок значений этого поля при пересылке.

4.3 Тело cообщения.

Тело HTTP сообщения (message-body), если оно присутствует,

используется для передачи тела объекта, связанного с запросом или ответом.

Тело сообщения (message-body) отличается от тела объекта (entity-body)

только в том случае, когда применяется кодирование передачи, что

указывается полем заголовка Transfer-Encodingы.

message-body = entity-body |

Поле Transfer-Encoding должно использоваться для указания любого

кодирования передачи, примененного приложением в целях гарантирования

безопасной и правильной передачи сообщения. Поле Transfer-Encoding - это

свойство сообщения, а не объекта, и, таким образом, может быть добавлено

или удалено любым приложением в цепочке запросов/ответов.

Правила, устанавливающие допустимость тела сообщения в сообщении,

различаются для запросов и ответов.

Присутствие тела сообщения в запросе отмечается добавлением к

заголовкам запроса поля заголовка Content-Length или Transfer-Encoding. ело

сообщения (message-body) может быть добавлено в запрос только тогда, когда

метод запроса допускает тело объекта (entity-body).

Включать или не включать тело сообщения (message-body) в сообщение

ответа зависит как от метода запроса, так и от кода состояния ответа. Все

ответы на запрос с методом HEAD не должны включать тело сообщения (message-

body), даже если присутствуют поля заголовка объекта (entity-header),

заставляющие поверить в присутствие объекта. Никакие ответы с

информационными кодами состояния 1xx, кодом 204 (Нет содержимого, No

Content) и кодом 304 (Не модифицирован, Not Modified) не должны содержать

тела сообщения (message-body). Все остальные ответы содержат тело

сообщения, даже если оно имеет нулевую длину.

4.4 Длина сообщения.

Когда тело сообщения (message-body) присутствует в сообщении, длина

этого тела определяется одним из следующих методов (в порядке старшинства):

1. Любое сообщение ответа, которое не должно включать тело сообщения

(message-body) (например ответы с кодами состояния 1xx, 204, 304 и

все ответы на запрос HEAD) всегда завершается пустой строкой после

полей заголовка, независимо от полей заголовка объекта (entity-

header fields), представленных в сообщении.

2. Если поле заголовка Transfer-Encoding присутствует и указывает на

применение кодирования передачи "chunked", то длина определяется

кодированием по кускам (chunked encoding).

3. Если поле заголовка Content-Length присутствует, то его значение

представляет длину тела сообщения (message-body) в байтах.

4. Если сообщение использует медиатип "multipart/byteranges", который

саморазграничен, то он и определяет длину. Этот медиа тип не должен

использоваться, если отправитель не знает, способен ли получатель

его обработать; присутствие в запросе заголовка Range с несколькими

спецификаторами диапазонов байтов (byte-range) подразумевает, что

клиент может анализировать multipart/byteranges ответы.

5. Длина определяется закрытием соединения сервером. (Закрытие

соединения не может использоваться для указания конца тела запроса,

так как в этом случае у сервера не остается никакой возможности

послать обратно ответ).

Для совместимости с HTTP/1.0 приложениями HTTP/1.1 запросы, содержащие

тело сообщения (message-body) должны включать допустимое поле заголовка

Content-Length, пока не известно, что сервер является HTTP/1.1 совместимым.

Если запрос содержит тело сообщения (message-body), и Content-Length не

указано, серверу следует послать ответ с кодом состояния 400 (Испорченный

Запрос, Bad Request), если он не может определить длину сообщения, или с

кодом состояния 411 (Требуется длина, Length Required), если он настаивает

на получении Content-Length.

Все HTTP/1.1 приложения, которые получают объекты, должны понимать

кодирование передачи типа "chunked", таким образом разрешается

использование данного механизма для таких сообщений, длина которых не может

быть определена заранее.

Сообщения не должны одновременно включать и поле заголовка Content-

Length и применять кодирование передачи типа "chunked". Если поступило

сообщение с полем Content-Length и закодированное с применением кодирования

передачи "chunked", то поле Content-Length должно игнорироваться.

Если поле Content-Length присутствует в сообщении, которое допускает

наличие тела сообщения (message-body), то значение поля должно точно

соответствовать числу октетов в теле сообщения. HTTP/1.1 агенты

пользователя должны информировать пользователя в случае получения и

обнаружения недопустимой длины.

4.5 Общие поля заголовка.

Имеется несколько полей заголовка, которые применяются как для

сообщений запросов, так и для сообщений ответов, но которые не применяются

к передаваемому объекту. Эти поля заголовка применяются только к

передаваемому сообщению.

general-header = Cache-Control | Connection | Date | Pragma | Transfer-

Encoding | Upgrade | Via

Имена общих полей заголовка (general-header fields) могут быть надежно

расширены только в сочетании с изменением версии протокола. Однако, новые

или экспериментальные поля заголовка могут получить семантику общих полей

заголовка (general-header fields), если все стороны соединения распознают

их как общие поля заголовка. Нераспознанные поля заголовка обрабатываются

как поля заголовка объекта (entity-header).

5. Запрос (Request).

Сообщение запроса сервера клиентом содержит в первой строке: метод,

который нужно применить к ресурсу, идентификатор ресурса и используемую

версию протокола.

Request = Request-Line *( general-header | request-header | entity-

header ) CRLF [ message-body ]

5.1 Строка запроса (Request-Line).

Строка запроса (Request-Line) начинается с лексемы метода, затем

следует запрашиваемый URI (Request-URI), версия протокола и CRLF. Эти

элементы разделяются SP. В строке запроса (Request-Line) не допустимы CR и

LF, исключение составляет конечная последовательность CRLF.

Request-Line = Method SP Request-URI SP HTTP-Version CRLF

5.1.1 Метод (Method).

Лексема метода указывает метод, который нужно применить к ресурсу,

идентифицированному запрашиваемым URI (Request-URI). Метод чувствителен к

Страницы: 1, 2, 3, 4, 5, 6, 7, 8

МЕНЮ

Протокол HTTP 1.1

ИНТЕРЕСНОЕ