Команда META Описание HTML документов.

Использование метаданных (команда META) при создании HTML документов


Содержание

Команда META

Команда META (тэг) имеют два возможных атрибута

<META HTTP-EQUIV="имя" CONTENT="содержимое">
<META NAME="имя" CONTENT="содержимое">

META команды (описания-инструкции) должны находиться в заголовке HTML-документа между инструкциями <HEAD> и </HEAD> (особенно это важно для документов, использующих фреймы).

Атрибут HTTP-EQUIV

META-команда с атрибутом HTTP-EQUIV эквивалентна HTTP-заголовку ответа HTTP сервера (некоторые HTTP серверы, могут использовать эти команды для формирования реальных HTTP-заголовков). Обычно они управляют действиями браузеров и могут быть использованы для совершенствования информации, выдаваемой обычными заголовками. Команды META могут дать такой же эффект, что и реальный HTTP-заголовок ответа сервера. Описание HTTP-заголовка ответа дано в RFC1945 (протокол HTTP/1.0) и RFC2068 (протокол HTTP/1.1).

HTTP-заголовки формируются сервером, как правило, согласно информации, заданной в конфигурационных файлах, но могут быть сгенерированы и с помощью CGI-скриптов. Это позволяют сделать серверы Apache, Netscape, CERN, NCSA и некоторые другие. Существуют серверы, которые используют другие механизмы генерирования заголовков (например, через специальный дизайнер, как это сделано в сервере MS IIS). Некоторые генерируемые сервером поля заголовков не могут быть подменены значениями из содержания команды META (в частности Date), другие подменяются только при ненормальном (ошибочном) статус-коде HTTP-ответа (<>200). Если информация, заданная в заголовках (HTTP и META) противоречит друг другу, то значение HTTP-заголовка превалирует над значением команды META (по протоколу, но не все просмотрщики это соблюдают).

Значение: Expires

Источник: HTTP/1.1 (RFC2068)

Дата устаревания документа. Управление кэшированием у клиента в HTTP/1.0. В Netscape Navigator это выглядит следующим образом: если указанная дата прошла, то очередной запрос этого документа вызывает повторный сетевой запрос, а не подгрузку документа из кэша. Дата со значением "0" интерпретируется как "текущее_время". Такое значение заставляет браузер каждый раз при запросе проверять - изменялся ли этот документ. Это, кстати относится и к прокси-агентам. Поисковые роботы могут либо совсем не индексировать такой документ, либо постоянно "просматривать" его.

Дата должна быть задана в формате, описанном в RFC850 (стандартная запись Даты для UNIX систем),

<META HTTP-EQUIV="expires" CONTENT="Wed, 26 Feb 1997 08:21:57 GMT">

что эквивалентно HTTP-заголовку

Expires: Wed, 26 Feb 1997 08:21:57 GMT

Значение: Pragma

Контроль кэширования для протокола HTTP/1.0. Значение может быть только одно "no-cache" (не кэшировать данный документ).

Значение: Content-Type

Источник: HTTP/1.0 (RFC1045)

Указание MIME-типа документа. Может быть расширено указанием кодовой страницы документа (charset). Если же указывать charset в содержании команды META, то Netscape Navigator и MSIE выводят данный документ уже в заданном charset. Однако будьте аккуратны, если текст документа в кодировке Windows имеет значение charset=KOI8-r, то никакими силами пользователь не сможет поменять encoding, чтобы увидеть нормальный русский текст!

<META HTTP-EQUIV="Content-type" CONTENT="text/html; charset=ISO-8859-5">

Значение: Content-language

Источник: HTTP/1.0

Указание языка документа. Может использоваться поисковыми машинами при индексировании страниц. Комбинация поля Accept-Language (посылаемого *броузером) с содержимым Content-language может быть условием выбора сервером того или иного языка.

<META HTTP-EQUIV="Content-language" CONTENT="en-GB">

что эквивалентно HTTP-заголовку

Content-language: en-GB

Язык описывается парой значений (язык-диалект). В примере: Английский-Великобритания. Можно использовать только фиксированные коды языков, например:

    en - английский
    fr - французский
    de - немецкий
    it - итальянский
    ru - русский

Значение: Refresh

Источники: Netscape (Автоматическая перезагрузка документа)

Определение задержки в секундах, после которой браузер автоматически обновляет документ. Дополнительная возможность - автоматическая загрузка другого документа.

<META HTTP-EQUIV="Refresh" Content="3; URL=http://www.name.com/page.html">

что эквивалентно HTTP-заголовку

Refresh: 3; URL=http://www.name.com/page.html

В Netscape Navigator это дает такой же эффект, что и нажатие на кнопку Reload.

Спецификация протокола HTTP "Refresh" автоматически загружает в окно просмотрщика новый документ.

Пример

<META HTTP-EQUIV="Refresh" CONTENT="12; URL=webpage.html">

Если данная команда указана в заголовке документа, то через 12 секунд просмотрщик автоматически заменяет текущий документ на документ, указанный атрибутом URL.

Значение: Window-target

Определяет окно текущей страницы; может быть использован для прекращения появления новых окон браузера при применении фреймовых структур. Действует для многих (но не для всех) браузеров.

<META HTTP-EQUIV="Window-target" CONTENT="_top">

что эквивалентно HTTP-заголовку

Window-target: _top

Значение: Ext-cache

Определяет имя альтернативного кэша для просмотрщика

<META HTTP-EQUIV="Ext-cache" CONTENT="name=/some/path/index.db; istructions=User Instructions">

Значение: PICS-Label

Platform for Internet Content Selection (Platform-Independant Content rating Scheme). Обычно используется для определения рейтинга "взрослости" (adult) содержания (sex,violence, ...):-)) однако это довольно гибкая схема и может использоваться для других целей.

Значение: Cache-Control

Источники: HTTP/1.1

Определяет действия кэша по отношению к данному документу. Возможные значения:

Значение: Vary

Источники: HTTP/1.1

Определяет доступные альтернативы для указанных в CONTENT полей HTTP-заголовка.

<META HTTP-EQUIV="Vary" CONTENT="Content-language">

что эквивалентно HTTP-заголовку

Vary: Content-language

Значение: Lotus

Lotus-редакторы генерируют свои собственные поля Bulletin-Date и Bulletin-Text атрибуты. Bulletin-Text содержит описание документа

Атрибут NAME

Команда META с атрибутом NAME используются в случаях, когда поля не соотносятся с HTTP-заголовками. Принципиально нет никаких ограничений на использования значений этого атрибута, за исключением того, что существует негласная договоренность между создателями поисковых машин и роботов о том как использовать некоторые из них. Ниже приводятся наиболее употребимые значения этого атрибута.

META с атрибутом NAME это поля, содержащие описание документа, или поля, предназначенные для интерпретации поисковыми машинами (роботами). Иногда некоторые поисковые агенты могут интерпретировать значение "Keywords" описанный как NAME, другие - как HTTP-EQUIV

Значение: Robots

Управление индексацией страницы для поисковых роботов.

<META NAME="Robots" CONTENT="NOINDEX,FOLLOW">

Возможные значения:

Значение: Description

Источники: Spidering, Altavista, Infoseek

Краткая аннотация содержания документа. Используется поисковыми системами для описания документа. Задание этого значения полезено в случаях, когда в документе мало текста, когда это управляющий фреймами файл (frameset) или в начале документа используются скрипты. Длина текста до 100 символов.

<META NAME="Description" CONTENT="Документ содержит словарь META-тагов">

Подробнее см. в документе Поиск в Интернет

Значение: Keywords

Источники: Altavista, Infoseek

Используется поисковыми системами для индексирования документа. Обычно здесь указываются синонимы к словам в заголовке (title) или альтернативный заголовок. Длина списка до 1000 символов. Не допускается использование одного и того же ключевого слова более 7 раз, поисковые системы просто будут игнорировать это слово.

<META NAME="Keywords" CONTENT="таги,тэги,метаданные,список">

Подробнее см. в документе Поиск в Интернет

Значение: Document-state

Управление индексацией страницы для поисковых роботов. Определяет частоту индексации - или один раз индексировать, или реиндексировать документ регулярно.

<META NAME="Document-state" CONTENT="Static">

Возможные значения:

Значение: URL

Управление индексацией страницы для поисковых роботов. Определяет частоту индексации - или один раз индексировать, или реиндексировать документ регулярно.

<META NAME="URL" CONTENT="absolute_url">

Значение: Author

Обычно имя автора, формат произвольный.

Значение: Generator

Обычно название и версия редактора, с помощью которого создана эта страница. Может быть использована для определения доли рынка, занимаемого тем или иным продуктом.

Значение: Copyright

Обычно описание авторских прав на документ в произвольном формате.

Значение: Distribution

Возможные значения

Значение: Resource-type

Текущее состояние данного файла. Важен для поисковых систем, т.е. если его значение document, то поисковая система приступает к его индексированию.

Прочие значения

Помимо перечисленных более или менее стандартных значений данного атрибута существует еще множество других специализированных, например, для конкретной поисковой машины.


Федотов А.М. Введение в Internet

Перейти на Главную


<<НАЗАД