Яndex.Server 3.1 ДОКУМЕНТАЦИЯ

       

Типы атрибутов


По способам распознавания и обработки различаются следующие типы атрибутов:

  • Значение атрибута распознается как текст, состоящий из последовательности слов, каждое слово обрабатывается с учетом морфологии и участвует по-отдельности в индексировании и поиске. Такие атрибуты будут называться атрибутами типа TEXT.

  • Значение атрибута распознается как неделимая последовательность символов, участвующая в индексировании и поиске как целое. Правила морфологии к такой последовательности не применяются. Такие атрибуты будут называться атрибутами типа LITERAL. Для данного типа атрибутов возможен поиск в интервале значений, с учетом лексикографического сравнения.

  • Значение атрибута распознается как дата или время. Такие атрибуты будут называться атрибутами типа DATE.

  • Значение атрибута распознается как Uniform Resource Locator. Такие атрибуты будут называться атрибутами типа URL.

  • Значение атрибута распознается как целое число. Такие атрибуты будут называться атрибутами типа INTEGER.

Пример 5-5. Типы атрибутов

Некоторый документ имеет атрибут abstract типа TEXT со значением "A general formula is derived for the main gravitomagnetic clock effect in the case of slow motion along an arbitrary elliptical orbit in the exterior field of a slowly rotating mass", атрибут field типа LITERAL со значением "General Relativity and Quantum Cosmology", атрибут publication_date типа DATE со значением "12 Oct 2001 00:00:02 GMT" и атрибут gr-qc типа LITERAL со значением 0110055, идентифицирующий этот документ в международной базе научных публикаций xxx.lanl.gov.



Содержание раздела