Яndex.Server 3.1 ДОКУМЕНТАЦИЯ

       

Конфигурация XML-парсера Проектирование конфигурации XML-парсера


В процессе разработки конфигурации XML-парсера рекомендуется придерживаться тех же основных шагов, что подробно описаны в разделе Проектирование конфигурации HTML-парсера:

  • Определить имена поисковых зон и поисковых атрибутов, которые будут участвовать в языке запросов.

  • Для каждой поисковой зоны указать список имен XML-элементов, содержимое которых должно принадлежать данной поисковой зоне. Определить, будут ли некоторые поисковые зоны условными.

  • Для каждого поискового атрибута выбрать его тип и список пар (имя XML-элемента, имя XML-атрибута этого элемента), определяющих атрибут.

  • Дополнительно, для каждого XML-элемента можно определить способ обработки текста - границы слов и абзацев, способ обработки пробелов и вес слов.



Содержание раздела