Онлайн-руководство разработчика NetCat
Модуль «Поиск по сайту» 12.2.1Начало работы с модулем 12.2.2Язык запросов 12.2.3Способы хранения индекса 12.2.4Интерфейс модуля в панели управления сайтом 12.2.5Области индексирования 12.2.6Области HTML-страниц 12.2.7Области поиска на сайте 12.2.8Индексирование по расписанию, запуск индексирования в фоновом режиме 12.2.9Правила индексирования 12.2.10Постановка задачи переиндексирования в очередь 12.2.11Интеграция модуля в макеты дизайна сайта 12.2.12Простая форма поиска 12.2.13Расширенная форма поиска 12.2.14Вывод результатов поиска 12.2.15Стилизация списка подсказок 12.2.16Расширенные настройки 12.2.17Разработка расширений модуля 12.2.18Обзор архитектуры модуля 12.2.19Обработчики документов различных типов 12.2.20Текстовые фильтры 12.2.21Анализаторы текста 12.2.22Корректировщики запросов 12.2.23Подключение других поисковых систем 12.2.24Решение проблем с поиском 12.2.25Решение проблем с индексированием 12.2.26Справочник API

Текстовые фильтры

Текстовые фильтры (наследуют nc_search_language_filter) обрабатывают текст как на этапе индексирования, так и при обработке поисковых запросов. Результатом применения цепочки фильтров является набор слов в том виде, в котором они подлежат индексированию (отсечены короткие и стоп-слова, слова приведены к одному регистру, находятся в базовой форме).

Например, если перед вами стоит задача организовать поиск текста на французском языке без учёта диакритических знаков (диакритические знаки не обязательны для заглавных букв, поэтому слова в верхнем регистре могут не находиться при поиске), вы можете создать текстовый фильтр:

<?php
class my_diacritics_filter extends nc_search_language_filter {
	public function filter(array $words) {
		foreach ($words as $i => $word) {
			$words[$i] = strtr($word, "ÀÂÇÈÉÊËÎÏÔÙÛÜŸ", "AACEEEEIIOUUUY");
		}
		
		return $words;
	}
}

Созданный фильтр необходимо добавить в список на вкладке «Настройки» — «Расширения», указав соответствующий язык и подобрав приоритет таким образом, чтобы фильтр находился между фильтрами nc_search_language_filter_case и nc_search_language_filter_analyzer (приоритет от 61 до 99).

Описание проекта