Проблема: Если вы используете Sphinx для для поиска на украинском или русском языке, то у вас могут возникнуть трудности с поиском слов содержащих буквы ї
, і
, є
, ґ
, ё
и т.д. В результатах поиска слово «місто», к примеру, будет разбито на «м» и «сто».
Решение: Для полноценного поиска на украинском языке необходимо настроить таблицу символов charset_table
в конфиге sphinx ( /etc/sphinxsearch/sphinx.conf
) следующим образом:
index indexName { # Ukrainian chars charset_table = 0..9, _, A..Z->a..z, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F, U+404->U+454, U+454, U+406->U+456, U+456, U+407->U+457, U+457, U+490->U+491, U+491, U+401->U+435, U+451->U+435, U+002D ignore_chars = U+0021..U+002C, U+002E, U+002F, U+003A..U+0040, U+0060, U+2019, U+00AB, U+00BB morphology = stem_enru }Читать далее...