Уважаемые пользователи!
C 7 ноября 2020 года phpBB Group прекратила выпуск обновлений и завершила дальнейшее развитие phpBB версии 3.2.
С 1 августа 2024 года phpBB Group прекращает поддержку phpBB 3.2 на официальном сайте.
Сайт официальной русской поддержки phpBB Guru продолжит поддержку phpBB 3.2 до 31 декабря 2024 года.
С учетом этого, настоятельно рекомендуется обновить конференции до версии 3.3.

Стемминг слов при полнотекстовом поиске

Проблемы с установкой или работой phpBB 3.1.x? Получите помощь здесь!
С 1 июля 2018 года phpBB Group прекращает поддержку phpBB версии 3.1.
Сайт официальной русской поддержки phpBB Guru продолжит поддержку phpBB 3.1 до 1 января 2019 года.
Подробнее: Окончание поддержки phpBB 3.1.
Правила форума
Местная Конституция | Шаблон запроса | Документация (phpBB3) | Мини [FAQ] по phpBB3.1.x | FAQ-3 (phpbb3) | Как задавать вопросы | Как устанавливать расширения

Ваш вопрос может быть удален без объяснения причин, если на него есть ответы по приведённым ссылкам (а вы рискуете получить предупреждение ;) ).
qqaazzxxcc
phpBB 1.0.0
Сообщения: 2
Стаж: 7 лет 8 месяцев

Стемминг слов при полнотекстовом поиске

Сообщение qqaazzxxcc »

Здравствуйте!
У меня установлен phpBB 3.1.9 + MySQL 5.5.43 в администраторском разделе форума изменил поисковый механизм на «MySQL Fulltext» и создал индексы.
Поиск работает, но только по точному совпадению слова, например запросы, по словам «школьник» и «школьника» дают разные не пересекающиеся выборки, хотя по идее должен выдаваться одинаковый результат.
При поисковом механизме «phpBB Native Fulltext » результаты аналогичные.
Предполагаю, что при отправке поста/поиске не выполняется автоматический стемминг слов (или усечение окончаний).
Собственно, это проявляется и здесь на «phpbbguru.net», запросы, по словам «школьник» и «школьника» также дают разные не пересекающиеся выборки. См.:

Код: Выделить всё

http://www.phpbbguru.net/community/search.php?keywords=%D1%88%D0%BA%D0%BE%D0%BB%D1%8C%D0%BD%D0%B8%D0%BA

Код: Выделить всё

http://www.phpbbguru.net/community/search.php?keywords=%D1%88%D0%BA%D0%BE%D0%BB%D1%8C%D0%BD%D0%B8%D0%BA%D0%B0
Вопрос: как подключить/настроить автоматический стемминг слов?

P.S. прошу прощения если этот вопрос уже обсуждался ранее, но к сожалению поиск по форуму ничего не дал.
Аватара пользователя
Sumanai
phpBB 3.0.0 RC5
Сообщения: 1668
Стаж: 9 лет 6 месяцев
Благодарил (а): 257 раз
Поблагодарили: 195 раз

Re: Стемминг слов при полнотекстовом поиске

Сообщение Sumanai »

qqaazzxxcc писал(а): по словам «школьник» и «школьника» дают разные не пересекающиеся выборки
Поэтому используйте школьник*
Аватара пользователя
владимир1983
phpBB 3.2.6
Сообщения: 5954
Стаж: 14 лет
Откуда: Сергиев Посад
Благодарил (а): 306 раз
Поблагодарили: 296 раз

Re: Стемминг слов при полнотекстовом поиске

Сообщение владимир1983 »

qqaazzxxcc, используйте Sphinx Fulltext
http://sphinxsearch.com/docs/current/co ... g-len.html
За ваши деньги решу ваши проблемы. Стучи в ЛС.
Нет человека - нет проблемы. (c)
Вчерашний борщ
phpBB 2.0.4
Сообщения: 416
Стаж: 8 лет 7 месяцев
Благодарил (а): 48 раз
Поблагодарили: 34 раза

Re: Стемминг слов при полнотекстовом поиске

Сообщение Вчерашний борщ »

Sumanai писал(а): Поэтому используйте школьник*
стандартно для языков поисковых запросов. Т есть, вообще не проблема, а проблема - это задать поиск по поисковой фразе школьн*+форм*, к примеру, вот тут все не так радостно, выдаст все по школьникам и форме, даже когда нет совпадения в пределах сообщения по фразе через логическое И.
Аватара пользователя
rxu
phpBB Guru
phpBB Guru
Сообщения: 16372
Стаж: 17 лет 11 месяцев
Откуда: Красноярск
Благодарил (а): 521 раз
Поблагодарили: 1745 раз

Re: Стемминг слов при полнотекстовом поиске

Сообщение rxu »

MySQL не поддерживает стемминг, по крайней мере, без каких-то внешних плагинов. ятд.
Изображение
qqaazzxxcc
phpBB 1.0.0
Сообщения: 2
Стаж: 7 лет 8 месяцев

Re: Стемминг слов при полнотекстовом поиске

Сообщение qqaazzxxcc »

Большое спасибо всем за ответы.

На самом деле я надеялся, что стеммер (ИМХО это стандарт для поисковых движков) уже встроен в phpBB или есть специальный плагин и достаточно его включить и настроить. Но нет, так нет.

Буду смотреть в сторону Sphinx. Раньше в некоторых проектах приходилось использовать Lucene и там есть возможность при индексировании и поиске подключать/указывать анализатор русского языка. Возможно и у Sphinx есть такая же возможность.

Будем считать вопрос закрытым.

Вернуться в «Поддержка phpBB 3.1.x»