Обходчик сайта / паук, который бросает результаты в MySQL

Было предложено использовать mysql для поиска по нашему сайту, так как он будет работать на том же сервере, на котором размещен наш веб-сервер (nginx) и наш db (mysql).

Так как не все наши страницы созданы из базы данных, было предложено, чтобы у нас был сканер, который может сканировать сайт, а также поместить URL страницы и данные в mysql и иметь индекс sphinx для этого.

Кто-нибудь знает о пауке с открытым исходным кодом, который имеет опцию хранения MySQL из коробки.

Благодарю.

1 ответ

Я думаю, что sphider это то, что вы ищете - у нас были хорошие результаты с ним раньше. Кроме того, он может индексировать PDF-файлы и документы, что очень полезно

http://www.sphider.eu/

Другие вопросы по тегам