Проблема с индексированием
У меня есть файл HTML, с которым у меня проблема через Index Server. Вот текст в вопросе.
(B) $10,800 per linear mile for
(C) $40,000 per linear mile for any
Моя проблема с суммами в долларах.
- Если я ищу 800, он находит документ
- Если я ищу 10 долларов, он находит документ
- Если я ищу 40 долларов, он находит документ
- Если я найду 10 800, 10 800, 40 000 или 40 000 долларов, документ не будет найден, независимо от того, заключу ли я текст в двойные кавычки.
Я подумал, что, возможно, это запятая, но я могу найти другие документы в репозитории сервера индексирования с 40000, и он найдет его. Я удалил каталог и переиндексировал всю структуру данных, но безрезультатно.
Есть идеи?
1 ответ
Я наконец понял это (приблизительно через два дня):
Прямо перед рассматриваемым текстом была серия неразрывных пробелов (& nbsp;). Я заменил последний физическим пространством и переиндексировал его - я думаю, что служба индексирования недостаточно умна, чтобы игнорировать их или рассматривать их как ПРОБЕЛ!