こんにちは zend_lucene_search にコンテキストをフィードしています。特殊文字までの単語を検索できますが、それ以降は検索できません。
例えば:
very well to the other job boards � one of the main things that has impressed is the variety of the applications, especially with regards to the background of the candidates" manoj � Head
「ボード」を検索すると取得できますが、判読できない文字の後に 1 つまたは任意の文字列を検索すると、検索できません。
これらを削除する方法とプレーンテキストを取得したい。
.docx/pdf ファイルをテキストに変換すると、このような文字が表示されます。
また
テキストのみを zend_search_lucene にフィードする方法を教えてください。
助けてください。