次のようなキーワードを解析するためのカスタム tokenfilter セットアップがあります。
oracle,java,sybase,vb.net etc.
の中へ
oracle java sybase vb.net
正常に動作していますが、テストドキュメントの1つに次のテキストがあります
,oracle java,sybase,unix
そして、先頭のCOMMAを削除しようとしています
,oracle
以下のコードを使用して
public override bool IncrementToken()
{
if (!input.IncrementToken())
return false;
char[] buffer = termAtt.TermBuffer();
int bufferLength = termAtt.TermLength();
...
else if (bufferLength > 1 && buffer[0] == ',')
{
// strip the starting , off !
offsetAtt.SetOffset(offsetAtt.StartOffset + 1, offsetAtt.EndOffset);
// where offsetAtt = AddAttribute<IOffsetAttribute>();
}
...
return true;
}
ただし、コンマは削除されません
これを機能させる方法について何か助けはありますか?
ありがとう