だから、私は文字列に対して次の操作をしているテキストファイルで作業しています
def string_operations(string):
1) lowercase
2) remove integers from string
3) remove symbols
4) stemming
この後、私はまだ次のような文字列が残っています:
durham 28x23
私のアプローチには欠陥がありますが、文字列に数値が付加されているかどうかを識別するための適切で迅速な方法があるかどうかを知りたいと思います。
したがって、上記の例では、出力を
durham
もう一つの例:
21st ammendment
与える必要があります:
ammendment
では、どうすればこのようなものに対処できますか?