エラーは読み取り機能にあると思います。画像内の特殊文字を超えて読み取ることはできませんrepr出力を参照してください
私は次のようにPythonでstring.find()を使用しています:
indexOfClosedDoc = temp.find("</DOC>",indexOfOpenDoc)
ただし、文字列に次のようなテキストがある場合:
SUB
</DOC>
SUBが特殊文字の場合、temp.findはタグを見つけることができません。これを修正する方法に関する提案
例:
失敗する原因となるコード:
handle = open("error.txt",'r');
temp = handle.read();
index = temp.find("</DOC>",0)
if(index == -1):
print "Error"
exit(1)
画像テキストをテキストファイルに入れて、コードを実行します
これは、例のテキストの一時変数のreprです。eror.txtのテキストは、画像の29722行目からすべてです。
' </P>\n\n'
注:read()関数はSUBを超えて読み取ることはないため、検索は問題外です。