1

以下の条件で、PYTHON の大きなテキスト ファイルを複数のサブファイルに分割しようとしています。

  1. サブファイルの文字数制限は 1024 文字です
  2. 完全な英語の文 (つまり、ピリオドから次のピリオドまで) は、同じファイルで終了する必要があります。
  3. また、行が 1.txt で終わらない場合は 2.txt である必要があり、2.txt ファイルの長さを再計算する必要があります (1024 文字を超えないようにします)。

私が試したコードは次のとおりです(条件1を順守できましたが、条件2と3を満たすことができませんでした):

maxChar = len(doc_text) #doc_text is the string containing the large text
excesstext = []
times = [1024 * i for i in range(0,int(maxChar/1024))]

for i in range(0, len(times)-1):
  tempchar = ''
  tempchar = tempchar + doc_text[times[i]:times[i+1]]
  tempchar = tempchar.rsplit('.',1)
  excesstext.append(tempchar[1])
  with open( f'/content/trunc/{i}.txt', encoding='utf-8', mode='w') as f:
    if len(excesstext)>1:
      print(tempchar[0] + excesstext[i-1])
      f.write(tempchar[0] + excesstext[i-1])
    else:
      print(tempchar[0])
      f.write(tempchar[0])

可能であれば、私を助けてください。ありがとうございました!!

4

0 に答える 0