Pythonでtxtファイルからコードのxml部分を抽出しようとしています。私が使用している現在のtxtファイルはedgarデータベースからのもので、1つのtxtファイルに10-kレポートの複数の表現があり、html、xml、PDFなどの他の表現があります。
この xml を抽出してタグを使用できるようにする方法を誰かが知っている場合は、大いに感謝します。
私が話している txt ファイルの例を次に示し ます。
Pythonでtxtファイルからコードのxml部分を抽出しようとしています。私が使用している現在のtxtファイルはedgarデータベースからのもので、1つのtxtファイルに10-kレポートの複数の表現があり、html、xml、PDFなどの他の表現があります。
この xml を抽出してタグを使用できるようにする方法を誰かが知っている場合は、大いに感謝します。
私が話している txt ファイルの例を次に示し ます。