問題タブ [xml-encoding]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
80 参照

xml - Python で XML をデータフレームに変換します。xml が解析されない理由につまずく。エンコーディングの問題?

助けていただければ幸いです。私は 2 日以上忙しく、この xml ファイルにアクセスしてその内容を df に入れることができない理由を理解するためにサーフィンをしています。私の目標は、ワークシートを pandas データフレームの xml ファイルに入れることです。このトピックに対処する投稿がいくつかあることは知っていますが、複雑にするいくつかのエラーに直面しているようです。

データは、有名な ETF プロバイダーからダウンロードしたものです。「.xls」としてダウンロードされますが、実際には「xml」形式です。明らかにExcel xlmです。したがって、簡単な pd.read_excel は機能しません。そこで、LXML や xml.etree.ElementTree などの xml 形式やライブラリーに取り掛かることを余儀なくされました。私はBS4でしばらく働いてきました。

xml ダウンロードではエンコーディングが指定されておらず、解析しようとするとエラーが返されます。だから私はchardetとet.XMLParserをいじって、それがエンコーディングであることを発見し、パーサーに「ハードセット」させました。しかし、役に立たない。解析すると次のように返されます。

「lxml.etree.XMLSyntaxError: ドキュメントが空です、行 1、列 1」

それを直接解析する代わりに (以下の xml_tree1 を参照)、fromstring を使用して xml を読み取ろうとしたところ、意味不明なことに気付きました。だから私はそれを何も置き換えませんでした:

xml_str = xml_file.read().replace('', '')

今、私はきれいな xml コードを持っていますが、まだルートに子を見つけることができません。実際、それは空で、まったく解析されていないようです。私の知識は私を失望させています。誰かが私を正しい方向に押してくれませんか? 私の問題は初期段階にあります。ファイルとその基になる形式を解析できないようです。2 つ目の問題は、ドキュメント内のそれぞれのワークシートで ss:table を解析する必要があることです。コードのもう少し先に、作業用にいくつかの例を書き留めました。どんなコメントでも大歓迎です。

これらは私を最も助けた投稿です。

ElementTree で XML を解析するときに子ノードのテキスト値を取得するにはどうすればよいですか

ElementTree で .xml のようなスプレッドシートを読み取る

xml のソースはここにあります (オランダ語版)。右上隅からダウンロードできます。

https://www.ishares.com/nl/professionele-belegger/nl/producten/251882/ishares-msci-world-ucits-etf-acc-fund

XML のスニペット:

これまでの私のコード:

0 投票する
1 に答える
43 参照

xml - WSProxy: SOAP サービスを呼び出そうとしてネストされた障害エラーが発生しました

SOAP サービスを呼び出そうとするとエラーが発生します。クライアントは本文コンテンツの「サンプル」を提供しましたが、オンライン XML バリデーターで得られる最良の方法は次のエラーです。

リクエストの本文は次のとおりです。

誰がここでエラーが何であるかを見ることができますか?