2

私は小さなpyparsingスクリプトを持っており、ほとんどがMcGuire自身によって書かれていますが、ライブデータセットのか​​なりの数のレコードが欠落しているようです。たとえば、2010年の49件の前立腺切除記録のうち35件を検出して適切に解析します。なぜ他の記録が削除されたのですか?識別可能なパターンはありません。最初の14、最後の14、またはその他すべてではありません。

pyparsingがキャッチするレコードは一貫しているように見えます。つまり、あるレコードの最初の部分と別のレコードの2番目の部分ではありません。

pyparsingがレコードをスキップする原因となる可能性のある特殊文字またはパターンはありますか?

私が持っていた他の考えは、おそらく私のフォーマットのいくつかがそれを台無しにしたということでしたか?出力を少し変更して、csv形式の出力を取得しました。

どこから始めますか?

4

0 に答える 0