問題タブ [interval-intersection]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
452 参照

python - 重複した日付 + uniqueID による Pandas での Intervalindex マージ

SOの最初の質問、まだpythonとpandasを学んでいます

編集:一意のID +日付インデックスを持つために、DFの値をロングからワイドにピボットすることに成功しました(たとえば、1日に1行を超えるuniqueIDはありません)。しかし、私はまだ私の望む結果を達成することができませんでした.

A) uniqueID と B) に基づいてマージしたい DF がいくつかあります。私が探しているものに近づくこの質問を見つけました。ただし、解決策が実行可能ではなく、少し掘り下げた後、日付が重複しているため、私が試みていることが不可能であるように見えます(?)

これの要点は次のとおりです。uniqueID が df_dates_range 内にあり、対応する日の列が dates_ranges の start:end 範囲内にある場合、df_values のすべての値を合計します。

各 DF にはさらに多くの列がありますが、これらは関連するものです。どこでも重複し、特定の順序がないことを意味します。すべてのDFシリーズは適切にフォーマットされています。

したがって、ここに df1、dates_range があります。

そして df2、値:

最初のリンクから、次を実行してみました。

ただし、このエラーが発生します。n00b をチェックし、2 日目から最終日のインデックスを削除しましたが、問題は解決しませんでした:

期待される結果は次のとおりです。

またはグラフィック視覚化で:

ここに画像の説明を入力

v2 期間中、uniqueID 11 には「アクティビティ」がなかったため、列 S & T @ 行 10 が NaN であることに注意してください。ただし、可能であれば、どうにかして df2 からタグを取得できるようにしたいと考えています。彼らは 100% そこにいますが、その期間ではないかもしれません。おそらく 2 番目のスクリプトのタスクですか? また、列 T は列 J+K の集合であることに注意してください。

編集:私は以前に @firelynx のこの質問に対する解決策を使用してこれを実行しようとしたことを忘れていましたが、32GB RAM にもかかわらず、私のマシンは対応できませんでした。いくつかの理由でSQLソリューションが機能しませんでした.sqlite3ライブラリの問題がありました