問題タブ [data-management]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sed - sedを使用して、列ではなく行のパターンを識別します
GNU sedを使用して、行に基づいてパターンを識別できますか?つまり、sed to IDを使用しているパターンに改行を挿入するにはどうすればよいですか?
たとえば、次のデータセット(実際にははるかに大きい)では、重複を検索したときに削除されるべきエラーがありますが、情報が2行でわずかに異なるためではありません(現時点では関係ありません)。 )。
この場合、元のファイルからエラーを完全に削除します。つまり、ファイル内で2行が連続している場合、rs####
これらの2つのコピーと、それに続く6行を消去します。 。それらを新しいファイルに再配置するのは良いことですが、最も重要なのは、それらが元のファイルから削除されることです。
何かのようなもの、
多分
?どんな考えでもいただければ幸いです!
r - 1 つのデータ フレームに複数の市場がある市場のデータを削除する
必要なのは、関数を実行するのに十分なデータがあるかどうかを確認するために df をチェックする方法です。特定の市場に十分なデータがない場合、「市場」全体を削除する方法を知りたいです。たとえば、AD3 のすべてを削除したいと考えています。これは、4 行必要なときに 2 行のデータしかないためです。私の実際のケースでは、23 行未満のデータを持つ市場を削除しようとしていますが、100 以上の市場があります。
これがdput()
私のデータから少し離れたものです。
100 以上の市場が 1 つのデータ フレームに含まれています。したがって、22 行のデータがある場合、その特定の「市場」名に関連付けられている 22 行すべてを削除する必要があります。
r - 時間 1 と時間 2 の間に変更が発生しなかったケースについて、すべての ID のケースを削除します
さまざまなケースを持つ 2 つのデータ フレームがあります。時間 1 から 1 つと時間 2 から 1 つ。時間 1 と時間 2 の間に変更が発生したケースをすばやく特定する方法を探していて、ちょっと立ち往生しています。
ここに例があります。だから、私は時間1からのデータフレームを持っています、
そしてそれはこのように見えます、
時間 2 ロールアラウンド
そして、いくつかの変化が起こり、
これは時間 2 です。
time1 と time 2 の間にケース (任意の行) で変更が発生していないケースについて、すべての ID のケースを削除する簡単な方法を探しています。特定の例では、変更がないのは ID # 2 のみです。 1回目と2回目の間に発生。
このような最終結果を探しています。
任意の助けをいただければ幸いです。
resources - ClassLoader - データの読み込みと保存
うまくいけば、誰かがこれで私を助けてくれます。
ClassLoader を使用することが、コンテンツをロードする最も信頼できる方法であると理解しています。
「[jar bundle]/resources/abc.png」にファイルがある場合、次のようにロードします。
ロードは簡単です。
貯蓄は私を得るものです。
実行中にデータを収集し、終了時にそのデータを保存し、次回にデータをロードして追加し続けるプログラムがあります。
私が考える最も簡単な解決策は、ClassLoaderがそれらを取得できるようにjarバンドルに保存することです。これは可能ですか?それともおすすめ?
リソースを取得して保存するために「ファイル」に頼る必要がない限り、リソースをjarの外に置いてもかまいません。(綺麗に出来ない限り)
../ ClassLoader が探している場所から 1 つ戻ることができれば、実際に jar ファイルを含むディレクトリからデータをきれいに取得するのは簡単です。
何か案は?
sql - 混合クラスの多次元配列を最後の値、文字列でソートするルビー
そこで、いくつかのデータベースから一連の情報を取得して、値の配列を取得します。名前と順序は次のとおりです。
だから私はそれらの配列を持っており、それをテーブルビューに入れ、内部配列の順序を変更せずに部門の値で配列を並べ替える必要があるため、テーブルですべてのアセンブリが一緒になり、すべての GMBEAD BLAST が一緒に...
値を含む配列の例は次のようになります。
はい、いくつ.sort
か.sort_by
のメソッドを試しましたが、配列内の数字では、並べ替えメソッドを入れてもプログラムを実行できません。
r - パネルデータ:「変化前後の年数」を参照する変数の指定方法は?
これは、私の時系列の断面データがどのように構造化されているかです。
変数の変化は、プラスの変化があった場合は「1」、マイナスの変化があった場合は「2」です。
問題
2 つの新しい変数の作成に苦労しています。
(1)「トレンド」という変数
簡単に言うと、この変数は「各グループ (国-年) について、変化 = 1 の場合は傾向 = 1、変化 = 2 までのみ」を表す必要があります。
(2)「時間」という変数
この変数は、正のトレンド (change =1) の前後の年数を指定する必要があります。
つまり、最終的に、データセットは次のようになります。
グループを分離するには、「分割」を使用できると思います。
BUT : これら 2 つの行の間のコマンドは何でしょうか?
この行はシーケンスを生成します
data.time$trend <- lapply(data.time$trend, seq)
BUT : プラスの傾向、すなわち data$trend==1 に制限するにはどうすればよいですか?
どんなアイデアでも大歓迎です!どうもありがとう。
r - R のレベルごとに最初の 80 個の観測値を選択する
次のようなデータセットがあります。
各 TID のすべての変数の最初の 80 個の観測値を選択したいと考えています。これまでのところ、コードを使用して最初の TID のみでこれを行うことができます。
他のすべての TID に対してそれを行うにはどうすればよいですか?
ありがとう!