問題タブ [merging-data]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
1427 参照

excel - スプレッドシート内のセルとして複数のテキストファイルの内容をマージしようとしています

基本的に:

それぞれ数値のファイル名(つまり、12345.txt)を持ついくつかの(400)テキストファイルがあります。

各テキストファイルには、いくつかのテキスト(長い説明スタイル、プレーンテキストの段落など)が含まれています。これらすべてのテキストファイルをスプレッドシートにインポートしてCSVにエクスポートできるかどうかを調べようとしています。

シートには2つの列があります。拡張子のないファイル名(12345)と、2番目の列はファイルの内容(ファイルごとに1つのセル)です。

ありがとう。

0 投票する
2 に答える
1970 参照

perl - 複数のエントリを持つ 2 つのファイルを結合するための Perl スクリプト

次のようなタブ区切りのテキスト ファイルがあります。

そして、このような別のもの:

ファイルの1つの「複数」の各エントリが複製され、そのデータが他のファイルに入力されるように、それらを組み合わせる必要があります。

私はスクリプトの経験がほとんどありませんが、たとえば「contig11」がハッシュ/キーを使用してファイルの1つで1回だけ発生する場合にこれを行いました。しかし、私はこれを行うために頭を動かすことさえできません! この問題に取り組む方法について、いくつかの助けやヒントを本当に感謝しています.

編集だから私はこれで池上の提案(答えを見てください)を試しました:しかし、これはGO:100列以降を除いて必要な出力を生成しました($rest in script???) - 私が間違っていることは何ですか?

0 投票する
1 に答える
1422 参照

git - SSH 経由で Git の変更をマージする最善の方法

私はこれについて間違った方向に進んでいると感じています。

私は、3 人の開発者全員が独自の GIT Repo で頻繁に変更を行っているソフトウェア プロジェクトを持っています。彼らは変更をサーバーにプッシュし、そこで変更をマージしてライブ Web ソフトウェアに公開します。

コードをマージするときに競合を解決するために簡単に使用できるソリューションを見つけようとしています (通常、マージごとに多数の競合があります)。私の経験では、VIM だけではこれは非常に遅いですが、Splice というプログラムを見つけました: http://sjl.bitbucket.org/splice.vim/コツをつかも うとしているところです。ただし、このプログラムでもホームページで次のように説明されているようです。

「Splice はマージ ツールです。つまり、サーバー上で SSH 経由ではなく、開発マシン上で作業することになります。」

SSH を介して実稼働サーバーでマージを行うのは、それほど大きな問題ですか? コードをマージする必要があるたびに、サーバー上にあるすべてのコードを取得し、ダウンロード、マージ、および再アップロードするのは、はるかに大きな苦痛のようです。

私はこれに慣れていませんが、何かが欠けているように感じます。これについてもっと良い方法はありますか?

すべてのアドバイスは大歓迎です:)

0 投票する
1 に答える
2198 参照

google-bigquery - BigQuery で関連性の低い 2 つのデータセットをマージする

私は BigQuery を初めて使用します。ご協力をお願いします。他の人に役立つように、ケースを一般的なものにしようとしています。私はそれがかなり基本的であり、何かが欠けていると確信しています...

「マスター」と「新規」の 2 つのデータセットがあります。マスターにはいくつかの列が含まれており、すでに多くの行があります。新しいデータセットをマスター リストにマージしたいのですが、この新しいデータセットのエントリのすべての列に値がある場合とない場合があります。さらに、新しいリストの値は、マスター リストに既に存在する場合と存在しない場合があります。両方に 1 つの一意/主キーがあります (例: Col1) 例:

主人:

Col1 | Col2 | Col3 | Col4

Val11 | Val12 | Val13 | Val14

ヴァル21 | ヴァル22 | ヴァル23 | Val24

Val31 | Val32 | Val33 | Val34

新しい:

Col1 | Col5 | Col6

Val11 | Val15 | ヌル

ヴァル41 | ヴァル45 | Val46

ここに私の質問があります:

1) 2 つのデータセットをマージするには、どのような bigquery を作成する必要がありますか? 次の要件があります: a) レコードで値をマージする必要があります。そこに表示されるはずです。b) 「競合」がある場合は、古い値を新しい値で上書きする必要があります

これは基本的に完全な外部結合だと思いますが、BigQuery は内部結合と左外部結合のみをサポートしています...

2) 可能であれば、さらにネストされたロジックを使用して、2b) をより洗練された方法で実行できるようにしたいと考えています。その 1 つの列の元の値を上書き/保持しないでください (そのレコードの他の値は影響を受けません)。

3) 可能であれば、さらにネストされたロジックを使用して、「val34 と val36 が両方とも TRUE の場合、val38 も TRUE に設定し、そうでない場合は val37 が X の場合、val38 をバツ"

さて、これらは 3 つの異なるが関連する質問です。いずれかで私を助けることができれば、それは本当に素晴らしいことです. ところで、データセットが大きすぎて通常の DB では処理できないため、bigquery を使用しています。これは、チーム全体で簡単に共有できる非常に便利なツールだからです。

あなたの助けと指針に感謝します!

ps ここに BigQuery のドキュメントがあります https://developers.google.com/bigquery/query-reference

0 投票する
2 に答える
2249 参照

pdf - タグを壊さずにタグ付き PDF をマージする

2 つのタグ付き PDF を iTextPDF 5.4.4 バージョンの jar とマージしようとしています。次の行でドキュメントを閉じながらすべての操作を行った後: document.close();): 。以下のエラーがスローされます

この問題の原因を教えてください。

以下は私が使用するコードです。

0 投票する
1 に答える
81 参照

performance - サーバーでユーザー用に PDF をマージするには、リソースを大量に消費しますか?

私はいくつかの調査を行っており、次のことを行うのが良い考えか悪い考えかを調べようとしています.

  1. ユーザーは選択肢を選択します
  2. 選択に基づいて、当社の Web サイトはこれらの選択された PDF を一緒にマージします。
  3. ユーザーは結合された PDF をダウンロードできます。

「Java Open Source PDF Libraries」や「PDFBox」などがあることは知っていますが、主な質問はこれです…</p>

これはサーバー集約的すぎますか?