問題タブ [n-way]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
header - 20個ほどのファイル間の類似点のみを表示しますか?
HTMLページでいっぱいのディレクトリがあるとしましょう。ヘッダーとフッターは基本的に同じですが、すべてのページの同じ部分だけを表示できるようにしたいと思います。これをn-wayマージと呼びたいのですが、それはそうではありません。すべてのファイルのヘッダーとフッターの間の類似点だけを探しています。
(そして私のヘッダーは、<head>タグだけを意味するのではなく、ページの類似した部分を意味します)。
注:20個のhtmlファイルがあります。
これを行うツールの名前はありますか?
diff - 垂直比較付きのn-way差分ツールはありますか?
複数のファイルを一緒に比較するために使用できるdiffuseを使い始めましたが、20個のファイルを一緒に比較する必要がある場合、行を水平方向に比較できないため、20個すべてから1行を考えていました。ファイルは水平に表示されます。
r - R のツリー モデルは、n>=4 の場合、ノードで n 方向の分割を処理できますか
R ツリー モデルに関する簡単な質問です。多くの変数 (主に数値変数または因子変数) でツリー モデルを作成したいと考えています。変数の 1 つはGenderで、カテゴリはmale、female、unknownです。andライブラリのtree
orrpart
関数を使用すると、 Genderルートから 2 つのブランチしか得られません。不明な性別は、女性とグループ化されて 1 つのカテゴリを形成しています。だから私が得ているブランチはFemale+UnknownとMaleです。ツリーパッケージのpdf http://cran.r-project.org/web/packages/tree/tree.pdfをチェックしたところ、tree
rpart
順序付けられていない因子のレベルは、2 つの空でないグループに分けられます。rpart 関数は、3 水準以上の因子を処理するという点で、tree 関数に非常に似ているように見えます。
したがって、私の質問は、単一のノードから 3 つ以上のブランチを生成できるようにする R の他の関数またはパッケージがあるか、または同じことを行う他のオープン ソース ツールに関する提案があるかどうかです。さらに情報が必要な場合はお知らせください。
multidimensional-array - R で 3 方向 PCA を実行する方法
R で三元主成分分析を実行したいと考えています。その仕組みと結果の解釈方法を説明している記事をいくつか見つけましたが、R での実行方法に関するオンラインの有用なガイドを見つけることができません。
私のデータは、230 個のサンプル、250,000 個の変数、および 50 個の注釈で構成されています。通常、次のタイプのデータに対して 1 つの注釈のみを使用して、標準の PCA を実行するだけです。
標準データ:
ただし、50 個のマトリックスすべてを組み合わせて分析に使用するように、すべての注釈情報を分析に実装したいと考えています。このように、注釈の組み合わせは、単一の注釈が単独で行うよりも多くのサンプル間の分散を説明する場合があります。たとえば、注釈 1 と 4 を一緒にすると、注釈 1 単独よりも多くの分散が説明されます。
注釈 1:
注釈 2:
注釈 3:
注釈 4:
私が見つけたものから、Tucker 3-way PCA を実行できる 3 つのパッケージがあります: ThreeWay、PTAk、および rTensor。ThreeWay を実行しようとしましたが、ThreeWay が使用するデータ構造は非常に扱いにくいようです。これでうまくいくかもしれませんが、ThreeWay の記事の例でもエラーが発生したため、別のパッケージを使用することをお勧めします。
ThreeWay データ構造:
PTAk パッケージには次のものが必要です: 「次数 k のテンソル (配列として)。非同一性メトリクスが使用されている場合、X は配列としてデータを含むリストであり、メトリクスのリストを満たしています」
これが何を意味するのかは私には明らかではありません。テンソルを生成する方法のテンソルパッケージを調べようとしましたが、データからテンソルを作成する方法の基本を説明するのではなく、さまざまなテンソルで大量の乗算を行うため、それらの例は非常に複雑です。
このアプローチの弱点と、テンソルを作成する方法、およびパッケージを使用してそれらを分析する方法についての両方のコメントをいただければ幸いです。
ありがとう