問題タブ [data-representation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
r - R におけるカテゴリの行列表現
Category1、Category2、Category3、Category2 などの一連のカテゴリを含む列があります。R でそれらを次のビューのマトリックスとして表す方法はありますか。
フィードバックは大歓迎です。
java - ハッシュマップを使用したデータ表現
次のような多くの重複したエントリを含むファイルがあります。
そこにある各エンティティには ID も関連付けられています。
各エンティティを単独で取得したいのですが、あいまいさを解消するため、 のようなものではHudson
、各エンティティを複数の ID に関連付けることができるため、おそらく下Hudson
に 1 つは川用、もう 1 つは湾用、町用、等々。
これを行う最善の方法は、名前がキーであるハッシュマップを使用することだと思いますが、そうですか?
ハッシュマップを JSON 形式またはその他の非常に悪意のあるデータ表現で出力する方法はありますか?
python - LIBSVM のマルチクラス表現
私の目標は、マルチクラス分類器を作成して、少なくとも 2 つのクラス (またはラベル) でラベル付けされるさまざまなファイルを操作することです。これらのファイルは議会のイニシアチブであるため、各ファイルは少なくとも 1 組の値で類義語辞典に索引付けされます。
Snowball、NLTK ...
このバージョンでは、マルチ分類を直接使用する
ことはできません。ただし、合計 k * (k-1) / 2 (「k」はクラスの数) を生成するマルチクラス分類モデルをプログラムすることは可能です。
LIBSVM の表現は次のとおりです。
次に、5 つのクラスを持つファイルの場合、クラスを変更するだけで前の行の 5 回を生成する必要がありますか?
例えば:
1 1:3 2:4 6:5….
2 1:3 2:4 6:5….
3 1:3 2:4 6:5….
4 1:3 2:4 6:5….
5 1:3 2:4 6:5….
ありがとうございます。
c++ - ポリモーフィックなデータ変換・変換設計パターン
問題は次のとおりです。
次のクラスを検討してください
このクラスのデータ メンバーを公開することが完全に理にかなっていると仮定します。
このようなクラスが多数あり、それぞれが異なるメンバーを持ち、おそらくすべて同じ基本クラス「base_data」から派生していると考えてください。
これらのクラスは、データの他の任意の表現からエクスポート、インポート、構築、「設定」および「取得」する必要があります。
例えば:
はそのような表現の 1 つです。
さらに、これらの操作はすべてまとめて実行する必要があります。つまり、base_data* オブジェクトのコレクションを通じてポリモーフィックに実行する必要があります。
この問題の解決策の 1 つは、次のように base_data でインターフェイスを提供することです。
各派生クラスはそのメンバーを知っているため、変換方法を知っています。追加の派生クラスは、フォームのコンストラクターを提供できます
抽象ファクトリパターンを簡単に定義できるようにする。
この問題に対する別の解決策は、派生型ごとにいくつかの名前空間で静的変換関数を提供することです。
したがって、「オブジェクト指向の少ない」ソリューションと、おそらくこれらの変換操作を大量に実行する機能を犠牲にして、派生クラスの汚染を回避します。
これは、any_map 以外の多くの表現をサポートする必要がある可能性を考えると、より理にかなっています。
しかし、繰り返しますが、これはポリモーフィックではありません。
私が読んだほとんどの「変換」設計パターンはインターフェイスを扱っていますが、ポリモーフィズムのコンテキストでデータの変換/変換を正式に扱うものは見つかりませんでした。
この問題に正式に対処する設計パターンへの参照、実装の進め方に関するアドバイス、および/または私のアプローチの明らかな欠陥の指摘を探しています。
math - N 次元空間における一連の点の数学的表現?
N次元空間にいくつかのxデータポイントがある場合、それらのxポイントのサブセットを記述できる固定長表現を見つけようとしていますか? たとえば、s 部分集合の平均はその部分集合を表すことができますが、その部分集合のみに固有ではありません。つまり、空間内の他の点が同じ平均を生成する可能性があるため、平均は一意の識別子ではありません。ポイントの数に依存せずにポイントを説明できる独自の尺度を誰か教えてもらえますか?
floating-point - 8 ビット マシンを使用して、正規化された浮動小数点形式で 0.03125 を表現します。
0.03125
8 ビット マシンを使用して、正規化された浮動小数点形式で表現します。符号は 1 ビット、指数は 3 ビット、仮数は 4 ビットです。
指数は 3 を超える形式で格納され、仮数は基数ポイントの 1 桁/ビット前に調整されます。
あ、ごめんなさい!これは、stackoverflow での最初の投稿であり、この種のサイトには慣れていません。私の答えは 0 100 0001 で、それが正しいかどうかわかりません。正の値があるので符号は 0 で、指数は 100 だと思います。それに対する答えは 0001 です。私の英語がかなり下手なので、この質問のやり方を明確に説明できたことを願っています。質問の仕方を訂正していただきありがとうございます。
bash - bashでツリー(リストを葉として)を保存して歩く
統一された形式のファイル名に基づいてデータを分類する方法について疑問に思っています。1_dog_yorkshire.sh
およびのようなファイル名1_cat_persian.sh
を使用すると、単純な正規表現で表すことができます。
[0-9]+_[a-z]+_[a-z]+.sh
以下に示すツリーのような構造を作りたい:
頭に浮かぶ最初の解決策は、多次元連想配列です。ただし、多次元配列は bash ではサポートされていません。Bashでのハッシュされたテーブルの反復は問題になる可能性があるため、ハッシュテーブルも完璧なソリューションではありません。XML/JSON を Bash で使用することは、移植可能で bash で記述されていない限り不可能です。
理想的なシナリオでは、データのどの部分も反復可能である必要があります。たとえば、「2」の各エントリ、「1」の各犬、または「2」のスパイダーにあるタランチュラ リストの要素などです。
サブツリーをトラバースでき、リーフにリストを格納できる、Bash の多次元連想配列の適切な代替となる構造を構築するにはどうすればよいですか?
binary - 大きな10進数を2進数に変換する
私は、数値 3.4219087*10^12 のバイナリ表現を見つけることを任されています。これは非常に大きな数です (これは手動で行う必要があります)。そのため、代わりに変換するために使用できる何らかの近道または手法があるかどうか疑問に思っていました。
java - ローカリゼーションのための地図表現
ロボット用の Java ローカリゼーション システムを書きたいと思います。しかし、私は最初から立ち往生しています。マップの表現方法がわかりません。マップは複雑ではなく、数メートル単位で大きくなることはありません。ロボットが動いているときは変わりません。
センサーから得られる読み取り値は、角度 (コンパスによって提供される) と整数のペア (角度と距離) です。