問題タブ [information-theory]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - セットをプレフィックスなしにする
特定の文字列セットをプレフィックスなしにするための標準または最適なアルゴリズムはありますか? つまり、文字列のセットが与えられた場合、そのセットにも (短い) プレフィックスを持つすべての文字列を破棄します。
念のため、最終的にはこれを Python 2.7 で実装する予定です。
information-theory - 情報コンテンツの概念を理解する
私はコンピューター サイエンスを勉強していませんが、情報コンテンツの概念を理解することに興味があります。
次の 2 つの例文を見ました。
文 b) はより高い情報量を持っていると言えます。なぜなら、文 a) の可能性は、より少ない/多い可能性だけであり、文 b) の可能性は無限にあるからです。
b) の方が情報量が多いことに同意しますが、説明がわかりません。
b) のほうが情報量が多いと言えます。これは、実際の温度が正確にわかるからです。
しかし、私の直感的な理解は間違っていると思います。解釈の余地がないメッセージは、情報量が多いと言えます。
私は自発的に、b) の方がより有益であると言うでしょう。ここは正しいですか?
私の非科学的な理解では、情報量の多いコンテンツは良いでしょう。しかし、情報理論では、メッセージがエンコードに多くのビットを必要とすることを意味し、情報は良いものではなく、送信する必要があるものと見なされるため、情報量が多いことは悪いことだと思います。それはそれを置く良い方法ですか?
matlab - 信号の準定常部分の推定
Matlab で信号の推定準定常部分を推定しようとしています。鳥が発する 1 秒間の音信号です。
MFCC を使用して特徴を抽出していますが、統計的に準定常部分で動作することが保証されている MFCC のウィンドウ サイズが必要です。
私の質問は次のとおりです。
- フィーチャの 2 次モーメントの変化を観察し、2 次モーメントがもはや変化していない場所を決定することによって、ウィンドウ サイズを 1 秒からより短い間隔に変更することを反復する場合、それは堅実なアプローチだと思いますか?
- MFCC ウィンドウ サイズを再度変更してシャノン エントロピー法を使用する場合、エントロピー アルゴリズムの出力で取得したビット数は、信号の準定常部分の推定を識別するのにどのように役立ちますか?
他のアイデアはありますか?
ruby - Ruby を使用して、バイナリ データを高度に圧縮された読み取り可能な形式に変換する方法
より読みやすく、コピー/貼り付け可能なものに変換したいバイナリ データがあります。
バイナリデータは次のように表示されます
これはかなり醜いです。私はそれを16進数に変換できます:
しかし、16 進数は 16 文字しかないため、あまり圧縮されていません。数百文字の長さの文字列になってしまいます。
可能な値を最大限に活用するために、文字 (大文字と小文字)、数字、および基本的な記号を使用する形式をお勧めします。何を使用できますか?
また、別のライブラリを必要としない、Ruby に組み込まれているものも好みます。残念ながら、それが本当によく知られていて人気があるか、理想的には Ruby に組み込まれていない限り、別のライブラリを要求することはできません。
http://apidock.com/ruby/String/unpackのものを試してみましたが、何も見つかりませんでした。
r - logLik.lm(): R が自由度に p ではなく (p + 1) を使用するのはなぜですか?
R で AIC/BIC の結果を理解しようとしています。何らかの理由で、R は推定されるパラメーターの数に 1 を追加します。2 * p - 2 * logLik
したがって、R は(ガウスの場合logLik
は残差二乗和) とは異なる式を使用します。実際には以下を使用します: 2 * (p + 1) - 2 * logLik
.
調査の結果、問題が に関連していることがわかりましたstats:::logLik.lm()
。
実際の例 (R の組み込みデータセットを使用trees
) として、以下を検討してください。
これは本当に不可解です。誰でも理由を知っていますか?
Edit1: glm
@crayfish44 による例
Edit2: メソッドlogLik