問題タブ [disambiguation]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
database - 著者名曖昧性解消データ
著者名の曖昧さ回避問題について研究しています。私はいくつかの実験をしたいです。引用レコードをクラスター化したい。各出版レコードの真の著者が利用できるトレーニング データとテスト データが必要です。DBLP、Medline、Pubmed などの多くの書誌データベースがあります。テスト段階について混乱しています。DBLP をトレーニングとテストに分割することは良い方法ですか? DBLP 引用レコードは手動で追加されますか? DBLP で各引用レコードが真の著者に割り当てられていることを保証できますか? データベースのトレーニングとテストに関する提案はありますか。注: 文献では、一部の論文ではトレーニングに Pubmed を使用し、テストに DBLP を使用していることに気付きましたが、最初のものは医学出版物用で、2 つ目はコンピューター用です。
algorithm - ハッシュ テーブルはバケットのあいまいさとプローブをどのように解決しますか?
私は C でデータ構造とアルゴリズムとソフトウェアの原則を読んで、データ構造の内部に頭を悩ませようとしていますが、2 つのことが本当に気になります。
(1) バケット内のアイテムがすべて同じハッシュを持つ場合、検索しているアイテムがバケット内のどのアイテムであるかを決定する際、ハッシュ テーブルはどのように処理しますか?
例えば
- キー、値を取得
- キーでハッシュアルゴリズムを使用して、値を入れようとするインデックスを見つけます
- スロットが使用されているが、バケット (単一のエントリ) がない場合は、バケットを作成し、現在のアイテムをバケットにスローしてから、現在の値をバケットにスローします。
- すべてのキーが同じハッシュにマップされ、バケット内のアイテムには検索するキーがないため、どの値がどのキーに属しているかがわからない「紛失および発見の問題」があります。キーによるバケット。
これは、バケットが各エントリのキーと値を保存する場合に機能しますが、ハッシュ テーブルがキーとエントリの値を保存することを確認するサイトが見つからないため、混乱しています。
(2) ハッシュテーブルは、インデックスの値がキーの正しい値であるかどうか、またはプロービングが衝突を検出して別の場所に配置したかどうかをどのように判断しますか。
例えば。
- キー、値を取得
- index(0) を見つけるためのハッシュ キー
- インデックスが取得されたら、スロットが見つかるまで (スロット 1 が空になるまで) 線形検索を実行する単純なプローブ アルゴリズムを使用します。
- ここでキーを検索し、インデックス 0 を見つけます。ハッシュは、インデックス 0 がこのキーの正しいアイテムではなく、スロット 1 にプローブされていることをどのように認識しますか?
繰り返しますが、テーブルがキーとエントリの値を保存する場合、これは私には理にかなっていますが、ハッシュがエントリの値とともにキーを保存するのか、それともハッシュ インデックスのアイテムを確実にする別の方法があるのか はわかりませんまたはバケットインデックスが正しい項目であるか、誤解している場合。
質問を明確にするために: ハッシュ テーブルは値と共にキーを保存してバケットとプローブ シーケンスを明確にしますか、それともハッシュのあいまいさを避けるために何か他のものを使用しますか?
大雑把に定式化された質問で申し訳ありませんが、私はただ尋ねなければなりませんでした。
ありがとうございます。
expression - 式の優先順位と曖昧さ回避
私は現在、Rust-lang を Rascal で解析可能にする作業を行っています。もともと使われていた構文は Bison 用に作られたものなので、使えるように翻訳しています。私が到達したつまずきは表現です。nonblock_expr
Rust の Bison ファイルには、expr
、 、nonparen_expr
およびの 4 種類の式がありexpr_nostruct
ます。私の既存の翻訳はあいまいさがいっぱいですが、トピックに関する Rascal のドキュメントと、Rascal と Java で使用可能な構文を読んだ後でも、この問題を解決する方法がわかりません。あいまいさを修正し、この問題をさらに修正する方法をよりよく理解したいと思います。
これが私の翻訳の例です:
ソース:
Rust Bison ファイル: Github Rust
Rascal ファイルを酸化する: Github Oxidize
追加されたあいまいな例 これは入力ファイルの例です (ファイルのあいまいな部分だけが parse のパラメーターにあります)。
以下に示す出力解析ツリーは、接頭辞付きの式 (&) の構成について混乱しているようです。このあいまいさは、 と の間を決定できませNonblock_prefix_expression
んExpression "." Path_generic_args_with_colons
。を介して解析することを期待していNonblock_prefix_expression
ます。