問題タブ [semantic-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
rdf - 多言語OpenCalaisのようなシステム?
私はOpenCalaisシステムに非常に感銘を受けました。これは、テキストを送信し、分析し、ドキュメントが属する一連の分類された(RDF対応)タグが提供されるWebサービスです。
しかし、現時点では、サポートされている言語は英語だけです。
多言語文書を処理する同様のシステムを知っていますか?(私はイタリア語に興味がありますが、もちろん多言語はプラスです)
video - オーディオ/ビデオコンテンツのヒント
そのようなメディアからどのような意味情報を抽出できるのでしょうか。音楽と音声テキストの区別、明確な音(銃声、鳥、車など)の検出、屋内/屋外のテイクの検出、カメラの動きの強さなど、何でも問題ありません。
このカテゴリーには多くの、多くの、多くの、多くの研究トピックがあることを私は知っていますが、これらのいずれのアプリケーションも見つかりませんでした。誰かがこれらのトピックに関するアプリケーション/ライブラリ/実用的なプロトタイプ/今後の製品に関するニュースへのリンクを持っていますか?
parsing - 抽象構文ツリーと具象構文ツリーの違いは何ですか?
インタープリター/コンパイラーがどのように機能するかについて少し読んでいますが、混乱している領域の 1 つは、AST と CST の違いです。私の理解では、パーサーは CST を作成し、それをセマンティック アナライザーに渡して AST に変換します。しかし、私の理解では、セマンティック アナライザーは単純にルールが守られていることを確認します。具体的ではなく抽象的にするために実際に変更を加える理由がよくわかりません。
セマンティック アナライザーについて私が見逃しているものはありますか、それとも AST と CST の違いはやや人為的なものですか?
nlp - トレーニング セット - 肯定文、否定文、中立文の割合
私はツイッターのメッセージにポジティブ、ネガティブ、ニュートラルのタグを付けています。私は、メッセージのどの割合がポジティブ/ネガティブおよびニュートラルであるべきかを特定するために使用できるいくつかのロジックがあるかどうかを評価しようとしていますか?
たとえば、1000 個の Twitter メッセージを使用して単純ベイズ分類器をトレーニングしている場合、pos : neg : ニュートラルの割合は 33 % : 33 % : 33 % にする必要があります。または、25 % : 25 % : 50 % にする必要があります。
論理的には、私の頭の中では、システムがニュートラルな文をポジティブかネガティブかよりも識別しやすくなるように訓練する (つまり、ニュートラルのサンプルを増やす) ようです。それは本当ですか? または、ここでいくつかの理論が欠けていますか?
ありがとうラフル
nlp - 特徴選択アルゴリズムの選択方法 - アドバイス
目の前の問題について、どのような特徴選択アルゴリズムが最適に機能するかを教えてくれる、私が読むことができる研究論文/本はありますか?
Twitterメッセージを単純に正/負として識別しようとしています(そもそも)。私は周波数ベースの機能選択から始めました (NLTK 本から始めました) が、同様の問題に対してさまざまな個人が異なるアルゴリズムを選択していることにすぐに気付きました。
周波数ベース、相互情報量、情報取得、その他のさまざまなアルゴリズムを試すことができますが、リストは無限にあるようです..そして、試行錯誤しながら効率的な方法があるかどうか疑問に思っていました.
何かアドバイス
.net - .Netを用いたテキストマイニング、事実抽出、意味解析
.NET アプリケーションでテキスト マイニング、ファクト抽出、セマンティック分析を利用できる無料のツール/コンポーネント/ライブラリを探しています。
GATEプロジェクトは私が必要としているものですが、Java で書かれています。.NET の世界に GATE のようなものはありますか?
私の課題は、Web サイトのテキスト コンテンツから特定の事実を抽出することです。このような機能を実現するためにいくつかの NLP アルゴリズムを使用する予定ですが、それらをどのように実装すればよいか分からないため、既存のソリューションが利用可能であればそれを使用します。
ヒントを教えていただければ幸いです。私はこの分野では初めてなので、関連する情報は私にとって非常に役立ちます。
artificial-intelligence - エキスパートシステムにおける剪定控除
ルールシステム、または前向き連鎖推論ルールを介して事実を推測する推論システムでは、「不要な」ブランチをどのように整理しますか?正式な用語が何であるかはわかりませんが、問題を推論するときに人々が思考の流れを制限する方法を理解しようとしていますが、私が見たすべての意味論的推論者はこれを行うことができないようです。
たとえば、ジョン・マッカーシーの論文「自然言語理解の例とそれが引き起こすAIの問題」では、ニューヨークタイムズのニュース記事に関する質問にインテリジェントに回答するプログラムを取得する際の潜在的な問題について説明しています。セクション4「非単調推論の必要性」では、ストーリーについて推論するときに事実の包含を制限するためのOccamのRazerの使用について説明しています。彼が使用しているサンプルストーリーは、家具店のオーナーを犠牲にする強盗に関するものです。
プログラムが述語計算でストーリーの「最小限の完成」を形成するように求められた場合、元のストーリーに直接言及されていない事実を含める必要があるかもしれません。ただし、無関係な詳細が含まれないように、控除の連鎖をいつ制限するかを知るための何らかの方法も必要になります。たとえば、事件に関与した警察の正確な数を含めたい場合がありますが、記事では省略されていますが、各警察官に母親がいるという事実は含めたくありません。
prolog - ロシア語の優れたセマンティック パーサーを探しています。
ロシア語のセマンティックパーサーを知っている人はいますか? link-grammar サイトから入手できる link-parser を設定しようとしましたが、うまくいきませんでした。
私は、Mac 上で実行でき、プロローグまたは Lisp のような解析ツリーの表現を生成できるシステムを望んでいます (ただし、XML 出力も問題ありません)。
compiler-construction - 文法と意味分析
文法仕様と意味解析の境界線はどこにあるのだろうと思っています。詳細な文法記述を使用するか、詳細をセマンティック フェーズに残すか、どちらが優れていますか? 例: プリミティブ型から「派生」できる列挙型を持つ C# のような OO 言語を想像してください。
では、enum の base-type の正しさ (この場合はプリミティブ型か非プリミティブ型か) は、文法チェックまたは意味解析の対象とすべきでしょうか?
compiler-construction - C / C ++コードを生成するときの式の結合性と優先順位?
式の演算子の優先順位を正しく考慮して、AST を生成する基本的なコンパイラを作成しました。ただし、コード生成を実行して C++ コードを生成する場合、括弧の使用方法がわかりません。
この式の場合:
以下のAST:
かっこを含む前の式を正しく生成する必要がありますが、2 番目の演算子が (たとえば) 加算演算子の場合、かっこは不要です。読みやすさを向上させるために必要な場合にのみ使用することをお勧めします。
この種の動作を指示するルールと、括弧をいつ使用するかを知る方法はありますか? プラスとマイナスは、ほとんどの言語で同じレベルの優先順位を持っています。これをすべての演算子で機能させたいと考えています。