問題タブ [semantic-analysis]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c - コンパイラのシンボル テーブルとセマンティック解析
私は、C のような言語 (より単純な言語) 用のコンパイラ (lex や bison などのツールを使用せずに) の構築に取り組んでおり、lexer と parser を通過しました。パーサーの実行方法が正しいかどうかはわかりません。これまでのところ、構文が正しいかどうかを確認するなどの構文解析を行うために、リンクされたリストをまったく使用していません。基本的に、私のパーサーは次のようになります。
私のプログラムは次のようになります。
私は基本的にすべての非端末用の関数を持っており、適切なタイミングでそれらを呼び出し、「strcmp」でキーワードをチェックしています。この方法は大丈夫ですか?
この時点から、意味解析を行うにはどうすればよいでしょうか? シンボル テーブルの作成はどこから始めればよいですか?
考えるための提案や指針は素晴らしいです! どうもありがとうございました
java - 効率的なキーワードの検出/抽出。定義済みの一連のキーワード
文字列から関連性のあるキーワードを効率的に抽出するにはどうすればよいですか? キーワードのリストは事前定義されています。たとえば、バラク・オバマについても言及しているミシェル・オバマに関する記事では、より高い関連性値を取得するキーワードを使用してMichelle Obama
andを抽出したいと考えています (キーワード リストにはとの両方が含まれています)。Barack Obama
Michelle Obama
Michelle Obama
Barack Obama
各キーワードの出現回数を文字列でチェックするのはあまり効率的ではないようです。私のアプリケーションは PHP で開発されていますが、これを効率的に行うことができれば、どの言語でも構いません。
OpenCalais を試しましたが、ほとんどのキーワードが検出されません。Lucene を使用してキーワードを抽出することは可能ですか?
c - "if" ステートメントのコード生成 - コンパイラ
私は C のような言語用のコンパイラを開発している最中で、セマンティック分析とコード生成の段階でいくつかの問題を抱えています。私の質問は次のとおりです。1) if ステートメントの場合、構文は次のとおりです。
さて、私のターゲット コードでは、go to ステートメントを含む 3 アドレス コードでなければなりません。
さて、私の質問は、「go to」ステートメントのアドレスをどのように生成するのですか?
2) この質問はセマンティック分析に関するものです。単一の関数のシンボル テーブルを作成して使用することができました。関数呼び出し用のシンボル テーブルを作成するために使用すべきアプローチは何ですか? 言い換えれば、異なる語彙レベルに対して?これには、何らかの形で複数のツリーが必要であることを知っています。1 つの関数に対して 1 つのツリー。しかし、プログラムの途中から別のツリーを指すにはどうすればよいのでしょうか?
私は初心者なので、提案や考えがあれば大歓迎です。
merge - コンテキスト認識マージ?
プログラミング言語用の diff/merge ツールはありますか。これは、構文を認識した方法で (XML Diff Tool のように) 動作し、行ごとに比較する以上のことを行います (オプションで空白を無視します)。
私は、実際に言語の構文と区切り記号に従っているプログラム、構文の正確さを損なうことなく変更を提案するプログラム、または複数の行に分割されたステートメントをまとめるプログラムに興味があります。動作例は次のとおりです。
*追加のネスト レベルを導入する an を見つけると、数行下if(){
の右中括弧が自動的にバンドルされます。)}
* 構文要素を一緒に一致させて、ブロックを削除するような愚かなことを避けてください:
個人的には、C++ 構文を処理できるソフトウェアを見つけたいと思っていますが、他の言語のソリューションについて知ることも興味深いでしょう。
rdf - RDF と OWL のワークフローに関する質問
私はProtegeを通じてOWLを見たり遊んだりしてきましたが、「ワークフロー」とその考え方を正しく理解しているかどうか知りたいです(データベースをゼロから構築するため:
- Protege または同等のものを使用して、データの OWL オントロジーを生成します
- このスキーマを RDF にエクスポートします
- トリプルストアの一部の要素として定義されたクラスをターゲット データとともに使用する
- トリプルストアを RDF にエクスポートする
- openRDF/sesame または Jena を使用して、定義されたデータとオントロジーを読み込みます
- RDF トリプルストアを OWL オントロジーに対して検証して、すべてが正常であることを確認します
- SPARQL を使用して RDF トリプルストアからデータを取得する
- OWL推論を使用して何かを行います(ここではあまり明確ではありません)
他の人が何をしていて、この種の問題にどのように取り組んでいるのかを知りたいです。
さらに、具体的な質問があります。
オントロジーのみのサブクラスとスーパークラスの関係を決定するためにフクロウ推論が使用されているようです。しかし、データに関しては、SPARQL でサブクラスとスーパークラスの関係を照会する方法を教えてください。たとえば、トリプル ストアが (pizzaID1 is-a marghareta ) を定義し、SPARQL でベジタリアン ピザをクエリする場合、どうすれば PizzaID1 が返されることを確認できますか。
その答えは、すべての関係が明示的に示されている「完全なグラフ」を生成することに関係していると思います。sparql は、トリプルストアをクエリするときに自動推論を行いますか?それとも、そのような完全なグラフを生成する必要がありますか?
facebook - セマンティック ベースのレコメンデーション Facebook アプリケーション
今学期のプロジェクトとして、友人と私はセマンティックベースのレコメンダー Facebook アプリケーションを作ろうと考えています。たとえば、「ヨーロッパ旅行」に行きたい場合、このアプリケーションは次のことを行うことを目的としています: 友達リストを検索すると、「イタリア旅行」という名前の写真アルバム、またはコメントのみを含むすべての写真アルバムが返されます。 「エッフェル塔」について、ヨーロッパのあらゆることに関連する友人のステータス、友人のメモ、他の Web サイトで気に入ったリンク、ニュース フィードに表示されるその他のアクティビティ。映画を見たり、本を読んだり、ある教科を勉強したりしたい場合も同様です。
そして私の質問は:
3ヶ月以内にそれを達成することは可能ですか?Facebook API とセマンティック関連の主題については、まさに基礎しか持っていないことを知っています。
もしそうなら、どのオントロジーに頼ることができますか? そして、出発点として他にどのような概念を持っている必要がありますか?
syntax - 言語的妥当性の確認
構文とセマンティクスに従って文の言語学的妥当性をチェックするための [オープン ソース] コード ライブラリはありますか?
algorithm - 最も単純な特徴選択アルゴリズム
独自の単純な特徴選択アルゴリズムを作成しようとしています。私が使用するデータセットはここにあります(非常に有名なデータセット)。誰かが私にそうする方法についての指針を与えることができますか?
テキスト分類のための特徴ランクアルゴリズムを書くことを計画しています。これは、映画レビューの感情分析のためのものであり、それらをポジティブまたはネガティブのいずれかに分類します。
だから私の質問は、テキストデータセットの簡単な特徴選択を書く方法についてです。
semantic-web - Web 上のドキュメントが他のドキュメントと意味的に関連しているかどうかを調べるにはどうすればよいですか?
ここでの私の質問はdocument d1 on the web and a document d2
、d1 と d2 が意味的に関連していることをどのように伝えるかということです。d1がおそらくd2に接続されているというヒントを私に与えるかもしれない、ある程度の自然言語処理を行うことができるいくつかのAPIがありますか? 私はそれをひどくそして緊急に必要としています.助けてください!!
lucene - テキストコーパスから意味的関連性を抽出する方法
目標は、大きなテキストコーパス内の用語間の意味的関連性を評価することです。たとえば、「警察」と「犯罪」は、同じコンテキストで同時に発生する傾向があるため、「警察」と「山」よりも強い意味的関連性を持つ必要があります。
私が読んだ最も簡単なアプローチは、コーパスからIF-IDF情報を抽出することです。
多くの人が潜在意味解析を使用して意味相関を見つけます。
Lucene検索エンジンに出くわしました:http://lucene.apache.org/
IF-IDFを抽出するのが適切だと思いますか?
テクニックとソフトウェアツール(Javaを優先)の両方の観点から、私がやろうとしていることを何をすることをお勧めしますか?
前もって感謝します!
ムローン