問題タブ [information-extraction]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
javascript - htmlグリースモンキーから情報を抽出する
だから私はオンラインゲームで私のためにタイルを配置するためのグリースモンキースクリプトを書こうとしています。配置タイルを把握しましたが、スクリプトを拡張するには、ループを移動回数に制限する必要があります。ページのhtmlからこの情報を抽出する最良の方法がわかりません。
私はこの獣に取り組む方法についての指針を探しています。正規表現?
編集:このdivの完全なコードは
それは私が知っている醜いです。
text - エンティティ間の関係を見つけるための NLP
私の現在の理解では、OpenNLP、スタンフォード NLP などのツールキットを使用して、テキスト ドキュメントからエンティティを抽出することが可能です。
しかし、これらのエンティティ間の関係を見つける方法はありますか?
たとえば、次のテキストを考えてみます。
「ご存じの方もいらっしゃると思いますが、私は先週、有名なヒッグス粒子が昨年 7 月に発見されたヨーロッパの高エネルギー物理学研究所である CERN に滞在しました。何年にもわたって、私は 1990 年代後半に 3 か月間客員科学者としてそこに滞在し、初期の宇宙物理学の研究を行い、現在見ている宇宙とその幼少期に起こった可能性があることをどのように結びつけるかを解明しようとしました。」
エンティティ: I (著者)、CERN、ヒッグス粒子
関係 : - 私 "は " CERN "を 訪問 し た- CERN "は" ヒッグス ボソンを 発見 し た"
ありがとう。
nlp - 食品情報抽出
私は USDA 栄養データベースを使用しており、その食品には次の説明があります。
例えば:
ここにはパターンがあります。エンティティを区切るためにコンマが明確に使用されています。上記の例に従うと、チーズはチェダー、コテージ、フォンティーナの親です。
このソースから情報を抽出するために、すでにいくつかの作業を行っています。私はそれを考えました:
- POS タグ付け: 単語が形容詞または動詞である場合、食品の名前の一部ではありません
- freqdist/wordcount: これは、食品の説明で単語の階層を取得するために行われました
しかし、大規模に実行すると、不正確な結果が得られます。一部の説明で POS タグ付けが失敗し、同じ文に同様の頻度の単語がある場合、freqdist/wordcount は役に立ちませんでした。
これは、取得したい結果の例です。
入力データ:
出力データ:
入力データ:
出力データ:
初心者なので色々と教えていただきたいです。NLP には多くの情報があり、その主題について幅広い知識がないと、どの道を進むべきかを判断するのは困難です。
php - PHP で DNA 配列の処理済み情報を抽出する
エキスパートヘルパーの皆様、こんにちは。
これは投稿された最初の質問であり、他の質問に対してすばらしい回答が寄せられていることがわかります。私の質問は以下です。
DNA配列(SNP:SNP:各SNPに固有の固有IDを持つSingle Nucleotide Polymorphisms)に関するクエリを処理した結果(出力)を、処理を提供しているWebサイト(FASTSNP Webサイトなど)でランキング形式で抽出したい特定の SNP を取得し、抽出した結果を MySQL データベースに保存できるようにします。正規表現やその他の PHP や Perl (out コマンド) を使用する方法はありますか?実行したことがある人は助けてください。
前もって感謝します!
nlp - 情報抽出とテキストマイニングの違いは何ですか?
安易に見えるかもしれません。しかし、私は混乱しています。
テキストマイニングと情報抽出の違いは何ですか?
xml-parsing - 情報抽出 - ビジネス文書
私は現在、請求書などのビジネス文書から送信者または受信者などの情報を抽出しようとしています。ドキュメントは ocr ソフトウェアで xml ファイルに処理されているため、書式設定の特徴が注釈として付けられています。送信者や受信者などの機能を使用して、同様のドキュメントに手動で注釈を付けた後、新しいドキュメントから特定の情報を抽出したいと考えています。
私の質問は、類似したドキュメントの 1 つまたは 2 つの例と比較することによって特定のデータを抽出できる学習またはマッチング アルゴリズムがあるかどうかです。はいの場合:それが可能なJavaフレームワークはありますか?
よろしくお願いします
まぐ
r - cox.zph R 関数から属性を抽出する方法
Rp
の関数の出力で特定の行の属性を抽出する必要があります.cox.zph
あなたに質問するために、私の問題を次のように説明します。例を挙げて段階的に説明します。
そして、cox.zph
関数を使用します:
次の出力を使用します。
p
を使用して属性値 (この場合は 0.57)を取得しようとしましattributes(zph)
たがp
、 のようなことを行うために表示されませんzph$p
。plyr
パッケージも使用しましたが、結果はありませんでした。
誰でも私を助けることができますか?ありがとう。
r - R の隠れマルコフ モデル パッケージ
R で HMM モジュールを実装するのに助けが必要です。私は R を初めて使用し、R に関する知識があまりありません。したがって、HMM を使用して IE を実装する必要があります。ファイルを含む 2 つのフォルダーがあり、1 つは文があり、もう 1 つは各文から学習したい対応するタグがあります。
私の質問は、R でそれを実装する方法、モデルを初期化する方法、およびモデルをトレーニングする方法です。そして、それをランダムな文に適用して情報を抽出するにはどうすればよいですか?
すべての助けを前もってありがとう!