問題タブ [extraction]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - C ソースの Main() 関数から関数名を抽出する方法
この件に関してあなたの考えをお聞きしたいだけです。ある重要な理由から、C ソース ファイル (例: main.c) の "main()" 関数内で呼び出された関数のすべての関数名を抽出/取得する必要があります。
ソースコードの例:
ご存知のように、これらの関数呼び出しを識別するためのマーカー/記号として使用できるのは、括弧 "()" だけです。この関数名の抽出を実装する際に、いくつかの要因を既に検討しました。
1. 関数にはパラメータがある場合があります。例: functionA(100)
2. ループ演算子。例: while() 3. その他の演算子。例: if()、else if() 4. スペースを含まない関数呼び出し間のその他の演算子。例: functionA()+functionB()
現時点では、あなたの言っていることはわかります。これは $$$ の苦痛です...だから、あなたの考えやアイデアを共有してください...そして、これについては我慢してください...
注:これはC++言語です...
nlp - 文脈に従ってテキストから単語を抽出する方法
ユーザーが提供したテキストステートメントから関連する単語を抽出したい。例えば。「長方形には何辺ありますか?」という質問に対して 単語は 'rectangles' 、 'sides' 、 'many' 、 'how' でなければなりません。
まさに私が目指しているのは、NLP の質問応答システムであることがわかりました。しかし今は、質問から必要なキーワードのみを抽出したいと考えています。質問のドメインはそれほど広大ではありません。
さまざまなデータ マイニング ツールに出くわしましたが、それらが実際にこれに役立つかどうかはよくわかりません。それらは少し高度すぎるか、正確に関連していないようです。
要件に合ったツールがあるかどうか、または自分でコーディングしてみる必要があるかどうかを教えてください。
役立つと思われるあらゆる種類のポインターを提供してください。
c++ - 大きなライブラリの小さな部分を抽出する(fx Boost)
大規模なC++ライブラリのごく一部を自動抽出する方法があるかどうか知りたいのですが。
一部のプロジェクトでboost::rationalのみが必要だとしましょう。ただし、ブースト1.42全体で279 MiBを消費します!
私のプロジェクトを「自己完結型」(一部の学校の仕事ではfx)に保つために、私自身のソースとともにboost::rationalを含めることができるようにしたいと思います。(私の先生はコンパイルするために事前に何千ものライブラリをインストールする必要はないという考えです)
実際にブースト全体をインストールする方がよいので、これは良い習慣に違反していることを私は知っていますが、それでも、他の(あまり知られていない)大規模なライブラリでも議論は成り立ちます。
この抽出は、ルート#includeの#include依存関係ツリー(boost / Rational.hppなど)をたどることで簡単に実行できると思います。しかし、そのようなツールは作られましたか?その名前は何ですか?
java - Web ページからの一般的な記事の抽出
記事の抽出で私の仕事を始めるつもりです。
私が行うタスクは、さまざまな Web ページに投稿されているホテルのレビューを抽出することです (例: 1. http://www.tripadvisor.ca/Hotel_Review-g32643-d1097955-Reviews-San_Mateo_County_Memorial_Park_Campground-Loma_Mar_California.html、2 http://www.travelpod.com/hotel/Comfort_Suites_Sfo_Airport-San_Mateo.html ) _
私はJavaでタスクを実行する必要があり、過去数か月だけJavaで作業しています..
そして、ここにこれらに関する私の質問があります。
一般的な方法で、さまざまな Web ページからレビューだけを抽出する可能性はありますか。
Java でのタスクをサポートする API があれば教えてください。
また、上記のタスクを達成するのに役立つあなたの考え/情報源を教えてください.
アップデート
関連する例がネットで入手できる場合は、非常に役立つ可能性があるため、同じものを投稿してください。
php - DBpedia 情報抽出フレームワーク
ウィキペディアのデータ抽出を使用したことがある人はいますか? 仕事で使う必要があります。
Web ページから情報を抽出するための他のツールを教えてください。
ありがとう!
c# - 正規表現を使用して文字列値を抽出するための最小パターン
文字列の正しい値のみを取得するための正しいパターンで正規表現をインスタンス化しようとしています。私のテキストファイルには次のものがあります:
次のように正しい値を取得したいと思います。
正しい正規表現パターンは何ですか?
ここに私がこれまでに持っているもの
しかし、これは不要な文字列「コメント ID」ももたらします。
グループマーカーを使用しないことはできます<comment_id>
か?
python - Web ホスティングでの Python ImportError
私はPythonにかなり慣れていないので、明らかな何かが欠けている場合はご容赦ください。
私はTopia TermExtractパッケージを使用しており、私が書いたコードはローカル マシン (Mac OS 10.6.5; Python 2.6) で正常に動作しています。ただし、パッケージ ファイルを含むディレクトリ全体を GoDaddy ホスティングにコピーすると、次のエラーが発生します。
これを機能させるために何をする必要があるのか わかりません。これが私が書いたスクリプトです:
ありがとう!
parsing - DOS バッチ: 相対パスから最後のフォルダーを取得する
DOS バッチ ファイルに次の値があります (たとえば...)。
各値から姓の値 (「Jones」、「Smith」、「Wilson」) を抽出する必要があります。これらの部分文字列値を常に取得するために使用できる手法は何ですか?
php - PHPpreg_matchの結果
このPHP関数は正常に機能しています。
の
しかし、この場合、同じphp関数を使用すると:
このpreg_match
関数は結果を出しません。私は何が間違っているのですか?
asp.net-mvc - C#を使用したAsp.Net Webサイトでのパフォーマンスの違いの抽出とコピー
ある状態で更新されるほぼ 100 の Web サイトがあり、それらの Web サイトを置き換えるファイルを含む winzip アーカイブがあります。それを知りたい
- そのファイルをフォルダーに抽出し、100 個の Web サイト フォルダーすべてにコピーできます。
- アーカイブを 100 個の Web サイト フォルダーに直接抽出できます
どちらがパフォーマンスが高く、エラーが発生しにくいか。