問題タブ [extraction]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
3 に答える
253 参照

javascript - 呼び出し時のJavascript関数のパラメータ名?

私はこれが非常に長いショットであることを知っていますが、は尋ねたいと思います: 関数呼び出しでパラメーターとして渡された変数の名前を見つける方法はありますか?

私が持っていると仮定します:

次のような配列を取得したいと思います[a, b]。文字列も使用できます: ["a", "b"].

関数の文字列表現を解析することで取得できることがわかっているので、は必要ありません。["tmp1", "tmp2"]

実際のエクストラクタを使用してcaseclass.jsライブラリを改善しようとしているため、質問しています (詳細については、リンクを参照してください)。オブジェクトのみが参照によって渡されることを理解しているので、抽出された値をプレースホルダー変数に戻すための回避策を見つけようとしています。

ありがとう!

0 投票する
3 に答える
6152 参照

python - Pythonを介してmediawikiマークアップ記事からデータを解析/抽出する方法

ソースMediawikiマークアップ

現在、さまざまな正規表現を使用して、mediawikiマークアップのデータをリスト/辞書に「解析」し、記事内の要素を使用できるようにしています。

作成しなければならないケースの数が多いため、これは最善の方法とは言えません。

記事のmediawikiマークアップをさまざまなPythonオブジェクトに解析して、その中のデータを使用できるようにするにはどうすればよいでしょうか。

例:

  • すべての見出しを辞書に抽出し、そのセクションでハッシュします。
  • すべてのインターウィキリンクを取得し、それらをリストに貼り付けます(これは、APIから実行できることはわかっていますが 、帯域幅の使用を減らすため
    にAPI呼び出しを1つだけにしたいです)。
  • すべての画像名を抽出し、それらをセクションでハッシュします

さまざまな正規表現で上記を実現できますが、作成する必要のある数をかなり多くしています。

これがmediawikiの非公式仕様です(私は彼らの公式仕様が有用だとは思いません)。

0 投票する
3 に答える
81628 参照

python - 引用符の間から文字列を抽出します

ユーザーが入力したテキストから情報を抽出したい。次のように入力したとします。

最初の引用セットの間で情報を抽出するにはどうすればよいですか?それでは2番目?それでは3番目?

0 投票する
2 に答える
22267 参照

python - lxml、XPath、およびPythonを使用してWebページからリンクを抽出する方法は?

私はこのxpathクエリを持っています:

title 属性を持つすべてのリンクを抽出し、hrefFireFoxの Xpath チェッカー アドオン を提供します。

しかし、私はそれを使用することはできませんlxml

これはlxml(空のリスト) から結果を生成しません。

Python でhref属性 title を含むハイパーリンクのテキスト (リンク) を取得するにはどうすればよいですか?lxml

0 投票する
3 に答える
20189 参照

android - Android でビデオ フレームを抽出する

Android で実行中のビデオからフレームを抽出できるかどうか知りたいですか? フレームを定期的に抽出し、さらに処理するために送信する必要があります。

誰かが私に答えを見つけることができますか?

ありがとう、

アビ

0 投票する
2 に答える
3097 参照

c# - Vista / 7実行可能ファイルから完全なアイコンを抽出するにはどうすればよいですか?

16x16、32x32、256x256などのバージョンのアイコンを含むVista .icoファイルがある場合は、次の操作を行うだけで.NETアイコンとして正常にロードできます。

その後、アイコン内のさまざまなサイズの画像すべてにアクセスできます。ここで詳しく説明されている方法を使用して、256x256VistaPNGにアクセスすることもできます。

ただし、Vista実行可能ファイルからアイコンイメージの完全なセットを取得する方法が見つかりませんでした。残念ながら、これを行う-:

...単一の32x32画像のみが抽出されます。実行可能ファイルから画像のセット全体を.NETアイコンとして取得する方法はありますか?できれば、XPでも機能するものをお勧めします。

0 投票する
2 に答える
1234 参照

extraction - ズーム可能な画像を 1 つの高解像度画像としてキャプチャする方法は?

3倍にズームした高解像度でズーム可能な画像をキャプチャしたいと思います。手動で行うことなく、この画像をつなぎ合わせる方法を知っていますか? 画像はこちら

0 投票する
1 に答える
403 参照

solr - Solr Extraction Handler に同じ名前の複数の META タグを抽出させるにはどうすればよいですか?

SOLR 抽出ハンドラー (Solr-Cell) にいくつかの HTML ドキュメントをアップロードしています。この形式のヘッダーに META 要素があります。

私のスキーマには、複数値フィールドとして定義された製品があります。

このフィールド内のインデックスに両方の製品を追加したい。残念ながら、何か問題が発生しています。最後の製品のみが正常に記録されています。

これを機能させる方法を誰か教えてもらえますか、ありがとう:)

0 投票する
1 に答える
403 参照

windows - Python またはその他の一般的なスクリプト言語/ツールを使用して、DLL マニフェスト情報をプログラムで取得する

私はこのような問題を抱えています:

http://svn.haxx.se/tsvnusers/archive-2008-07/1051.shtml

アプリが私たちのものであることを除いて(申し訳ありませんが、機密情報は提供しません). ただし、SideBySide に欠陥があるのは私たちのせいではありません。

とにかく、バージョン X は機能し、バージョン Y は最初から爆発します。私は、違いが何であるかを理解するために、多数のディレクトリと最大 100 個の dll ファイルを調べる作業に直面しています。

別の dll ファイルの 2 つの異なるバージョンをロードする 2 つの dll ファイル間に競合があるようです。

特定のファイルからマニフェストを抽出するための Python/その他のスニペットについてご協力いただければ幸いです。ありがとう!

編集:ところで、私は方法を見つけました: 次のコマンドを実行できます (mt.exe は Visual Studio 2008 Tools の一部です):mt.exe -inputresource:MyFile.dll;#2 -out:MyFile.dll.extracted_manifest.txt.

これは良いスタートですが、2 つの問題があります。

  1. 複数のマニフェストが埋め込まれている可能性があります (私の理解では): #1、#2、#3、... - どのマニフェストがどれだけ前もってわかりません。最大値はいくらですか?
  2. 推測して、そのパラメーターを指定して mt.exe を実行すると、エラーが発生します。これらのエラーを処理すると、スクリプトが長くなります。

誰かがこれに光を当てることができますか?

別の編集:ああ、気にしないでください!1 は .exe 用、2 は dll 用で、それだけです。私は今何をすべきかを知っていると思います。ただし、私のソリューションよりも優れたソリューションがある場合、または Python やその他のスクリプトから mt.exe への呼び出しを自動化している場合は、自由に共有してください。

0 投票する
4 に答える
985 参照

c++ - 特定の形式に従っていない文字列から数字や文字を抽出する (後置電卓)

入力文字列から数字と文字を分離するのに問題があります。私のプログラムの目的は、後置で足し算、引き算、掛け算、割り算を行うことなので、入力フォームは2 2 3 + * (答えは 10)から2 2 + 3 * (答えは 12) まで予測できません。 . そのため、sscanf を使用して、入力文字列に特定の形式を指定せずに数字と演算子文字を抽出することはできません。ここで何をすべきですか?