問題タブ [extract]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
1625 参照

java - htmlsource から div コンテンツを文字列で抽出する (Java)

HTMLソースを含む文字列から特別なdivタグ(クラス名で定義)のコンテンツを抽出しようとしています。Java の正規表現機能は perl ほど使いにくいと思いますよね?

以前にこれを行った人はいますか?コードを教えてもらえますか? おそらくdom-browsingは良い解決策ですが、私の問題に一致するチュートリアルは見つかりませんでした。

0 投票する
3 に答える
642 参照

php - フォーマットのすべてのインスタンスを抽出するためのPHPの正規表現構文

文字列から特定の形式のすべてのインスタンスを抽出しようとしています:

私の新しいソニー[PT#123456ABC; ソニー]にはこの機能がありますが、私の友人は新しい東芝[PT#AD-3232hjk; 東芝]にはこの機能があります。

抽出したい:

[PT#123456ABC; ソニー]

[PT#AD-3232hjk; 東芝]

ここでわかるように、一貫した位置にあるアイテムは次のとおりです。

  • [PT#
  • ;
  • ]

さまざまなタイプのstrpos()を使用しようとしましたが、部品番号とメーカー名の長さと形式が異なるため、はるかに大きな文字列からそれらのインスタンスを確実に引き出すことができませんでした。私はこれを解決するために正規表現を使用するさまざまな方法を試してきましたが、それらに関する知識はかなり限られています。これらの式を抽出して変数に配置した後、式から部品番号と製造元名を分離する必要があります。これは、正規表現を使用して実行する方が簡単な場合もあります。

どんな助けでも大歓迎です。ありがとう

0 投票する
1 に答える
3201 参照

c# - SWF からテキストを抽出する

現在、print2flash ( http://print2flash.com ) を使用して、ユーザーが送信したドキュメント (Word ドキュメント、RTF、PowerPoint など) をオンラインで表示できる Flash ベースのドキュメント (docstoc や scribd など) に変換しています。

全文索引作成のために、これらのファイル内のテキストに索引を付けたいと考えています。これを達成するために使用できるツールやライブラリはありますか?

私たちは ASP.NET / C# で開発を行っており、SWFTools ( http://www.swftools.org )などのサード パーティ ツールを使用してみましたが、結果は一貫性がなく、標準以下でした。

PS: 元のドキュメントをフラッシュに変換した後でインデックスを作成したいと考えています。これにより、処理するファイル形式が少なくて済みます。

0 投票する
15 に答える
330966 参照

javascript - Javascript - ファイル入力コントロールからファイル名を抽出する方法

ユーザーが Web ページでファイルを選択したときに、ファイル名だけを抽出できるようにしたいと考えています。

str.search 関数を試してみましたが、ファイル名がc:\uploads\ilike.this.file.jpgのようなものだと失敗するようです。

拡張子なしでファイル名だけを抽出するにはどうすればよいですか?

0 投票する
1 に答える
3462 参照

php - Zip内のディレクトリを抽出

zipアーカイブからスクリプトが配置されているディレクトリにファイルを抽出するスクリプトを作成しています。

これが私のコードです:

これは正常に機能しますが、1つの問題があります。zipには追加のレイヤーが含まれています。(zip / directory / files)これは、ファイルだけでなく、このディレクトリ/ファイルのように抽出します。

この余分なレイヤーを削除する方法はありますか?

ご協力いただきありがとうございます!

Joel Drapper

0 投票する
1 に答える
3801 参照

c# - mhtからテキストを抽出する

私はmhtファイルを持っています。mhtのすべてのテキストを取得したいと思います。正規表現を使用することを考えましたが、英語以外の言語がmhtにあるため、テキスト自体にA7 = A98 =D6...のようなものが含まれています。

ブラウザで表示されているファイルのすべてのテキストを選択し、それをコピーしてメモ帳に貼り付けます。これが私が必要としているものです。

ありがとう。

0 投票する
3 に答える
26980 参照

matlab - MATLAB:ループを使用せずに行列の複数の部分を抽出します

私は巨大な2Dマトリックスを持っており、そこから15の異なる100x100パーツを抽出したいと思います。パーツの左上のインデックスが保存される2つのベクトルxとyがあります。私はこのようなものを使用しました:

しかし、結果は15x100x100ではなく100x100マトリックスになります。なんで?

ループを使用して簡単に実行できることは知っていますが、ループを使用することは許可されていません(これは画像処理の演習の一部です)。もう1つの可能性は、15行すべてを書き込むことですが、それはちょっと醜いです。

エレガントな解決策はありますか?ありがとう。

0 投票する
3 に答える
3492 参照

python - HTMLからネストされたテーブルを抽出する方法は?

HTMLファイル(utf-8でエンコード)があります。で開きますcodecs.open()。ファイルアーキテクチャは次のとおりです。

最初のテーブルのみを取得する必要があります(フォームのあるテーブルを破棄します)。<table>最初の前と対応する後のすべての入力を省略します</table>。一部のセルには、段落、太字、スクリプトも含まれています。メインテーブルの行ごとにネストされたテーブルは1つだけです。

それを抽出して行のリストを取得するにはどうすればよいですか?各要素はプレーン(ユニコード文字列)セルのデータとネストされた各テーブルの行のリストを保持しますか?ネストのレベルは1つだけです。

HTMLParse、PyParse、およびreモジュールを試しましたが、これを機能させることができません。私はPythonにまったく慣れていません。

0 投票する
1 に答える
2123 参照

wpf - (WPF) マルチフレーム画像 (tif, gif) からフレームを抽出する方法

アニメーションgifの各フレームのサムネイル画像を抽出しようとしています。次のコードは、私がそれを行うのに苦労している方法ですが、BitmapFrame インスタンスのサムネイル プロパティは常に null です。

私は何か間違ったことをしていますか?

0 投票する
9 に答える
13167 参照

php - 提供されたメールアドレスからユーザー名を作成する方法 - PHP

私の Web サイトには、ユーザーが電子メール アドレスとパスワードのみを入力する必要があるサインアップ ページがあります。

提供された電子メールの最初の部分を使用して、このユーザーのユーザー名を自動的に作成できるようにしたいと考えています。

ユーザーはgordon @yourdomain.com を提供します。ユーザー名を「gordon」にしたいです

フォームの作成方法やデータベースへのデータの送信方法についての説明は必要ありません。提供された電子メールからデータを抽出するコードだけです。必要に応じて、重複が発生した場合は末尾に番号を追加します。

これが理にかなっていることを願っています。基本的な機能のように見えますが、ネット上のどこにもその例が見つかりませんでした!