問題タブ [extraction]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
112 参照

php - プレーンな.sqlファイルからいくつかのフィールドを抽出し、phpを使用してすべての行を.csvに書き込みます

「first_name」、「last_name」、「email」などのデータを含む.sqlファイルがあります。

私が達成したいのは、いくつかのフィールド(たとえば、「first_name」と「last_name」のみ)を抽出し、それらを.csvファイルに保存することです。

0 投票する
3 に答える
83 参照

php - 正規表現 - PHP の区切り記号の問題

[attname src="http://example.org"] somecontent [attname src="http://www.example.com"] から src 属性を抽出しようとしています。

私が今持っているもの:
preg_match_all('#attname src=".*[^"]#', $buffer, $bufferarr);

しかし、それは機能しません - second の後に停止がないため、次"のようになります。attname src="http://example.org"] somecontent [attname src="http://www.example.com

0 投票する
3 に答える
1418 参照

web-scraping - スクリーンスクレイピング | ウェブクロール

トピックについていくつか質問があります。

次の言語を使用してスクレイパーを作成することの長所と短所を誰か説明できますか?

Java/グルーヴィー

パール

PhP

セレン

パイソン

また、スクレイピング中にどのような問題に直面することが予想されるか、そしておそらくどのように対処するべきかについても考えています. たとえば、私はフラグメント ID に遭遇しましたが、まだそれを処理する方法を見つけていません。(私はhtmlunitを使用しています)

トピックについて少し知っている人のためのいくつかの指針を探しています。

0 投票する
1 に答える
318 参照

php - PHPを使用したPDFドキュメントの解析

PHPを使用してさらに操作するために.pdfファイルの内容を抽出するにはどうすればよいですか?

0 投票する
2 に答える
3272 参照

iphone - 指定したフォルダに展開するlibarchive?

libarchiveZIPファイルを指定したフォルダに抽出するために使用する例を示すのを手伝ってくれる人はいますか? 提供されているサンプル プログラム ( untar.ctarfilter.cおよびminitar) はすべて、現在の作業ディレクトリにアーカイブを抽出するようです。「このフォルダとその下に抽出する」と言ってlibarchive、プログラムのアクティブなフォルダを壊さないようにする方法はありますか?

主な原因の 1 つは、抽出コードがバックグラウンド スレッドで実行されるため、プログラムの作業ディレクトリを変更すると問題が発生する可能性があることです。また、これは iOS アプリケーション (iPhone、iPad) で使用されます。これは、アプリケーションが書き込むことができるフォルダーにうるさいです。

前もって感謝します。

0 投票する
1 に答える
3588 参照

extract - Google Earth から 3D モデルを取得するには?

ある地域の 3D モデルをすべて Google Earth から取得したいと考えています。これはどのように達成できますか?

0 投票する
1 に答える
1963 参照

php - php 正規表現と漢字

日付「25/01/2005」、会社名「A One Investment Company Limited 大一投資有限公司」、中国名「大一投資有限公司」、ライセンス番号「ABG896」を抽出しようとしています。この文字列:

名称: A One Investment Company Limited 大一投資有限公司 (ABG896) ライセンスの日付: 2005 年 1 月 25 日 備考


ただし、中国語の記号を含むすべてのデータを配列に抽出する方法がわかりません。

0 投票する
1 に答える
2049 参照

linux - 個別に復号化する必要がある、Linux で分割された .tar ファイルを抽出する

以下のように名前が付けられた23個の.tarファイルを抽出して復号化しようとしています:

それらは 23 個あり、抽出する前にそれぞれ dePKG というアプリで復号化する必要があります。

このbashスクリプトを試しました:

23個のファイルすべてで次のエラーが発生します。

pkg pkg data @ 340 の 0x800 バイトを読み取り
、サイズ 3ec
は膨張せず、1004 バイトを書き込みます
tar: これは tar アーカイブのようには見えません
tar: 次のヘッダーにスキップし
ます

時間を節約したいだけです:D

0 投票する
1 に答える
637 参照

php - favicon.icoファイルから異なるサイズのアイコンを抽出するには?

PHP を使用して、favicon.ico ファイルからさまざまなサイズ (利用可能な場合) を抽出し、それぞれを個別の .png ファイル (favicon16.png、favicon32.png など) に保存したいと考えています。それを達成する方法は?

0 投票する
1 に答える
2354 参照

perl - PDFからテキストを抽出するのに最適なperlモジュールは何ですか?

PDFからテキストを抽出する最良の方法は何ですか?