問題タブ [extraction]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
php - プレーンな.sqlファイルからいくつかのフィールドを抽出し、phpを使用してすべての行を.csvに書き込みます
「first_name」、「last_name」、「email」などのデータを含む.sqlファイルがあります。
私が達成したいのは、いくつかのフィールド(たとえば、「first_name」と「last_name」のみ)を抽出し、それらを.csvファイルに保存することです。
php - 正規表現 - PHP の区切り記号の問題
[attname src="http://example.org"] somecontent [attname src="http://www.example.com"] から src 属性を抽出しようとしています。
私が今持っているもの:
preg_match_all('#attname src=".*[^"]#', $buffer, $bufferarr);
しかし、それは機能しません - second の後に停止がないため、次"
のようになります。attname src="http://example.org"] somecontent [attname src="http://www.example.com
web-scraping - スクリーンスクレイピング | ウェブクロール
トピックについていくつか質問があります。
次の言語を使用してスクレイパーを作成することの長所と短所を誰か説明できますか?
Java/グルーヴィー
パール
PhP
セレン
パイソン
また、スクレイピング中にどのような問題に直面することが予想されるか、そしておそらくどのように対処するべきかについても考えています. たとえば、私はフラグメント ID に遭遇しましたが、まだそれを処理する方法を見つけていません。(私はhtmlunitを使用しています)
トピックについて少し知っている人のためのいくつかの指針を探しています。
php - PHPを使用したPDFドキュメントの解析
PHPを使用してさらに操作するために.pdfファイルの内容を抽出するにはどうすればよいですか?
iphone - 指定したフォルダに展開するlibarchive?
libarchive
ZIPファイルを指定したフォルダに抽出するために使用する例を示すのを手伝ってくれる人はいますか? 提供されているサンプル プログラム ( untar.c
、tarfilter.c
およびminitar
) はすべて、現在の作業ディレクトリにアーカイブを抽出するようです。「このフォルダとその下に抽出する」と言ってlibarchive
、プログラムのアクティブなフォルダを壊さないようにする方法はありますか?
主な原因の 1 つは、抽出コードがバックグラウンド スレッドで実行されるため、プログラムの作業ディレクトリを変更すると問題が発生する可能性があることです。また、これは iOS アプリケーション (iPhone、iPad) で使用されます。これは、アプリケーションが書き込むことができるフォルダーにうるさいです。
前もって感謝します。
extract - Google Earth から 3D モデルを取得するには?
ある地域の 3D モデルをすべて Google Earth から取得したいと考えています。これはどのように達成できますか?
php - php 正規表現と漢字
日付「25/01/2005」、会社名「A One Investment Company Limited 大一投資有限公司」、中国名「大一投資有限公司」、ライセンス番号「ABG896」を抽出しようとしています。この文字列:
名称: A One Investment Company Limited 大一投資有限公司 (ABG896) ライセンスの日付: 2005 年 1 月 25 日 備考
ただし、中国語の記号を含むすべてのデータを配列に抽出する方法がわかりません。
linux - 個別に復号化する必要がある、Linux で分割された .tar ファイルを抽出する
以下のように名前が付けられた23個の.tarファイルを抽出して復号化しようとしています:
それらは 23 個あり、抽出する前にそれぞれ dePKG というアプリで復号化する必要があります。
このbashスクリプトを試しました:
23個のファイルすべてで次のエラーが発生します。
pkg pkg data @ 340 の 0x800 バイトを読み取り
、サイズ 3ec
は膨張せず、1004 バイトを書き込みます
tar: これは tar アーカイブのようには見えません
tar: 次のヘッダーにスキップし
ます
時間を節約したいだけです:D
php - favicon.icoファイルから異なるサイズのアイコンを抽出するには?
PHP を使用して、favicon.ico ファイルからさまざまなサイズ (利用可能な場合) を抽出し、それぞれを個別の .png ファイル (favicon16.png、favicon32.png など) に保存したいと考えています。それを達成する方法は?
perl - PDFからテキストを抽出するのに最適なperlモジュールは何ですか?
PDFからテキストを抽出する最良の方法は何ですか?