“tarfile”の関連問題_Stack Overflow日本語サイト

0 投票する

2 に答える

158 参照

c++ - tar パーサーのリンクインジケーター (ファイルタイプ) とは

tar ファイル内に存在する html ファイルのファイルタイプを知りたいです。tar ファイルをバッファに保存しましたが、バッファ [124] の場所にあるファイルのサイズを知ることができますが、知りたいのは - (1.) tar に存在するファイルがHTMLファイル?? それを行う方法はありますか?? ファイル形式のリンクインジケータを知ることができると思います（しかし、よくわかりません）。誰かがそれを行う方法を説明できますか??

(2.) tar ファイル内に html ファイルがあることが確かな場合は、これらの html ファイルの内容を tar ファイルに保存します。

tarファイルには他にも多くのファイルが存在します（htmlファイルだけでなく、この行に注意してください。htmlファイルの場所がわかりません）

これを達成する方法はありますか??

c++html-parsing tarfile

2013-07-29T07:11:26.417

0 投票する

1 に答える

5439 参照

python - Web サイトから .tar.gz ファイルの内容を python 3.x オブジェクトに読み込みます

私はpythonが初めてです。.tar.gz ファイルの内容を python に読み込もうとすると、何が間違っているのかわかりません。読みたい tarfile は、次の Web アドレスでホストされています。

ftp://ftp.ncbi.nlm.nih.gov/pub/pmc/b0/ac/Breast_Cancer_Res_2001_Nov_9_3(1)_61-65.tar.gz

このサイトのファイルに関する詳細情報 (内容を信頼できるように) http://www.pubmedcentral.nih.gov/utils/oa/oa.fcgi?id=PMC13901

tarfile には、ジャーナル記事の .pdf および .nxml コピーが含まれています。また、いくつかの画像ファイルもあります。

コピーして貼り付けてブラウザでファイルを開くと。PC 上の場所に保存し、次のコマンドを使用して tarfile を正常にインポートできます (注: 場所に保存すると、winzip はファイルを .tar.gz から単に .tar に変更します)。

ただし、同様のコマンドを使用してファイルに直接アクセスしようとすると、次のようになります。

その結果、次のエラーが発生します。

.tar.gz ファイルを Web アドレスから直接読み取ろうとするときに、私が間違っていることを誰か説明できますか? 前もって感謝します。クリス

python python-3.x tar tarfile

2013-09-04T14:57:46.963

0 投票する

3 に答える

4813 参照

python - 内容の Tarfile を Python に読み込む - 「後方シークは許可されていません」

私はpythonが初めてです。tarfile の内容を Python に読み込むのに問題があります。

データはジャーナル記事の内容です (pubmed central でホストされています)。以下の情報を参照してください。そして、Pythonに読み込みたいtarfileへのリンク。

http://www.pubmedcentral.nih.gov/utils/oa/oa.fcgi?id=PMC13901 ftp://ftp.ncbi.nlm.nih.gov/pub/pmc/b0/ac/Breast_Cancer_Res_2001_Nov_9_3(1)_61 -65.tar.gz

同様の .tar.gz ファイルのリストがあり、最終的には同様に読み込みたいと考えています。すべての tarfile に .nxml ファイルが関連付けられていると思います (知っています)。これは、実際に抽出/読み取りに興味がある .nxml ファイルの内容です。これを行うための最良の方法についての提案をお待ちしております...

tarfile を PC に保存すると、次のようになります。すべてが期待どおりに実行されます。

pubmed centrals FTP サイトから直接 tarfile にアクセスするには、を使用してネットワーク要求を設定する必要があることを今日知りましたurllib。以下は改訂されたコードです（および私が受け取ったstackoverflowの回答へのリンク）：

Web サイトから .tar.gz ファイルの内容を python 3.x オブジェクトに読み込みます

ただし、コードの残りの部分 (以下) を実行すると、エラーメッセージが表示されます (「後方へのシークは許可されていません」)。どうして？

tarfile に関連付けられた .nxml コンテンツを読み取ろうとする最後の行でコードが失敗します。以下は、私が受け取った実際のエラーメッセージです。どういう意味ですか？すべて tarfile に埋め込まれているこれらの .nxml ファイルのコンテンツを読み取り/アクセスするための最善の回避策は何ですか?

よろしくお願いします。クリス

python python-3.x tar tarfile

2013-09-04T21:10:30.817

0 投票する

1 に答える

964 参照

python - tarfile の ExFileObject に .readinto(b) メソッドを追加しますか?

そのため、tar 内の多数のファイルを反復処理し、そのデータを定義済みの ctype 構造にロードしようとしています。tar ファイル以外のファイルでは問題なく動作していましたが、 tarfile のメソッドによって返されたExFileObjectextractfile(member)がそのメソッドをサポートしていないことがわかりました.readinto(b)。

だから今ここに私がやっていることがあります：

そしてこれを得る：

このメソッドを ExFileObject に追加する方法はありますか? または、定義済みの ctypes 構造にデータを簡単にロードする別の方法はありますか? tarfileオブジェクトでは、fileobject返された tarinfo ファイルに使用するように設定できるように見えますが、io.BufferedReader でスワップするだけでは機能しないようです。

（ExFileObjectをStringIOに読み込もうとしましたが、readinto()適切に実装されていないようです...extractall()メモリ内のファイルスペースにアクセスして、ファイルを標準ファイルオブジェクトとして再度開くことができると考えていますが、追加の構成が必要になるため、それを避けたい)

python ctypes tarfile

2013-09-13T16:25:29.707

0 投票する

0 に答える

37 参照

sql - SQLからのファイルの圧縮を自動化する方法

各期間 (2013 年 1 月など) の結果を含む SQL テーブルがあります。これらは私が従う手順です：

各時代からレコードを選択したい。
結果を CSV ファイルに入れます。
次に、ヘッダーをコピーし、CSV ファイルを別の名前のテキストファイルに保存します。
次に、テキストファイルを取得し、そのファイルを gzip します。
テキストファイルにあるレコードを検索し、カウントファイルを作成します。（。TXT）
次に、その gzip ファイルと counts ファイルを取得して、.tar ファイルを作成します。
再度、.tar ファイルを指すカウントファイルを作成します。

そのテーブルにあるすべての期間に対してこれらの手順を実行する必要があります。

Perl/Python スクリプトやバッチファイルなど、これを行う簡単な方法はありますか?

sql automation tarfile perlscript

2013-12-03T15:43:01.193

0 投票する

1 に答える

1583 参照

python - Python tarfile エラー: struct.error: unpack には長さ 4 の文字列引数が必要です

次の処理を行うファイルがたくさんあります。

tarfile.open特定のファイルについて、呼び出しの直後にこのエラーが発生します。

トレースバック (最新の呼び出しが最後):

質問: どうすればこれを回避できますか?

python tarfile

2013-12-17T23:09:22.570

0 投票する

1 に答える

72 参照

python - 画像がパスを保持しないように tarfile を回避する方法

tarfile モジュールを使用して画像ファイルを圧縮しています。しかし、画像を圧縮すると、画像が配置されている画像の合計パスが保持されます。それらは相対的でなければなりません。画像が場所 a/b/c/demo_images.png に配置されている場合、tar.gz を抽出した後、同じ構造 a/b/c/demo_images.png のように抽出された部分にもフォルダーが含まれますが、必要なのは抽出後の demo_images.png。

python tarfile

2014-01-06T11:14:20.620

0 投票する

2 に答える

1472 参照

python - Python ネイティブ tarfile lib でのメモリ使用量が多い

私はメモリに制約のある環境で作業しており、tarfile ライブラリ ( http://docs.python.org/2/library/tarfile.html ) を含む Python スクリプトを使用して、ログファイルのバックアップを継続的に作成しています。

ログファイルの数が増加するにつれて (~74 000)、システムがこのバックアッププロセスを実行すると効果的に強制終了することに気付きました。非常に多くのメモリを消費していることに気付きました (OS によって強制終了される前に最大 192 MB)。

ログファイルの gzip tar アーカイブ ($ tar -czf) を、問題や高いメモリ使用量なしで作成できます。

コード：

dir "asdf" は、長さ 73 のファイル名を持つ 74407 個のファイルで構成されています。膨大な量のファイルがある場合、Python の tarfile を使用することはお勧めできませんか?

Ubuntu 12.04.3 LTS と Python 2.7.3 を実行しています (tarfile のバージョンは "$Revision: 85213 $" のようです)。

python tarfile

2014-01-10T09:03:16.473

0 投票する

2 に答える

3294 参照

python - ディレクトリなしで tar.gz の tar ファイルを圧縮するには?

ディレクトリなしでtar.gzにtarファイルを圧縮する方法を探しています。

今日、私のコードは、「tarfile」ライブラリと arcname 引数を使用してディレクトリなしで TAR ファイルを生成しますが、この TAR ファイルを TAR.GZ で圧縮したい場合、ディレクトリを削除する方法がわかりません。

この 3 日間で多くのテストを行いました。

私のコード:

python gzip tar tarfile

2014-01-15T12:31:41.250

問題タブ [tarfile]

Reference