問題タブ [bz2]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
c++ - simple/bz2-compress-file を (1 行ずつ) 圧縮されているかどうかを検出して読み取る (ファイルのサイズが大きい)
simple-text/bz2-compressed-file を読み取るコードを書きました。ファイルが圧縮されているかどうかを検出するために、bz2ファイルの魔法の文字を使用しました
注「ユーザーは適切な拡張子のファイルを提供する場合と提供しない場合があります」
私のコード
このコードには問題があります。圧縮ファイルの読み取り中。圧縮ファイル全体を読み込んでいます。file_typeをテストするためだけに、ファイル全体をメモリにロードしたくありません。
ファイル サイズが 4 GB を超える可能性があります
何らかの方法で file_type を把握できれば、それは非常に簡単です。
事前にそれを知る方法がわかりません。または他のアプローチ。
batch-file - ディレクトリ内のすべての .bz2 アーカイブを解凍しています
多くの bz2 アーカイブを含むサブディレクトリでいっぱいの「input」というディレクトリがあります。そのようです:
内部ファイル構造を保持しながら、各アーカイブの内容を新しい「出力」フォルダーに抽出するWindowsバッチスクリプトを作成しようとしているため、次のようになります。
これまでのところ、次のスクリプトがあります。
抽出は機能しますが、内容がフォルダー 1、フォルダー 2 などにパッケージ化されません。
各アーカイブの親フォルダーに新しいフォルダーを作成し、それを出力ディレクトリとして設定する必要があるように感じます。このようなもの:
しかし、親フォルダー名を取得するにはどうすればよいでしょうか?
c++ - bz2 をサポートする Linux でブーストをビルドできない
ブースト 1.66 をダウンロードし、bzip を解凍し、ブートストラップを起動します。
b2 レポート:
ビルド中にエラーはなく、警告のみ。/home/steve/boost_1_66_0/stage/lib を調べていますが、名前にbzが含まれるファイルはありません。私が持っているWindowsのビルド済みバイナリでは:
その結果、私のプロジェクトは Windows では正常にビルドされますが、bz2 の依存関係がないために Linux では失敗します。何か案は?
私のLinuxはubuntu 14です。
ありがとう。
python - Python 2.7 bz2.decompress の問題 (ファイル全体を読み取れない)
Python で bz2 ファイルを解凍すると、いくつかの問題が発生します。Windows 7 と Red Hat で同じ問題が発生しています。どちらも Python 2.7 Anaconda ディストリビューションを実行しています。
bz2 ファイルを読み取ると、ファイルの最初の 900k バイトしか取得できません。
bz2.decompress では、最初の 900000 バイトしか得られません。s2はほとんどの場合sより大きくなります。
これは、Read Hat または Windows を選択した環境に関係なく当てはまります。
誰も手がかりを持っていますか?
ありがとう
python - Python:エスケープ文字を追加せずに生の文字列をバイト文字列に変換する
私は文字列を持っています:
そして私が欲しい:
しかし、私は取得し続けます:
環境
Web ページから文字列を切り取り、変数に格納しましたun
。次に、BZip2 を使用して解凍します。
ただし、オブジェクトであるため、次のエラーが発生しますun
。str
したがって、un
単一のバックスラッシュをエスケープされたバックスラッシュに変更せずに、バイトのようなオブジェクトに変換する必要があります。
編集1: すべての助けをありがとう!@wimあなたの言いたいことはわかりましたが、ウェブスクレイピングメソッドからバイトのようなオブジェクトを取得する方法について途方に暮れています:
私が使用しているパッケージは、、、、requests
およびです。lxml.html
re
bz2
繰り返しますが、私の目標は をun
使用して解凍するbz2
ことですが、Web スクレイピング プロセスからバイトのようなオブジェクトを取得するのに苦労しています。
ポインタはありますか?