問題タブ [binaryfiles]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
buffer - Python 2.6でWebからバイナリファイルを保存するための最もメモリ効率の良い方法は?
Python 2.6とurllibを使用してWebからバイナリファイルをダウンロード(および保存)しようとしています。
私が理解しているように、read()、readline()、readlines()は、ファイルのようなオブジェクトを読み取る3つの方法です。バイナリファイルは実際には改行に分割されていないため、read()とreadlines()はファイル全体をメモリに読み込みます。
ランダムなread()バッファサイズを選択することは、このプロセス中のメモリ使用量を制限するための最も効率的な方法ですか?
すなわち
read(1000000)を選択したのは、それが機能し、RAMの使用量を抑えたからです。生のネットワークバッファを使用している場合、転送速度が低すぎるとバッファが枯渇する可能性があるため、ランダムな量を選択するのは悪いことだと思います。しかし、urllibはすでに低レベルのバッファリングを処理しているようです。
それを念頭に置いて、任意の数を選択しても問題ありませんか?もっと良い方法はありますか?
ありがとう。
c - バイナリ ファイルとは何ですか?また、バイナリ ファイルを作成するにはどうすればよいですか?
整数を表すバイナリ ファイルを作成したいと思います。ファイルは4バイトである必要があると思います。Linuxを使用しています。どうやってするか?別の質問: そのファイルの内容を C の整数に割り当てるにはどうすればよいですか?
c# - System.IO.BinaryWriterを使用した文字列とchar配列の書き込みの違い
C#でバイナリファイルにテキストを書き込んでいますが、文字列と文字配列の書き込みの量に違いがあります。System.IO.BinaryWriterを使用しており、書き込みが発生するときにBinaryWriter.BaseStream.Lengthを監視しています。これらは私の結果です:
ASCII文字を3つしか書き込んでいないのに、文字列のオーバーロードが4バイトを書き込む理由がわかりません。誰かがこれを説明できますか?
binary - このバイナリ データ ファイルの形式/エンコード
Advent Axys、ファイナンシャル プランナー向けのソフトウェアなどと統合するプログラムを作成しようとしています。製品のサイトはこちら: http://www.advent.com/solutions/asset-managers-software/axys-platform
価格ファイルに新しいエントリを書き込む必要がありますが、それらの多くはバイナリです。私はオンラインで見回しましたが、あまり見つかりませんでした。サポートに電子メールを送りましたが、それが役立つとは思えません.
私は短いダミーファイルと、プログラムがそのファイルに与える印刷物を持っています。それが単語の文字または記号である場合は文字を出力し、それ以外の場合は ASCII val を出力する ruby スクリプトを介してファイルを実行しました。Rubyスクリプトは次のとおりです。
そして出力:
p>数値の周りにスペースがある場合、それはバイトの値であることを意味し、そうでない場合、バイトの値はその数値の ASCII 表現であることに注意してください。
文字列(「adusnok」など)が株などを表していることは知っています。次に、シンボルのスペースが固定サイズであるため、0 のビットがあります (これが、長いシンボルの後に 0 が少ない理由です)。このシーケンス@ 1 254 250 251 252 29 0 0 2
は、新しいレコードのシンボルの直前に来て、レコードの終わりを示しているようです。あるいは、これらすべてに同じものを意味するものもありますが、同じようには見えません。その後は、基本的に何も知りません。私は、プログラムがマップすると考えているもののプリントアウトを持っています。各列を 3 つのスペースで区切ると、次のようになります。
もっとありますが、それはあなたにかなり良いアイデアを与えるはずです. 説明やその他の可能性があるものが他のファイルに保存されており、単に検索されている可能性は十分にあると思います。しかし、これらは価格ファイルであり、それが要点であるため、価格がそのファイルにあることは知っています。そう:
33333s7 => 23.45 H225 z 20 174 GA => 34.56 246 (\143 194 213 F => 45.67
3 と 7 を最初の 1 つに保存してください。すべての数値はバイトの値であり、値の ASCII 表現ではありません。また、これらの値は単なる価格ではありませんが、間違いなく価格を表していることに注意してください。
何か案は?一般的なバイナリ エンコーディングには詳しくありませんが、かなり一般的な方法を使用していても驚かないでしょう。
google-app-engine - バイナリファイルをGAE/J +GoogleDataStoreに保存する
Java(GAE / J)を使用してGoogle AppEngineでアプリケーションを構築していますが、すべてのデータはGoogleDataStoreに保存されます。さて、バイナリファイル、たとえば画像(JPG、PNGなど)、DOC、TXT、ビデオファイルを保存したい場合はどうすればよいですか?または、ビデオファイル(SWF)をどこにどのように保存する必要があるかをストリーミングしたい場合、アプリを再デプロイしてもデータが失われることはありません。
c# - 組み込みの .NET シリアライゼーション イディオムを模倣する方法は?
オブジェクトの表現を特定のバイナリ形式でディスク (または任意のストリーム) に読み書きする必要があるライブラリ (C# で記述) があります (C/Java ライブラリ実装との互換性を確保するため)。この形式には、かなりの量のビット パッキングといくつかの DEFLATE されたバイトストリームが必要です。ただし、ライブラリをできるだけ慣用的な .NET にしたいので、通常のバイナリ シリアル化プロセスにできるだけ近い API を提供したいと考えています。IFormatter インターフェイスを実装できることは認識していますが、組み込みのシリアル化スタックのどの部分も再利用できないので、これを行う価値はありますか、それとも不必要なオーバーヘッドが発生するだけでしょうか。言い換えると:
IFormatter などを実装します。
また
Stream で動作する "Serialize"/"Deserialize" メソッドを提供するだけですか?
リモーティングが関係するあらゆるケースでシリアライゼーションのセマンティクスが必要であることについて、以下で取り上げた良い点です。MarshalByRef オブジェクトの使用が可能である場合、これが問題にならないことは確かです。そのため、ISerializable/IFormatter とカスタム スタックを使用する利点または欠点はありますか (または、私の理解はリモート処理が間違っている)?
java - XLSTから低次の印刷不可能な文字を生成します
XSLTテキスト出力を使用してファイルを生成しようとしています(私が制御できないファイル形式で)。ほとんどがテキストですが、フラグとして低次の印刷不可能な文字が含まれています。 XLSTファイル内では無効です(XSLT仕様による)。
以下のようなものを機能させたいのですが、XSLTファイルで許可されていない文字が含まれているため、代わりに有効なXSLTファイルではありません。
次のエラーが発生します。
CDATAセクション、xsl:text要素、xslt-2文字マップ、いくつかの異なるエンコーディングの有無にかかわらず、実際の文字1でも試しましたが、バイナリでASCII文字を取得する方法がわかりません。コード=1。
出力を後処理する必要がありましたが、これは理想的ではありません。
XSLTから単一の低次の印刷不可能な文字出力を生成する方法はありますか?
環境:Java 6、XSLTransformerに組み込まれています。
svn - バイナリ ファイルの Git または Subversion
100 を超える「プロジェクト」を含むバージョン管理リポジトリに、バイナリ ファイル (ほとんどの場合、サイズが数 KB から数 MB の MS Word ドキュメント) を格納する必要があります。現在、Visual Source Safe を使用していますが、データベースが時々クラッシュしたり、アクセスが遅いなどの問題があります。
Git または Subversion への移行を検討しており、バイナリ ファイルを処理するにはどちらが適しているかを考えていました。
ruby - Ruby でのバイナリ ファイルの解析
Ruby でバイナリ ファイルを解析できるようにする必要があります。このファイルには、各チャンクのファイル オフセットと長さを含むヘッダーを介して検出されたデータのチャンクが含まれています。
データを正しく取り出すにはどうすればよいですか? IO#seek が理解できる形式に変換する方法がわからない文字列で出力されるため、読み取ったオフセットに基づいてファイル内をシークすることはできませんでした。
何か助けはありますか?オフセットと長さを使用可能なもの (整数など) に変換する一般的な方法が役立ちます。