問題タブ [binaryfiles]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
binaryfiles - .hpi ファイルの .jpg/.png コンポーネントを抽出するにはどうすればよいですか?
私はかなり古い写真オブジェクト ディスクを偶然見つけましたが、悲しいことに会社 (hemera) がそれをサポートしていないことがわかりました。これにより、大量の .hpi ファイルが残されました。幸いなことに、ファイルの jpg および png コンポーネントの抽出に関するこの情報を見つけました。
残念ながら、私はそれを機能させることができませんでした。このコードの何が問題なのか、誰でも理解できますか? Perl が苦手な場合は、PHP または Python のソリューションがあれば幸いです。:)
CD から入手した現在のテスト ファイルの 16 進ダンプは次のとおりです。
javascript - JavaScriptで文字列をBase64にエンコードするにはどうすればよいですか?
PNG 画像を Base64 文字列にエンコードできる PHP スクリプトがあります。
JavaScriptを使用して同じことをしたいと思います。ファイルを開く方法は知っていますが、エンコードの方法がわかりません。バイナリ データの操作に慣れていません。
c++ - ファイルの内容をASCIIまたはバイナリとして識別する方法
C ++を使用して、ファイルの内容がASCIIまたはバイナリであるとどのように識別しますか?
java - Java で構造化されたバイナリ ファイルを読み取る最良の方法
Java でレガシー形式のバイナリ ファイルを読み取る必要があります。
簡単に言えば、ファイルには、いくつかの整数、バイト、および固定長の文字配列で構成されるヘッダーがあり、その後に整数と文字で構成されるレコードのリストが続きます。
他の言語では、ヘッダーとレコードのバイト単位の表現であるstruct
s (C/C++) またはs (Pascal/Delphi) を作成します。record
次にsizeof(header)
、バイトをヘッダー変数に読み込み、レコードに対して同じことを行います。
このようなもの: (Delphi)
Javaで似たようなことをする最善の方法は何ですか? すべての値を独自に読み取る必要がありますか、またはこの種の「ブロック読み取り」を行う他の方法はありますか?
database - アップロードされた画像、SQL データベース、またはディスク ファイル システムを保存するのに最適な場所はどれですか?
ユーザーがサーバーに画像をアップロードできるようにするアプリケーションを作成しています。1 日あたり約 20 枚の画像がすべて jpeg で、おそらく編集/サイズ変更されていないと予想しています。(これは別の質問です。保存する前にサーバー側で画像のサイズを変更する方法です。誰かがそのための.NETリソースをコメントなどにドロップしてください)。アップロードした画像を保存するのに最適な場所はどこだろうか。
イメージをファイルとしてファイル システムに保存し、そのイメージへの正確なパスを含むテーブルにレコードを作成します。
または、データベース サーバーの「イメージ」または「バイナリ データ」データ型を使用して、イメージ自体をテーブルに格納します。
どちらにも長所と短所があると思います。a) が好きなのは、ファイルを簡単に再配置でき、テーブル エントリを変更するだけでよいからです。一方で、Web サーバーにビジネス データを保存するのは好きではなく、ビジネス データを保持する他のデータソースに Web サーバーを接続したくありません (セキュリティ上の理由から) b) すべての情報がクエリで簡単にアクセスできます。一方、データベースはすぐに非常に大きくなります。そのデータをアウトソーシングすることは、より困難になる可能性があります。
c++ - C++ ハフマン コード ヘッダー
基本的に、私はハフマンテーブルを次のように持っています
string はビット パターンで、char はそのパターンで表される値です。問題は、それを圧縮ファイルのヘッダーとして保存して、デコードしたいときに同じマップを再度構築できるようにする方法です。
バイナリとして保存しようとしています:
そして後でビルドします:
動作しません。文字列の初期化エラーが発生します... NULL と関係があります。助言がありますか?ビットと値を保存するより良い方法があれば、私が聞きたいです。
c++ - What to put in a binary data file's header
I have a simulation that reads large binary data files that we create (10s to 100s of GB). We use binary for speed reasons. These files are system dependent, converted from text files on each system that we run, so I'm not concerned about portability. The files currently are many instances of a POD struct, written with fwrite.
I need to change the struct, so I want to add a header that has a file version number in it, which will be incremented anytime the struct changes. Since I'm doing this, I want to add some other information as well. I'm thinking of the size of the struct, byte order, and maybe the svn version number of the code that created the binary file. Is there anything else that would be useful to add?
reverse-engineering - 互換性のためにバイナリ ファイル形式をリバース エンジニアリングする方法
私は、翻訳者がさまざまなファイル形式で簡単かつ効率的に作業できるようにするファイル準備ソフトウェアに取り組んでいます。
テキストベースの形式 (xml、php、リソース ファイルなど) に関する限り、私の小さな準備ユーティリティは問題なく動作しますが、ほとんどの翻訳者にとって大きな問題は、あらゆる種類の独自のバイナリ形式 (Framemaker、Publisher、クォーク...)。
これらのファイルが要求されることはめったになく、高価なアプリケーションで開く必要があります (年間数件のプロジェクトを処理するためだけに 20,000 ドル相当のソフトウェアを購入できるフリーランスはほとんどいません)。
これらのファイルを読み取ってテキストを抽出し、翻訳して元のアプリケーションに再インポートできるようにしたいと考えています。
それは実行可能に聞こえますか?
バイナリ ファイル形式の処理に関する詳細情報はどこにありますか? また、この種の作業に役立つツールはありますか? (通常の 16 進エディタ以外に)
前もって感謝します。
git - Git を使用した大きなバイナリ ファイルの管理
ソース コード (Web アプリケーション) が依存する大きなバイナリ ファイルの処理方法について意見を求めています。現在、いくつかの代替案について話し合っています。
- バイナリ ファイルを手動でコピーします。
- プロ: わかりません。
- 反対: 新しいサイトをセットアップしたり、古いサイトを移行したりするときにエラーが発生する可能性が高くなるため、私はこれに強く反対します。取るべき別のハードルを構築します。
- それらすべてをGitで管理します。
- 長所: 重要なファイルのコピーを「忘れる」可能性を排除します
- 反対: リポジトリが肥大化し、コードベースとチェックアウト、クローンなどを管理する柔軟性が低下します。これにはかなりの時間がかかります。
- 別々のリポジトリ。
- 長所: ソース コードのチェックアウト/クローン作成は相変わらず高速で、イメージは独自のリポジトリに適切にアーカイブされます。
- 反対:プロジェクトに唯一無二のGit リポジトリを持つという単純さを取り除きます。それは確かに私が考えていなかったいくつかの他のことを紹介します.
これに関するあなたの経験/考えは何ですか?
また、複数の Git リポジトリを使用し、それらを 1 つのプロジェクトで管理した経験のある人はいますか?
ファイルは、それらのファイルを含む PDF を生成するプログラムの画像です。ファイルは頻繁に変更されることはありません (数年単位) が、プログラムとの関連性は非常に高いものです。ファイルがないとプログラムは動作しません。
database - HDF5 の評価: HDF5 はデータのモデリングにどのような制限/機能を提供しますか?
C/C++ コードの分析中に収集したデータを格納するために使用するテクノロジを評価しています。C++ の場合、データ量は比較的大きくなる可能性があり、TU あたり最大 20Mb です。
次のSOの回答を読んだ後、 HDF5が使用に適したテクノロジーである可能性があると考えました。ここにいる人々が、私が持っているいくつかの最初の質問に答えるのを手伝ってくれるかどうか疑問に思っていました:
パフォーマンス。データの一般的な使用法は、コンパイラによって生成された「.o」ファイルの有効期間と同様に、1 回の書き込みと「数回」の読み取りです。HDF5 は、SQLite DB などを使用する場合と比べてどうですか? それは合理的な比較でさえありますか?
時間の経過とともに、保存している情報を追加しますが、新しい形式をサポートするために、完全に新しい "リーダー" のセットを再配布する必要はありません。ユーザー ガイドを読んだ後、HDF5 は XML や DB に似ていることを理解しました。つまり、情報はタグ/列に関連付けられているため、古い構造を読み取るために作成されたツールは、関係のないフィールドを無視します。これについての私の理解は正しいですか?
書き出したい情報のかなりの部分は、ツリー型の構造 (スコープ階層、型階層など) になります。理想的には、親、子などを持つスコープをモデル化します。1 つの HDF5 オブジェクト「ポイント」を持つことは可能ですか?別の?そうでない場合、HDF5 を使用してこの問題を解決する標準的な手法はありますか? それとも、DB で必要とされるように、データを検索するときに適切なルックアップを使用して、あるオブジェクトを別のオブジェクトに「リンク」する一意のキーが必要ですか?
どうもありがとう!