最初のフェーズでファイルが Excel か PDF かを識別し、コードのそれぞれの部分を実行してファイルからデータを読み取る検索ツールのコードを作成する必要があります。データは検索結果として使用されます。Excelの部分については、SSISパッケージを使用してデータを読み取り、結果のために別のスプレッドシートに配置する必要があります.PDFの場合. 私はまだそれに取り組んでいます。しかし、すべての前に、私のコードはファイルの種類を識別する必要があります。
質問する
42 次
1 に答える
0
ファイルの最初の数バイトは、多くの種類のファイルについて、ファイルの種類を識別する「マジック ナンバー」です。
たとえば、PDF ファイルは%PDF
、または 0x25 0x50 0x44 0x46 で始まります。
Excel ワークブックのマジック ナンバーは、ファイルの 512 バイトに隠されているようです。
ライブラリ ( libmagic
) とコマンド ライン ツール ( file
、mimetype
) があり、すべてのファイル タイプの複雑な詳細を知らなくてもファイル タイプを見つけることができます。
于 2013-07-01T13:32:52.643 に答える