-1

最初のフェーズでファイルが Excel か PDF かを識別し、コードのそれぞれの部分を実行してファイルからデータを読み取る検索ツールのコードを作成する必要があります。データは検索結果として使用されます。Excelの部分については、SSISパッケージを使用してデータを読み取り、結果のために別のスプレッドシートに配置する必要があります.PDFの場合. 私はまだそれに取り組んでいます。しかし、すべての前に、私のコードはファイルの種類を識別する必要があります。

4

1 に答える 1

0

ファイルの最初の数バイトは、多くの種類のファイルについて、ファイルの種類を識別する「マジック ナンバー」です。

たとえば、PDF ファイルは%PDF、または 0x25 0x50 0x44 0x46 で始まります。

Excel ワークブックのマジック ナンバーは、ファイルの 512 バイトに隠されているようです。

ライブラリ ( libmagic) とコマンド ライン ツール ( filemimetype) があり、すべてのファイル タイプの複雑な詳細を知らなくてもファイル タイプを見つけることができます。

于 2013-07-01T13:32:52.643 に答える