0

私たちのプロジェクトでは、構造化されたコンテンツを含むドキュメントを解析し、ユーザーは受信するドキュメントのスキーマをアップロードする必要があります。これまではXMLのみを扱っていたため、これで問題ありませんでした。しかし、現在、xls(x)、doc(x)、およびpdfの要件があります。

これらのドキュメントタイプのスキーマ定義はありますか?私はそれがpdfのためにそこにないかもしれないと確信することができます、しかし他のタイプのためにこれらを持っている何らかの方法があるかもしれないことを望んでいます。

4

1 に答える 1

1

MSDN には、Microsoft 形式のドキュメントがあります。

PDF は PostScript に基づくページ記述言語であるため、ドキュメントの内容を意味的に理解するスキーマがありません。

于 2012-12-13T05:32:04.197 に答える