1

私がやりたいことは非常に単純です。論文/本を含むPDF/PS / DjVuファイルが与えられたら、論文の著者とタイトルを見つけます(他のメタデータは良いですが、それほど必要ではありません)。この認識は完璧である必要はありませんが、できる限り良いものにしたいと思います。これらのファイルのメタデータとコンテンツにアクセスできるオープンソースの.NETおよび/またはJavaライブラリ(できれば.NET)を探しています。

PDFの場合、 PDFBox(.NET / Java)とPDF Library (.NET)を見つけましたが、私が知らないより良い代替案があるかもしれません。PostscriptとDjVuについては、何も見つかりませんでした。

4

4 に答える 4

1

ほとんどの PDF 操作にはiTextSharpを使用します。これは、元の Java 実装のポートです。

于 2009-08-21T12:20:44.830 に答える
1

DjVu の場合、CamiNovaの商用 SDK またはオープン ソース ライブラリの DjVu Libre を使用できます。

于 2009-12-11T05:28:36.817 に答える
1

別の PDF ライブラリはPDFSharpです。かなりまともな読み取り/解析機能があります。

于 2009-09-03T02:40:41.283 に答える
0

Djvu の場合、https ://github.com/Telavian/DjvuNet にある C# ライブラリを使用できます。

于 2014-01-23T21:46:54.657 に答える