その [Redpaper][1] をラップトップにダウンロードし、Document Conversion Demoに移動し、 Choose your fileをクリックして、ダウンロードしたばかりの PDF をアップロードし、Answer units JSONを目的の出力形式としてクリックしました。最初は、何も起こらなかった。出力ドキュメントの右側にあるダウンロード アイコンを押すと、変換された JSON 出力がダウンロードとして提供され、Web ページにも入力されました。ページをリロードすると、ダウンロードを行わなくても、デモ ページに変換が表示されました。
私はNode.jsの初心者です。version である現在のパッケージを使用して、( Node を介したドキュメント変換に基づいて) 次のコードを動作させました。watson-developer-cloud
1.8.0
var watson = require('watson-developer-cloud');
var fs = require('fs');
var document_conversion = watson.document_conversion({
username: 'username',
password: 'password',
version: 'v1',
version_date: '2015-12-15'
});
document_conversion.convert({
file: fs.createReadStream('redp5213.pdf'),
conversion_target: "ANSWER_UNITS"
}, function (err, response) {
if (err) {
console.error(err);
} else {
console.log(JSON.stringify(response, null, 2));
}
});
これは、コーヒー ショップの WiFi で実行するのに 10 ~ 20 秒かかりました。
ああ、それと、「なぜ HTML に変換しようとしているのですか?」という質問に答えるのを忘れていました。Document Conversion サービスは、常にHTML に変換してから、正規化された HTML に変換します。回答単位またはプレーン テキストの場合、正規化された HTML を要求された形式に変換する追加の手順が必要です。これについては、Document Conversion - Customizingで説明されています (これは、奇妙なことに、基本的なフロー ドキュメントの邪魔にならないように思えます)。
[1]: http://www.redbooks.ibm.com/redpapers/pdfs/redp5213.pdf Redpaper