0

このドキュメントを変換しようとしています: http://www.redbooks.ibm.com/redpapers/pdfs/redp5213.pdfJSON 回答ユニットに変換しようとしていますが、それ (および多くの同様の他のドキュメント) はサービスを介して処理されません。https://document-conversion-demo.mybluemix.net/のデモ ページで処理しようとすると、「必要なパラメーターがありません: params.file または params.document_id を指定する必要があります」というエラーが返されるか、単に空白の結果を返します。Node.js と watson-developer-cloud を介して REST API で試してみると、「PDF を HTML に変換中に例外が発生したため、入力ドキュメントを変換できませんでした」というメッセージとともにエラー コード 400が返されます。. (HTML に変換しようとしている理由はわかりません。JSON 応答ユニットを指定しましたが、このコードは、私が試した他のいくつかのドキュメントでうまく機能しました)。

変換しようとしているこれらのレッドペーパーに何か異常がありますか、それともドキュメント変換サービスに問題がありますか?

4

1 に答える 1

0

その [Redpaper][1] をラップトップにダウンロードし、Document Conversion Demoに移動し、 Choose your fileをクリックして、ダウンロードしたばかりの PDF をアップロードし、Answer units JSONを目的の出力形式としてクリックしました。最初は、何も起こらなかった。出力ドキュメントの右側にあるダウンロード アイコンを押すと、変換された JSON 出力がダウンロードとして提供され、Web ページにも入力されました。ページをリロードすると、ダウンロードを行わなくても、デモ ページに変換が表示されました。

私はNode.jsの初心者です。version である現在のパッケージを使用して、( Node を介したドキュメント変換に基づいて) 次のコードを動作させました。watson-developer-cloud1.8.0

var watson = require('watson-developer-cloud');
var fs = require('fs');

var document_conversion = watson.document_conversion({
  username:     'username',
  password:     'password',
  version:      'v1',
  version_date: '2015-12-15'
});

document_conversion.convert({
  file: fs.createReadStream('redp5213.pdf'),
  conversion_target: "ANSWER_UNITS"
}, function (err, response) {
  if (err) {
    console.error(err);
  } else {
    console.log(JSON.stringify(response, null, 2));
  }
});

これは、コーヒー ショップの WiFi で実行するのに 10 ~ 20 秒かかりました。

ああ、それと、「なぜ HTML に変換しようとしているのですか?」という質問に答えるのを忘れていました。Document Conversion サービスは、常にHTML に変換してから、正規化された HTML に変換します。回答単位またはプレーン テキストの場合、正規化された HTML を要求された形式に変換する追加の手順が必要です。これについては、Document Conversion - Customizingで説明されています (これは、奇妙なことに、基本的なフロー ドキュメントの邪魔にならないように思えます)。

[1]: http://www.redbooks.ibm.com/redpapers/pdfs/redp5213.pdf Redpaper

于 2016-05-13T21:28:46.043 に答える