2

コンテンツ抽出用の PDF を Tika サーバーに送信しようとしていますが、常にエラーが発生します: 「ソース エンコーディングを使用してストリームからテキストを変換できません」

これは、Tikaがファイルを期待している方法です:

「ファイルを受け取るすべてのサービスは、HTTP "PUT" 要求を使用します。"PUT" を使用する場合、元のファイルは、追加のエンコードなしで要求本文で送信する必要があります (multipart/form-data または他のコンテナーを使用しないでください)。」ソースhttps://wiki.apache.org/tika/TikaJAXRS#Services

XMLHttpRequest() でファイルを送信する正しい方法は何ですか?

コード:

var response, error, file, blob, xhr;

file = new File("/PROJECT/web/dateien/ai/pdf.pdf");

blob = file.toBuffer().toBlob("application/pdf");
url = "http://localhost:9998/tika";

// send data
try {
    xhr = new XMLHttpRequest();
    xhr.open("PUT", url);
    xhr.setRequestHeader("Accept", "text/plain");
    xhr.send(blob);
} catch (e) {
    error = e;
}

({
    response: xhr.responseText,
    status: xhr.statusText,
    error: error,
    type: xhr.responseType,
    blob: blob
});

エラー:

出力結果・エラー

4

1 に答える 1