コンテンツ抽出用の PDF を Tika サーバーに送信しようとしていますが、常にエラーが発生します: 「ソース エンコーディングを使用してストリームからテキストを変換できません」
これは、Tikaがファイルを期待している方法です:
「ファイルを受け取るすべてのサービスは、HTTP "PUT" 要求を使用します。"PUT" を使用する場合、元のファイルは、追加のエンコードなしで要求本文で送信する必要があります (multipart/form-data または他のコンテナーを使用しないでください)。」ソースhttps://wiki.apache.org/tika/TikaJAXRS#Services
XMLHttpRequest() でファイルを送信する正しい方法は何ですか?
コード:
var response, error, file, blob, xhr;
file = new File("/PROJECT/web/dateien/ai/pdf.pdf");
blob = file.toBuffer().toBlob("application/pdf");
url = "http://localhost:9998/tika";
// send data
try {
xhr = new XMLHttpRequest();
xhr.open("PUT", url);
xhr.setRequestHeader("Accept", "text/plain");
xhr.send(blob);
} catch (e) {
error = e;
}
({
response: xhr.responseText,
status: xhr.statusText,
error: error,
type: xhr.responseType,
blob: blob
});
エラー: