(これにはしばらく時間がかかったので、それだけの価値があると考えて質疑応答を提供しています。)
DataImportHandler がデータを取得する必要がある URL は、HTTPS と追加のauthパラメーターによって保護されます。の構成は次のDataImportHandlerようになります。
<dataConfig>
<dataSource type="URLDataSource"
baseUrl="https://www.gutscheinpony.de/"
encoding="UTF-8"/>
<document>
<entity name="pony"
pk="id"
url="feeds.xml?auth=XXX"
processor="XPathEntityProcessor"
forEach="/data/offers/offer"
xsl="xslt/gutscheinpony.xsl">
<!-- fields omitted -->
</entity>
</document>
</dataConfig>
通常の SOLR 6 インストールでこれを実行すると、403 Forbiddenコードで失敗しますが、同じ URL での簡単なテストはcurl成功します (興味深い出力のみを表示します)。
curl https://www.gutscheinpony.de/feeds.xml?auth=XXX -Iv
> Host: www.gutscheinpony.de
> User-Agent: curl/7.43.0
> Accept: */*
>
< HTTP/1.1 200 OK
HTTP/1.1 200 OK
DataImportHandlerカスタム Java コードを記述せずに接続用のユーザー エージェントを設定することは可能ですか?