2

IBM Watson for Worksheet で Solr Schema を質問のコレクションとして定義しました。多値フィールドであるスキーマ要素はほとんどありません。Retrieve and Rank Services を使用してドキュメントをロードし、ドキュメントをインデックス化することはできますが、トレーニング データセットを生成するときに、データ型変換エラーが発生します。

スキーマ

    <field name="id" type="string" indexed="true" stored="true" required="true" multiValued="false"/>
    <field name="worksheet_number" type="watson_text_en" indexed="true" stored="true" />
    <field name='question_number' type='int' indexed='true' stored='true' multiValued='true' />
    <field name='question_type' type='watson_text_en' indexed='true' stored='true' multiValued='true' />
    <field name='answer' type='watson_text_en' indexed='true' stored='true' multiValued='true' />
    <field name='text' type='watson_text_en' indexed='true' stored='true' multiValued='true' />

例外をスローする train.py を使用したトレーニング コマンド curl -u "***********":"************" " https://gateway.watsonplatform.ネット/検索とランク/api/v1/rankers/3b140ax15-rank-3108

残念ながら、例外は、例外をスローしているフィールドに関する情報を提供しません。

Java.lang.ClassCastException: java.util.ArrayList cannot be cast to java.lang.Float
  at com.ibm.watson.hector.plugins.ss.FCFeatureGeneratorComponent.toCSV(FCFeatureGeneratorComponent.java:677)
  at com.ibm.watson.hector.plugins.ss.FCFeatureGeneratorComponent.process(FCFeatureGeneratorComponent.java:364)
  at org.apache.solr.handler.component.SearchHandler.handleRequestBody(SearchHandler.java:272)
  at org.apache.solr.handler.RequestHandlerBase.handleRequest(RequestHandlerBase.java:155)
  at org.apache.solr.core.SolrCore.execute(SolrCore.java:2082)
  at org.apache.solr.servlet.HttpSolrCall.execute(HttpSolrCall.java:651)
  at org.apache.solr.servlet.HttpSolrCall.call(HttpSolrCall.java:458)
  at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:229)
  at org.apache.solr.servlet.SolrDispatchFilter.doFilter(SolrDispatchFilter.java:184)
  at org.eclipse.jetty.servlet.ServletHandler$CachedChain.doFilter(ServletHandler.java:1652)
  at org.eclipse.jetty.servlet.ServletHandler.doHandle(ServletHandler.java:585)
  at org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:143)
  at org.eclipse.jetty.security.SecurityHandler.handle(SecurityHandler.java:577)
  at org.eclipse.jetty.server.session.SessionHandler.doHandle(SessionHandler.java:223)
  at org.eclipse.jetty.server.handler.ContextHandler.doHandle(ContextHandler.java:1127)
  at org.eclipse.jetty.servlet.ServletHandler.doScope(ServletHandler.java:515)
  at org.eclipse.jetty.server.session.SessionHandler.doScope(SessionHandler.java:185)
  at org.eclipse.jetty.server.handler.ContextHandler.doScope(ContextHandler.java:1061)
  at org.eclipse.jetty.server.handler.ScopedHandler.handle(ScopedHandler.java:141)
  at org.eclipse.jetty.server.handler.ContextHandlerCollection.handle(ContextHandlerCollection.java:215)
  at org.eclipse.jetty.server.handler.HandlerCollection.handle(HandlerCollection.java:110)
  at org.eclipse.jetty.server.handler.HandlerWrapper.handle(HandlerWrapper.java:97)
  at org.eclipse.jetty.server.Server.handle(Server.java:499)
  at org.eclipse.jetty.server.HttpChannel.handle(HttpChannel.java:310)
  at org.eclipse.jetty.server.HttpConnection.onFillable(HttpConnection.java:257)
  at org.eclipse.jetty.io.AbstractConnection$2.run(AbstractConnection.java:540)
  at org.eclipse.jetty.util.thread.QueuedThreadPool.runJob(QueuedThreadPool.java:635)
  at org.eclipse.jetty.util.thread.QueuedThreadPool$3.run(QueuedThreadPool.java:555)
  at java.lang.Thread.run(Thread.java:745)\n","code":500}}

スキーマで定義された MultiValue フィールドとそのためのトレーニング データ セットの生成に問題があるようです。MultiValue フィールドを使用すると、複数の質問、特定のワークシート番号のテキストを任意のデータ型で保存できます。たとえば、question_number フィールドの値が [1,2,3,4,5] の Question Number の整数。

トレーニング データ セットの生成時に、Watson API がデータ型変換エラー「java.util.ArrayList を java.lang.Float にキャストできません」で例外をスローします。

4

1 に答える 1

1

この問題は、データに「スコア」と呼ばれる多値フィールドがあることが原因である可能性があります。これは、schema.xml で明示的に定義されたフィールドであるか、一部のドキュメントで有効な動的フィールドである可能性があります。これが当てはまるかどうかを確認していただけますか?その場合、スコアを返すために Solr によってハードコーディングされた名前と競合するため、別の名前 (たとえば、「my_score」) に変更する必要があります。

于 2016-06-17T15:29:29.777 に答える