1

誰かが私を助けてくれることを願っています: まず第一に、私はまだ Java の初心者ですが、ゆっくりと改善していると思います。

そのため、言語注釈を含む XML ファイルがあり、特定のノードにアクセスして、a) パターン マッチング操作を実行し、b) 一致に対してさらに操作を実行したいと考えています。

これは、ノードを示すテキストのサンプルです。

  <token id="13">
        <word>.</word>
        <lemma>.</lemma>
        <CharacterOffsetBegin>57</CharacterOffsetBegin>
        <CharacterOffsetEnd>58</CharacterOffsetEnd>
        <POS>.</POS>
        <NER>O</NER>
      </token>
    </tokens>
    <parse>(ROOT (S (NP (DT The) (NN world)) (VP (VBZ owes) (NP (DT all)) (NP (NP (NP (PRP$ its) (ADJP (RB onward) (NP (NNS impulses)) (PP (TO to))) (NNS men)) (ADJP (RB ill))) (PP (IN at) (NP (NN ease))))) (. .))) </parse>
    <basic-dependencies>
      <dep type="det">
        <governor idx="2">world</governor>
        <dependent idx="1">The</dependent>
      </dep>
      <dep type="nsubj">
        <governor idx="3">owes</governor>
        <dependent idx="2">world</dependent>
      </dep>
      <dep type="iobj">
        <governor idx="3">owes</governor>
        <dependent idx="4">all</dependent>
      </dep>
      <dep type="poss">
        <governor idx="9">men</governor>
        <dependent idx="5">its</dependent>
      </dep>

(したがって、ここでは、いくつかのトークン、品詞 (POS)、名前付きエンティティ認識 (NER)、および構文/依存関係の解析など、テキストの言語注釈がいくつかあります。これは実際には、スタンフォード CoreNLP ツールキットの出力です。テキストに適用されます..巨大なのでファイル全体を追加しませんでした)

私の質問は次のとおりです。私が読んだことによると、StaX パーサーは、ファイルにアクセスして、私の操作で新しいファイルを作成するのに適しているようです。これは正しいですか?私の質問には、StaX でパターン マッチ操作を実行できますか?

事前に千の感謝。

4

1 に答える 1