0

私は文のセットを持っています。それらのそれぞれについて、すべての単語が対応する POS タグに置き換えられた「一般化された」型付き依存関係グラフを取得したいと考えています (動詞とLOCATIONTARGETなどのいくつかのキーワードを除く)。

たとえば、文から

take a left turn till you come to a LOCATION 

入手したい

amod(take,JJ)dobj(take,NN)mark(come,IN)nsubj(come,PP)prep_to(come,LOCATION)

これを行うためのより簡単な方法は何ですか?

4

1 に答える 1

0

Ok。少しツリーを操作してこの問題を解決しました。

public static void exploreTree(Tree t) {
    List<Tree> child = t.getChildrenAsList();
    Tree terminal;
    for (Tree c : child) {
        if (c.isPreTerminal()) {
            terminal = c.getChild(0);
            String t_value = terminal.value();
            String c_value = c.value();
            if (!c_value.startsWith("VB")) {
                if (!t_value.equals("LOCATION") && !t_value.equals("TARGET")) {
                    terminal.setValue(c.value());
                }
            }
            // test[1].setValue(test[0].value());
        } else
            exploreTree(c);
    }
}

私の要求に従って、Stanford Parser ツリーの内部データを変更します。おそらく、最もエレガントで堅牢なソリューションではありませんが、機能します。

于 2012-09-02T09:32:12.860 に答える