これは、このタイプのツリーを解析するライブラリpymeta2に基づくPythonコードです。
import pymeta.grammar
def f(name,E):
print name+' -> '+' '.join(E)
return name
G=pymeta.grammar.OMeta.makeGrammar("""
name = spaces ('.'|letterOrDigit|'-')+:n -> ''.join(n)
expr = token("(") name:p expr+:e token(")") -> f(p,e)
| token("(") name:p name:e token(")") -> p
""",{'f':f})
s="(ROOT (S (NP (ADJP (JJ Bahasa)) (NN daerah) (NN merupakan) (NN bahasa) (NN yang) (NN digunakan) (NN dalam) (NN bahasa) (NN pergaulan) (NN sehari-hari) (NN di) (NN suatu) (NN daerah) (NNP tertentu)) (VP (VBZ .))))"
G(s).apply("expr")
このコードを実行した場合の出力は次のとおりです。
ADJP -> JJ
NP -> ADJP NN NN NN NN NN NN NN NN NN NN NN NN NNP
VP -> VBZ
S -> NP VP
ROOT -> S
(この作業を行うには、(JJ Bahasa)の後にブラケットを1つ追加する必要がありました。これは、質問のタイプミスだと思いますか?)