0

Stanford tagger を使用して、複数形を単数形 (例: 女の子から女の子) に置き換えようとしています。

private static final String vbnTag = "VBN";
private static final String vbdTag = "VBD";
private static final String jjTag = "JJ";
private static final String edSuff = "ed";
private static final String enSuff = "en";
private static final String oneSt = "1";
private static final String naWord = "NA";

private static final Pattern stopper = Pattern.compile("(?i:and|or|but|,|;|-|--)");
private static final Pattern vbnWord = Pattern.compile("(?i:have|has|having|had|is|am|are|was|were|be|being|been|'ve|'s|s|'d|'re|'m|gotten|got|gets|get|getting)"); // cf. list in EnglishPTBTreebankCorrector

私は正しくやっていますか?

4

1 に答える 1

0

スタンフォード コア NLP で提供されている見出し語化アノテーションの助けを借りてそれを行うことができると思います。

于 2013-08-14T18:33:12.290 に答える