1

私はtrigramsJavaに入るのに少し問題があります。私のプログラムは現在bigramsうまくいきますが、メソッドの同じ構造を実装して変更しようとするとtrigrams、うまくいかないようです。trigrams内の単語の可能なすべての組み合わせを取得したいarraylist、例えば

Original = [eye, test, find, free, nhs]
Trigram = [eye test find, 2, eye test free, 3, eye test nhs, 4, eye find free, 3, eye find nhs, 4, eye free nhs, 5, etc...]

数字は最初の単語と最後の単語の間の距離を決定し、 の 3 の単語のすべての組み合わせを取得する必要がありますarraylist。これは現在、次の場合に正常に機能しbigramsます...

Original = [eye, test, find, free, nhs]
Bigram = [eye test, 1, eye find, 2, eye free, 3, eye nhs, 4, test find, 1, test free, 2, test nhs, 3, find free, 1, etc..]

ここに方法があります

public ArrayList<String> bagOfWords;
public ArrayList<String> bigramList = new ArrayList<String>();
public ArrayList<String> trigramList = new ArrayList<String>();


public void trigram() throws FileNotFoundException{
    PrintWriter tg = new PrintWriter(new File(trigramFile));
    // CREATES THE TRIGRAM
    for (int i = 0; i < bagOfWords.size() - 1; i++) {
        for (int j = 1; j < bagOfWords.size() - 1; j++) {
            for(int k = j + 1; k < bagOfWords.size(); k++){
                int distance = (k - i);
                if (distance < 4){
                    trigramList.add(bagOfWords.get(i) + " " + bagOfWords.get(j) + " " + bagOfWords.get(k) + ", " + distance);
                }
            }
        }
    }


public void bigram() throws FileNotFoundException{
    // CREATES THE BIGRAM
    PrintWriter bg = new PrintWriter(new File(bigramFile));
    for (int i = 0; i < bagOfWords.size() - 1; i++) {
        for (int j = i + 1; j < bagOfWords.size(); j++) {
            int distance = (j - i);
            if (distance < 4){
                bigramList.add(bagOfWords.get(i) + " " + bagOfWords.get(j) + ", " + distance);
            }
        }
    }

trigram()メソッドを変更して、必要なものに適したものを作成するのを手伝ってくれる人はいtrigramますか? 助けてくれてありがとう。

4

2 に答える 2

2

jから始めたいi+1ですね。iまた、あなたは遠くまで数えさせていると思います。で停止する必要がありbagOfWords.size() - 2ます。をチェックする理由がわかりませんdistance < 4。これにより、有効なグループが除外されます。

public void trigram() throws FileNotFoundException{
PrintWriter tg = new PrintWriter(new File(trigramFile));
// CREATES THE TRIGRAM
for (int i = 0; i < bagOfWords.size() - 2; i++) {
    for (int j = i + 1; j < bagOfWords.size() - 1; j++) {
        for(int k = j + 1; k < bagOfWords.size(); k++){
            int distance = (k - i);
            trigramList.add(bagOfWords.get(i) + " " + bagOfWords.get(j) + " " + bagOfWords.get(k) + ", " + distance);
        }
    }
}
于 2016-02-25T14:36:06.827 に答える
2

@bradimusの答えはまさに正しいです。別のアプローチを示すだけです。あなたの方法が非常に似ていることに気づきましたか?では、それを 1 つのユニバーサル メソッドにマージしてみませんか? 次のようなもの:

public List<String> anygram(List<String> bagOfWords, int gramCount){

     List<String> result = new ArrayList<String>();

     for(int i=0;i<=bagOfWords.size()-gramCount; i++){
         for(int j=i; j+gramCount<=bagOfWords.size(); j++){
            StringBuilder builder = new StringBuilder();
            builder.append(bagOfWords.get(i));
            int k = j+1;
            for(; k<j+gramCount; k++){
                builder.append(" ");
                builder.append(bagOfWords.get(k));
            }
            builder.append(", ").append(k-i-1);
            result.add(builder.toString());
        }
    }

    return result;
}

私の答えは評価ではありません。私はこのタスクに興味を持ち、このソリューションにたどり着きました。

于 2016-02-25T15:59:38.940 に答える