0

タグ機能またはトリグラム機能の各行 (機能、重み) に含まれるファイルがある事前トレーニング済みモデルを使用して、トリグラム タグ デコードを構築しています。メイン プログラムからこれらの値にアクセスするには、2 つの辞書を作成する必要があります。メイン プログラムは、機能をループし、重みを検索して、ビタビ アルゴリズムの計算に使用します。以下のコードは実行されます (print ステートメントを挿入したなど) が、終了すると、IDLE が応答しないと表示され、コントロール C でブレークする必要があります。ファイルには Word で 613 ページがあり、合計 32K のデータ ペアがあります。プログラムが応答しないのはなぜですか? これを行うより効率的な方法はありますか?

def tag_tri_form():
    f_tag=open('tag.model','r')
    tag_dic={}
    trigram_dic={}
    for line in f_tag:
        lines=line.split()
        if 'TAG' in lines[0]:
            tag_dic[lines[0]]=lines[1]
        else:
            trigram_dic[lines[0]]=lines[1]
    return tag_dic,trigram_dic
4

1 に答える 1