私の MT システムでは、https: //huggingface.co/metrics/rouge を使用して ROUGE-L 値を計算しました。出力は以下のようになります。ほとんどの論文が 1 つの ROUGE-L 値を報告しており、私も同じことをしたいと考えています。ただし、出力は次のようになり、どの値を報告すればよいかわかりません。低または中または高を報告する必要がありますか? 歳差運動か、リコールか、F 値か。
'rougeL': AggregateScore(low=Score(precision=0.34535176087958586, recall=0.36969750745470553, fmeasure=0.33939664257593155), mid=Score(precision=0.40405631462907, recall=0.41156890941875457, fmeasure=0.3835437703820411), high=Score(precision=0.4648738881460244, recall= 0.4597817743860313、fmeasure = 0.43226391587929297)))