3列のファイルがあります。
ArabicWord POS EnglishTranslation
これはアラビア語、そのPOStag、およびそのアラビア語の英語訳です。したがって、1つのアラビア語の単語は、POSタグが異なれば翻訳も異なる可能性があります。次に、このファイルをPythonのハッシュに保存します。しかし、私の問題は、各列のエンティティが複数回発生する可能性があることです(誰も一意ではありません)。このファイルを保存する1つの方法は、最初と2番目の列を連結して一意のエンティティを作成することです(特定のタグによる各アラビア語の単語は1つの翻訳のみが許可されます)が、プロセスをさらに進めるにはハッシュが必要なため、この方法ではプロセスが遅くなります。他に方法はありますか?
更新: 最初のアプローチは、ファイルを保存するために正常に機能します。しかし、今の私の問題は、これらのタプルをどのように使用するかです。dict [0]、dict [1]だけでアラビア語とそのposタグにアクセスできますが、英語の翻訳にアクセスするにはどうすればよいですか?