私はアラビア語でセンチメントを分析することを探しています。それを行うために、Facebook からステータスを収集し、それらをポジティブとネガティブに分類します。私のコーパスが絵文字「 :( and :) 」を肯定的および否定的な感情と見なすこと、それを私のコーパスに追加する方法。
これは私が使用したモデルであり、スマイリーを肯定的および否定的な感情として扱うために組み込む必要がある演算子
私はアラビア語でセンチメントを分析することを探しています。それを行うために、Facebook からステータスを収集し、それらをポジティブとネガティブに分類します。私のコーパスが絵文字「 :( and :) 」を肯定的および否定的な感情と見なすこと、それを私のコーパスに追加する方法。
これは私が使用したモデルであり、スマイリーを肯定的および否定的な感情として扱うために組み込む必要がある演算子
トークン化は通常、句読点を削除します。これを回避するために独自のトークナイザーを実装していますか?おそらくカスタムTokenMarker?