私はシーケンシャル ラーニング (および機械学習) が初めてで、条件付きランダム フィールドを使用して問題を解決する方法を理解しようとしています。
アプリケーションのエンド ユーザーがいつ、どこで作業したかの連続ログであるデータセットがあります。たとえば、次のデータセットには User1 の値のみが含まれます。
User Facility Weekday
User1 FacilityA Monday
User1 FacilityB Tuesday
User1 FacilityC Wednesday
... ... ...
私は次の問題を解決しようとしています: ユーザーが勤務した曜日と施設が与えられた場合、次にどの施設と平日に勤務しますか?
この問題を解決するために、Conditional Random Fields を調べ始めましたが、どのライブラリでもそれを使用するには苦労しています..
次のライブラリで作業しようとしました: 1. PyStruct ( https://pystruct.github.io/ ) しかし、これはこの問題のために機能しませんでした: 範囲外のインデックス: Pystruct を使用した SSVM のフィッティング
- CRFSuite ( http://www.chokkan.org/software/crfsuite/ ) (これは libBFGS に依存しています。エラーなしで ubuntu ボックスに libbfgs をインストールすると、CRFSuite の「make install」を実行しても失敗し、 libBFGS を認識できません)
だから私は別のライブラリに目を向けました.. 3. CRF++ ( https://taku910.github.io/crfpp/ )
私は CRF++ をインストールすることができました & また、彼らのディストリビューションで与えられた例を実行することもできます. しかし、ユースケースに合わせてテンプレート ファイルを変更する方法を理解するための助けが必要です...
また、ラベルは上記のデータセットからの施設 + 平日の連結文字列になると考えていました。
私はシーケンス学習が初めてで、現在、この問題を解決する方法を一生懸命研究しています...
私はここで少し立ち往生しているように見えるので、どんなアドバイスも非常に役に立ちます..
ありがとう!