現在、さまざまなアルゴリズムを使用して生成された分類モデルを比較する必要があるプロジェクトに取り組んでいます。R で C5.0 パッケージを使用して生成されたルール/ツリーのテキスト バージョンを保存するにはどうすればよいか考えています。
現在、次のようにモデルのセットアップとトレーニングを行うことができます。
c50model = C5.0(x=X, y=Y, rules=TRUE)
次に、次のように呼び出して完全なバージョンを取得できます。
summary(c50model)
このコマンドは、コマンド ウィンドウにモデルの適切な出力を生成しますが、書式設定されたテキスト ファイルに保存する方法はわかりません。
また、C50 パッケージでは、文字バージョンのルール ファイルがc50model$tree
に、文字列バージョンのツリー ファイルが に生成されることもわかっていますc50model$tree
。理想的には、これらのファイルの内容をテキスト ファイルに出力して、後で研究論文に簡単に組み込むことができるようにしたいと考えています。ただし、残念ながら、これらのフィールドの出力は常に、次のような奇妙な形式になります。
"id=\"See5/C5.0 2.07 GPL Edition 2013-03-13\"\nentries=\"1\"\nrules=\"6\" default=\"0\"\nconds=\"2\" cover=\"322\" ok=\"321\" lift=\"1.55321\" class=\"0\"\ntype=\"2\" att=\"UniformityOfCellSize\" cut=\"3\" result=\"<\"\ntype=\"2\" att=\"BareNuclei\" cut=\"2\" result=\"<\"\nconds=\"2\" cover=\"305\" ok=\"304\" lift=\"1.55268\" class=\"0\"\ntype=\"2\" att=\"UniformityOfCellShape\" cut=\"2\" result=\"<\"\ntype=\"2\" att=\"BareNuclei\" cut=\"3\" result=\"<\"\nconds=\"2\" cover=\"310\" ok=\"307\" lift=\"1.54282\" class=\"0\"\ntype=\"2\" att=\"UniformityOfCellShape\" cut=\"2\" result=\"<\"\ntype=\"2\" att=\"NormalNucleoli\" cut=\"2\" result=\"<\"\nconds=\"2\" cover=\"137\" ok=\"132\" lift=\"2.65679\" class=\"1\"\ntype=\"2\" att=\"BareNuclei\" cut=\"3\" result=\">\"\ntype=\"2\" att=\"NormalNucleoli\" cut=\"2\" result=\">\"\nconds=\"2\" cover=\"179\" ok=\"170\" lift=\"2.62324\" class=\"1\"\ntype=\"2\" att=\"UniformityOfCellShape\" cut=\"2\" result=\">\"\ntype=\"2\" att=\"BareNuclei\" cut=\"2\" result=\">\"\nconds=\"2\" cover=\"175\" ok=\"166\" lift=\"2.61978\" class=\"1\"\ntype=\"2\" att=\"UniformityOfCellSize\" cut=\"3\" result=\">\"\ntype=\"2\" att=\"UniformityOfCellShape\" cut=\"2\" result=\">\"\n"
アドバイスはいつでも大歓迎です。