私は、時系列データのパターン マッチング、分析、予測のためのさまざまなアプローチを試してきました。
私はデータマイニングや関連分野での専門的な経験がないため、ゼロから独自の方法を考え出しました。
散発的にデータ マイニングの記事 (私が理解できたものはわずか) に目を通した数か月後、自分の方法が非常に基本的なものであることに気付きました。
たとえば、私がパターン マッチングを実装した方法は、多次元の k-Nearest Neighbor アプローチによるものです。
決定木、主成分分析、共分散行列など、利用すべき一般的な手法があることを理解し始めたところです。
私は、GUI データ マイニング ツールである RapidMiner を試してきました。RapidMiner を使用すると、高度な技術のさまざまな実装をドラッグ アンド ドロップして、コードを 1 行も書かずにそれらを接続できます。それは私にとって素晴らしい学習ツールでした。次のようになります。
RapidMiner には API がありますが、残念ながらそれは Java であり、現在のコードはすべて Free Pascal と MySQL にあります。
RapidMiner をアプリケーションに統合する方法を探しているので、RapidMiner GUI を介してさまざまなデータ処理方法を試し、現在のコードでそれらをシームレスに使用できます。
それが不可能な場合は、現在の Free Pascal コードに簡単に統合できる限り、別のデータ マイニング パッケージで解決します。
私は R を調べました - それはほぼ正しいようですが、Free Pascal との統合も容易ではないようです。
わかりやすくするために、私のデータ セットはかなり大きく (500,000 行以上)、計算はリアルタイムで行う必要があります。ソフトウェアは Windows 7 で動作します。