1

私の次の大きな課題は、Windowsサーチ機能を自動化するためのスクリプト(私がほとんど経験のない領域であるAutoITにあると思います)を書くことです。

最終的な目標は、.txtファイル(1行に1つの文字列)から検索語のリストを取得し、コンピューター上のすべてのドキュメントのコンテンツでその検索語を(一度に1つずつ)検索することです。

これを手動で行うことができます-コンテンツによる検索機能をオンにし、接続されているすべてのドライブ上のすべてのファイルにインデックスを付け、用語を1つずつ検索し、すべてを強調表示>Shiftキーを押しながらクリック>パスとしてコピー>メモ帳に貼り付けて名前を付けて保存[searchterm].txt。

ただし、そのプロセス全体を自動化する必要があります。使用するWindowsのバージョン(XP、Vista、7、8)ごとに個別のスクリプトを作成する必要があるかもしれないことを理解しています。

これは達成するのに十分簡単なタスクですか、それともプログラミングに多くの時間がかかりますか?誰かが私を正しい方向に向けることができますか?すべての助けに感謝します。

4

1 に答える 1

0

クエリのテキスト ファイルが十分に大きく、それぞれに対してファイル システム全体を実際に反復処理したくないと仮定すると、従来の情報検索の問題を説明していることになります。

  1. ファイル システムからのデータにインデックスを付けます (これは、1 回だけ実行される前処理です)
  2. クエリごとに - インデックスで検索し、関連するドキュメントを取得します。

情報検索の分野は膨大な研究分野であり、ゼロから実装することはお勧めしません。

すでに開発およびテストされている組み込みライブラリを使用することをお勧めします。たとえば、Java では一般的な選択肢はluceneです。これは、どこでも検索するために非常に広く使用されています。

Java に慣れていない場合は、このライブラリの python ( pylucene ) および .NET ( lucene.NET ) バインディングについても認識しています。


Information Retrieval の詳細については、Manning のIntroduction to Information Retrieval をお勧めします。

于 2012-12-19T15:10:30.773 に答える