ファイル パス名を分析するためのツール、方法、手法に関する情報を探しています。私が話しているのは、ファイル サイズ、読み取り/書き込み時間、またはファイル タイプではなく、パスまたは URL 自体の分析です。
私は基本的な単語頻度のテキスト ツールまたは方法しか認識していませんが、人々がこれを使用/適用してそれらから追加情報を抽出しようとする、より高度なものがあるかどうか疑問に思っています。
ありがとう!
アップデート:
これは、私が望むものの最も狭い例です。OK、次のような文字列としてフルパス名がいくつかあります。
F:\Task_Order_Projects\TO_01_NYS\Models\MapShedMaps\Random_File1.doc
F:\Task_Order_Projects\TO_01_NYS\Models\MapShedMaps\Random_File2.doc
F:\Task_Order_Projects\TO_01_NYS\Models\MapShedMaps\Random_File3.doc
F:\Task_Order_Projects\TO_01_NYS\Models\MapShedMaps\Random_File4.doc
F:\Task_Order_Projects\TO_01_NYS\Models\MapShedMaps\Random_File5.doc
F:\Task_Order_Projects\TO_02_NYS\Models\MapShedMaps\Random_File1.doc
F:\Task_Order_Projects\TO_02_NYS\Models\MapShedMaps\Random_File2.doc
F:\Task_Order_Projects\TO_02_NYS\Models\MapShedMaps\Random_File3.doc
F:\Task_Order_Projects\TO_02_NYS\Models\MapShedMaps\Random_File4.doc
F:\Task_Order_Projects\TO_02_NYS\Models\MapShedMaps\Random_File5.doc
私が知りたいのは、フォルダー MapShedMaps が「一意に」2回表示されることです。もし私が弦に頻度をかけると、10回の出現が得られます. 問題は、これが重要なディレクトリのどのレベルかわからないことです。そのため、説明に基づいて、ディレクトリの各レベルで一意のカウントが必要です。