SharePoint に変換する必要がある HTML ヘルプ システムがあります。最も時間のかかる 2 つのプロジェクトは、ドキュメント リンクの変更とメタデータの収集です。しかし、このデータは簡単にアクセスできるので幸運です。各ファイルは HTML ドキュメントであり、以下のように単純化されています。
<body>
<!--- Metadata follows
Procedure Name: my document
Procedure Number: xxxxx
Use: freeform text explaining when procdure is used
Revision Date: xx/xx/xx
By: responsible party for revision
<!--- end metadata
<h1>Procedure Name<\h1>
<p>procedure background and narrative, with links, as needed, to other documents at \\documentation-server\path\document-name.html
<\body>
適切な文字列を正常に抽出して操作できます。そのプロセスを自動化されたソリューションに取り入れようとしています。ただし、これはファイル I/O への最初の冒険であるため、次に何をすべきかについて少し混乱しています。
完璧な世界では、パスが与えられたら、パス内の各 *.html ファイルをステップ実行したいと思います。それを行うためのクラス/メソッドが見つからないようです。newInputStream
ファイルへのアクセスを許可しnewOutpuStream
ますが、パスとファイルのパラメーターを指定する必要があります。このFileVisitor
インターフェイスは、ファイル属性と対話し、削除/コピー/名前変更タイプの機能を実行するだけのようです。
これらをパス内の各ファイルをステップ実行し、それを開いて行ごとの解析を許可し、ファイルを閉じて次のファイルに移動して繰り返す単一の関数に結合するようなものはありますか?
私の他の考えは、ファイル名の配列を作成し、その配列を のファイル名パラメーターにフィードすることでしnewInputStream
た。
提案?