0

HTMLMS Word で開く必要があるドキュメントがあります。2〜3ページごとに特定のフォント/色のヘッダーテキストがあります(13.5ptとカラーコードは#ff11ffとしましょう)&ヘッダーテキストが存在するページ番号を見つけたいです。

HTMLMS Word 環境で特定のテキストの存在を検出する際に便利なタグは何ですか? 私の知る限り、find メソッドを使用してテキストを検出できますが、特定の「FONT/Font Color」を検索する方法があるかどうかはわかりません。

ヘッダーの名前と、それらが見つかったページ番号を持つインデックス ページを作成するには、これが必要です。したがって、次のようになります。

  1. 特定のフォント サイズのテキストを検索します。
  2. そのページの現在のページ番号を取得します。

更新:ドキュメントのすべてのテキストを繰り返し処理し、フォントを確認してから、次のようなことをしなければならないようです

Microsoft.Office.Interop.Word._Application word = new Microsoft.Office.Interop.Word.Application();
                Microsoft.Office.Interop.Word._Document document;

                while (word.Selection.Find.Execute(ref findStr, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull, ref objNull))
                {

                    float fontSize = word.Selection.Font.Size;

                    if (fontSize == 13.5)
                    {
                        Range rng = word.Selection.Range;
                        int pageNp = (int)rng.get_Information(WdInformation.wdActiveEndPageNumber);
                    }
                }
4

1 に答える 1

1

いくつかの異なるアプローチを取ることができます。Microsoft Word を無視するかのように。jQuery は、特定の Html または Stylesheet タグを簡単に特定できます。

これら 2 つの要求を識別する単純な C# アプリケーションを作成しようとしている場合。正規表現を利用できます。これらは非常に強力で、大量のデータをフィルタリングおよび解析するように特別に設計されています。

あなたの質問には情報が不足しているため、これ以上指摘することはできませんが、お役に立てば幸いです。ここで正規表現に関する追加情報を見つけることができます。

私が取るアプローチ:

  • 単語を使用する必要がある場合。メソッドを使用してドキュメントを解析します。
  • 正規表現メソッドを使用して、特定のタグを検索します。
  • 次に、条件が見つかった現在のページを返すメソッドを定義するだけです。

明らかに、それは非常に一般的なアプローチです。しかし、うまくいけば、それはあなたを良い方向に向けます. 私はあなたの仕事や目標に精通していません。これは頭​​の釘に当たるかどうかです。

あいまいで申し訳ありませんが、あなたのプロジェクトを知らないため、回答が難しくなります。よろしければお聞きします。現在の反復またはアプローチで質問を更新できますか? コードを分析して、あなたが望む目標を達成できるでしょうか?

于 2013-01-16T18:47:34.237 に答える