3

Word文書にある弾丸の情報を抽出したい。私はこのようなものが欲しいです:以下のテキストが単語文書にあると仮定します:

車を始動する手順:

  • ドアを開ける
  • 中に座る
  • ドアを閉める
  • 挿入キー

次に、次のようなテキストファイルが必要です。

車を始動する手順:

<BULET>ドアを開ける</BULET>

<BULET>中に座る</BULET>

<BULET>ドアを閉める</BULET>

<BULET>挿入キー</BULET>

<BULET>など</BULET>

これを行うためにC#言語を使用しています。

単語ドキュメントから段落を抽出し、テキストが太字か斜体かなどの書式設定情報を使用してテキストファイルに直接書き込むことができますが、この箇条書き情報を抽出する方法がわかりません。

誰かがこれを行う方法を教えてもらえますか?

前もって感謝します

4

3 に答える 3

1

一文一文を読むことでできます。doc.Sentencesは Range オブジェクトの配列です。したがって、Paragraph から同じ Range オブジェクトを取得できます。

        foreach (Paragraph para in oDoc.Paragraphs)
        {
            string paraNumber = para.Range.ListFormat.ListLevelNumber.ToString();
            string bulletStr = para.Range.ListFormat.ListString;
            MessageBox.Show(paraNumber + "\t" + bulletStr + "\t" + para.Range.Text);
        }

paraNumber では段落レベルを取得でき、buttetStr では箇条書きを文字列として取得できます。

于 2012-01-22T02:44:39.670 に答える
-4

答えが出ました……。

最初に、段落単位でドキュメントを変換していました。しかし、その代わりに、doc ファイルの文を文ごとに処理すると、その文に黒丸や何らかの形が含まれているかどうか、またはその文が表の一部であるかどうかを判断できます。したがって、この情報を取得したら、その文を適切に変換できます。誰かがソース コードを必要とする場合は、共有できます。

于 2010-02-25T12:45:05.037 に答える