1

キーワードが出現する Word 文書のページを特定する必要があります。ドキュメントのテキストを取得できるツールがいくつかありますが、テキストがどのページにあるかを知るツールはありません。誰かが私にとって良い出発点を持っていますか? 私は.NETを使用しています

ありがとう!

編集: 追加の制約: 相互運用機能は使用できません。

edit2:これを行うことができる安定したライブラリを知っている人がいれば、それも役に立ちます。私は Aspose を使用していますが、私が知る限り、それには何もありません。

4

4 に答える 4

2

これがテキストを取り出す方法です。選択範囲をページに設定してから、そのテキストをテストできます。必要なものから少し後退している可能性がありますが、開始する場所になる可能性があります。

Microsoft.Office.Interop.Word.Application wordApplication = new Microsoft.Office.Interop.Word.Application();
object missing = Type.Missing;
object fileName = @"c:\file.doc";
object objFalse = false;

wordApplication.DisplayAlerts = Microsoft.Office.Interop.Word.WdAlertLevel.wdAlertsNone;
Microsoft.Office.Interop.Word.Document doc = wordApplication.Documents.Open(ref fileName, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing, ref missing,ref objFalse, ref missing, ref missing, ref missing, ref missing);

//I belevie you can define a SelectionRange and insert here
doc.ActiveWindow.Selection.WholeStory();
doc.ActiveWindow.Selection.Copy();

IDataObject data = Clipboard.GetDataObject();
string text = data.GetData(DataFormats.Text).ToString();

doc.Close(ref missing, ref missing, ref missing);
doc = null;

wordApplication.Quit(ref missing, ref missing, ref missing);
wordApplication = null;
于 2008-11-14T15:10:34.417 に答える
0

Aspose.Wordsをご利用いただきありがとうございます。

パブリックAPIには、現在、段落、表、リストなどの「フロードキュメント」情報のみがあります。内部的には、ページ、テキストブロック、テキスト行などのクラスを持つページレイアウトモデルを構築します。もちろん、ドキュメントモデルとレイアウトモデルの間には内部リンクがあり、どのページがどこで終わり、すべてのものを見つけることができます。この情報をパブリックAPIを介して利用できるようにすることは、(まあ、まだ)優先順位リストの上位にあります。

Aspose.Wordsサポートフォーラムにリクエストを記録しましたか?この情報を使用して投票システムを維持し、最初により多くの票を獲得する機能に取り組みます。

于 2009-11-15T11:14:54.660 に答える
0

Asposeでこれを行うための厄介な方法の1つは、WordファイルをPDFに変換してから、各ページのテキストを取得することです。

Asposeの内部や、変換時にソフトページをどのように定義するかについては何も知りませんが、これは私がこれまでに得た中で最高です。

于 2008-11-14T17:55:36.923 に答える
0

どのようにページを定義していますか?

セクション/ハード改ページのみをカウントする場合、複雑ですが実行可能です。ソフト改ページをカウントしたい場合、タスクは非常に難しくなり、意味がなくなります。ソフト ページ ブレークの場所の決定は、実行時に動的に生成され、ファイル自体には格納されないことを考慮してください。これは、アクティブなプリンター ドライバー (別のコンピューター上の同じファイルに対して変更される可能性があります)、フォント、カーニング、行間、余白などを含む膨大な数の要因に依存します。

于 2008-11-14T16:03:23.497 に答える