.doc ファイルを読み取ってキャッシュ データベースに渡すことができるプログラムを作成しました。通過部分は完了しましたが、問題は、段落と表の内容をどのように区別できるかということです。
たとえば、タイトルとしてセクション Aがあり、セクション内にテーブルがあります。
現在、テーブルのコンテンツを取得し、それを配列としてキャッシュ データベースに送信しています。(例: 配列(1,2))
セクション Aという要素を配列に含めたいと考えています。
次のようになります。
array(1)="Section A"
array(2,1,1)="Name: "
array(2,1,2)="Terry"
array(2,2,1)="Age: "
array(3)="Section B"
各要素に ID を設定するのが好きです。