Linux サーバーでホストされるnode.js Web アプリを作成しようとしています。アプリは、 Word ドキュメント内の表を読み取って解析する必要があります。
私は周りを見回して、Powershellがこれを簡単に達成できることを見ました. 問題は、Powershellが MS スクリプト言語であり、その Mac ポート ( pash ) が非常に不安定であり、次のような単純なことを実行したいときはいつでも停止することです。
$wd = New-Object -ComObject Word.Application
$wd.Visible = $true
$doc = $wd.Documents.Open($filename)
$doc.Tables | ForEach-Object {
$_.Cell($_.Rows.Count, $_.Columns.Count).Range.Text
}
私はDocsplitのような他のソリューションを調べましたが、それはあまりにも一般的です (つまり、単語 doc 全体をプレーンテキストに変換し、私の目的には十分な粒度ではありません)。
saaspose APIの使用を提案する人もいましたが、かなりの費用がかかります。これなら自分でもできると思います。
アイデア?