私は現在、包括的なマルチディストリビューション/プロジェクト/ソース/OS オープン ソース ドキュメント Web サイトを構築しています。
現時点では、からコンテンツを取得するために変換プロセスが必要なため、無礼ではありませんが (man ページはロックです)、標準の man ページの不可解な形式で、15 GB のテキストがあり、増加しています。
マニュアルページのコンテンツを取得できる、より最新のソース形式が必要です。開発者は、ドキュメント用に 50 年前の *roff 形式のファイルをまだ作成していませんよね?
できるだけ多くのマニュアル ページ ソースを削除する必要があるので、これまでのリストをここに示します。これらのプロジェクトに貢献している開発者が、マニュアル ページが生で書かれたものなのか、ビルド プロセスの一部として別のテキスト形式から生成されたものなのかを明確にすることができれば、大きな助けになります。それではリストへ。
古い *roff ベースの doc ファイルをまだ使用していないことを願っています。
- FreeBSD
- NetBSD
- OpenBSD
- デビアン
- Ubuntu
- ジェンツー
- アーチ
- Slackware (実際には、slackware 'docs' のより良いソースを使用できます。docs.slackware.com は、他のディストリビューションと比較して「貧弱」です)
- SUSE
- レッドハット エンタープライズ リナックス
したがって、OS ベースの doc ファイル セットで愚かな groff -mandoc 'file' -T html エラーと格闘するのに多くの時間を費やしたプログラマーとして、私は助けが必要であり、SO に目を向けます。
オプション 1 は、doc コンテンツの代替として、はるかに解析しやすいソースです。
オプション 2 は、実行するよりも man ページのコンテンツを再フォーマットするためのより良い方法です
find . -type f -exec sh -c 'cd $(dirname "$0") && groff -mandoc "$0" -T html > "$0.html"' {} \;
また
find . -type f -exec sh -c 'cd $(dirname "$0") && man2html "$0" > "$0.html"' {} \;
数千のファイルで単一のエラーが発生しないことを願っています。これらすべては、Unicode の多言語サポートをほぼ放棄しています。
「人」や「ドキュメンテーション」という言葉を含む技術的なコンテンツを Google で検索するのがほとんど無駄な努力ではなかった場合、私は自分で解決策を見つけたかもしれませんが、私はここにいます。