0

Python3 を使用して、言語コーパスからいくつかの統計を計算しています。これまでは、結果を csv ファイルにエクスポートするか、シェルに直接エクスポートしていました。数日前、データを html テーブルに出力する方法を学び始めました。私はそれが本当に好きだと言わなければなりません.それはセルとユニコードの完璧な高さ/幅を扱い、異なる値に色を適用することができます. 大きなデータやテーブルを扱う場合は問題があると思いますが。

とにかく、私の質問は、この方向に進み、結果を html に出力する必要があるかどうかわからないということです。この分野の経験を持つ誰かが、html を出力として使用することの長所と短所を教えてくれますか?

4

2 に答える 2

3

両方やってみませんか?データを CSV として利用できるようにし (スクリプトなどへの単純なエクスポート用)、装飾された HTML バージョンを提供します。

ある段階で、(たとえば) 適切な Excel シート、PDF などが必要になる場合があります。そのため、レンダリングからデータ生成を分離することを強制します。ジェネレーターが抽象レンダラーによって消費できる構造を返すようにします。具体的な実装は、CSV、PDF、HTML などを提示します。

于 2012-11-13T10:05:47.020 に答える
1

質問には、HTML 形式の利点がいくつか挙げられています。出力形式の1つとして使用するには、これらだけで十分です。このように使用すると、必要に応じて他の形式を使用できるため、HTML 形式で簡単に実行できないことはあまり問題になりません。

利点には、合理的なデフォルト レンダリングが含まれます。これは、CSS を使用してさまざまな方法で微調整でき、場合によっては代替スタイル シート (IE でもサポートされるようになりました) を使用できます。リンクを含めることもできます。

スクリプトを作成しないと HTML で実行できないのは、計算、並べ替え、並べ替えなどです。しかし、それらは JavaScript で追加できます。簡単ではありませんが、実行可能です。

大きなテーブルには技術的な問題があります。デフォルトでは、ブラウザーはテーブル全体を取得、解析、および処理した後にのみ、テーブル内のコンテンツを表示し始めます。これにより、数秒の遅延が発生する場合があります。これに対処する方法はtable-layout: fixed、テーブルの列に特定の幅を設定して固定レイアウト ( ) を使用することです (物理単位で固定する必要はありません。優れたem単位は問題なく機能し、最新のブラウザーでも使用chできます)。

もう1つの問題は、改行が悪いことです。これは CSS (または HTML) で簡単に修正できますが、作成者はしばしば問題を見落とし、「10 m」のようなセル コンテンツが 2 行に分割されるなどの原因となります。

HTML での統計データの書式設定に関するその他の一般的な問題には、次のようなものがあります。

  • 数値フィールドを右揃えにしない。
  • セリフフォント使用。
  • すべての桁が同じ幅ではないフォントを使用する。
  • 目立たないハイフン「-」を使用して、適切な Unicode マイナス「-」を挿入しました (U+2212, −)。
  • 合理的な方法で欠損値を示さず、一部のセルを空のままにします。(ブラウザーは、空のセルを奇妙な方法で処理する場合があります。)
  • 水平方向のパディングが不十分で、セルの内容が (ほぼ) セルの境界線またはセルの背景の端にヒットします。

このような問題には、適切でかなり簡単な解決策があります。これは HTML を出力形式として使用する場合に注意すべきことであり、それに対する反論ではありません。

于 2012-11-13T11:00:38.517 に答える