6

diff形式は、テキスト間の違いを表すための事実上の標準であり、プログラマーがソースコードの変更を配布するために広く使用されています。ほとんどのバージョン管理システムは差分を出力できます。差分は、変更を説明するのに非常に強力であるため、テキスト(ソースコードなど)に対する提案された変更について説明するために使用されます。

ただし、テキストを変更せずに単純にコメントしたい場合が多く、変更の場合と同じくらい強力な方法でテキストへの注釈を表すことができるデータ形式が必要です。典型的なユースケースは、コードにコメントしたいが(まだ)変更を提案したくないコードレビューです。別のユースケースは、私自身の考えやリマインダーで記事に注釈を付けることです。Wordでは、テキストにマークを付け、テキストの横にコメントバルーンを作成することで、テキストに注釈を付けることができます。しかし、Wordは他の点で面倒です。注釈だけを別のファイルに入れて、元のファイルをそのままにしておきたいのです。

変更の差分と同じくらい正確な方法でテキストへの注釈を表すことができるデータ形式は何ですか?

「XML」のような一般的な答えは探していません。テキストへの注釈を明示的に表す形式を探しています。(おそらく、Wordなどの特定のプログラムのアプリケーション固有の形式を除いて、そのような形式は存在しません。)

4

1 に答える 1

4

すばらしい質問です。

ほとんどの人は、XMLまたはHTMLのようなサブセットを議論に投げ込みます。マークアップ言語は、元のテキストに格納されている(data-)属性を使用します。しかし、それはあなたが探しているものではありません。XML/HTMLとRDFおよびマイクロフォーマットを除外しています。

一般に

元のテキストを保持し、それを複製してから、カスタムマークアップ言語を介して注釈を追加する必要があります。これにより、元のテキストと注釈付きテキストのテキストの違いが可能になります。重要なのは、元のテキストの個別の保存と、テキストへの注釈の改訂です。

これにより、複数の差分が可能になります。

  • 「元のテキスト」と「注釈付きテキストリビジョン1..n」の相違
  • 「注釈付きテキストrevn」と「注釈付きテキストrevn+1」の差分。

これは非常に強力です。

どのようなデータ形式が存在しますか?

スタンドオフ表現では、ドキュメントのテキストは注釈とは別に保持されます。注釈は、文字オフセットを介して特定のテキストスパンに接続されます。注釈は、ベース名(接尾辞のないファイル名)が同じであるというファイル命名規則によってテキストに関連付けられます。たとえば、ファイルPMID-1000.a1には、ファイルPMID-1000.txtの注釈が含まれています。

ご覧のとおり、これは「ファイル名ベースの注釈の関連付け」です。学術研究と改善の余地がたくさんあります、)

于 2014-10-05T16:05:48.317 に答える