いいえ、引用または転送されたテキストを新しいコンテンツから分離する単純で直接的なアルゴリズムはありません。引用と転送は標準化が不十分であり、さまざまな慣習がさまざまな時期に存在しています。
そうは言っても、たとえば Google の Gmail は実際にはかなりうまくいっています。十分なサンプルがあれば、合理的なヒューリスティックを明確に思いつくことができます。
引用された資料の適切な指標は、転送された (疑似) ヘッダーとインデントされたテキストです。おそらく、引用されたテキストの前の左マージンに沿って引用インジケータが付いています。時折アウトデントも見られます。
従来、1990 年代初頭の Usenet では、人々はさまざまな独自の引用スタイルを使用していました。
: ~ | This seems to be the original.
: ~ This is the first reply.
: This is the second reply.
This is the third reply, quoting the
previous three messages in sequence.
1995年頃、クライアントと標準化イニシアチブの両方が、概して「くさび」の引用に収束しました。
> >> This seems to be the original.
> > This is the first reply.
> This is the second reply.
This is the third reply, quoting the
previous three messages in sequence.
その後、マイクロソフトが登場し、すべてが台無しになりました。トップクォーティングは、スレッドから新しい参加者までのすべての背景をすばやく収集する必要がある一部の企業環境では理にかなっていると思いますが、その目的であっても、それは恐ろしい嫌悪感です.
This is the third reply, quoting the
previous three messages in sequence.
---- Begin forwarded message ----
From: Him [smtp:bogus]
To: His Friend
Subject: VS: Re: Same as on this message
Date: nothing machine-readable
This is the second reply.
---- Alkuperäinen viesti ----
Lähettäjä: His Friend [smtp:poppycock]
Saaja: Some Guy
Aihe: Re: Same as on this message
Päivämäärä: olisiko eilen ehkä
This is the first reply.
----- Original message ----
From: Somebody Else [smtp:mindless]
To: Some Guy
Subject: Same as on this message
Date: like, the day before
This seems to be the original.