1

たくさんの本をデジタル化していきます。電子書籍の流れに影響を与えることなく、オリジナルの本の改行の場所をマークしたいと思います。生ファイルの特別な場所をマークするために使用できる非表示のUnicodeチャーターはどれですか?

(\ nは段落の終わりを示すために使用されます)

This  is  a  sentence 
in the original book that
I want to mark      line
break places.

置き換える適切な文字は何ですか*

This  is  a sentence * in the original book that * I want to mark line *break places.
4

2 に答える 2

5

Unicodeには、一部のオリジナルでは改行を表す隠し文字の概念はありませんが、レンダリングでは改行は発生しません。Unicodeはプレーンテキストデータをエンコードし、改行の制御文字はプレーンテキストがレンダリングされるときに効果があります。

ここで重要なのは、ファイルがどのように使用されるかです。プレーンテキストエディタで処理可能にする必要がある場合は、改行をデフォルトのレンダリングで複製するか、ファイルの作成時に省略するかを決定する必要があります。それらを非表示にすることはできません。また、メモ帳やEmacsなどのさまざまなテキストエディタでは、さまざまな行制御規則を使用する場合があります。あるプログラムの行末は、別のプログラムの段落の終わりです。

作成したプログラムによってのみファイルが処理される場合は、任意の規則を使用できます。最も論理的なものは次のとおりです。「行と段落の区切り記号。Unicode標準では、行と段落を区切るために、U+2028行区切り文字とU+2029段落区切り文字の2つの明確な文字が提供されています。これらは、Unicodeプレーンテキストで行と段落の境界を示すデフォルトの形式と見なされます。各行区切り文字の後に新しい行が開始されます。各段落区切り文字の後に新しい段落が開始されます。これらの文字は区切りコードであるため、最初の行または段落を開始したり、最後の行または段落をそれらで終了したりする必要はありません。そうすることは、後に空の段落または行があったことを示します。段落区切り文字は、テキストの段落の間に挿入できます。これを使用すると、受信側で異なる行幅に配置できるプレーンテキストファイルを作成できます。行区切り文字は、無条件の行末を示すために使用できます。」 http://www.unicode.org/versions/Unicode6.1.0/ch16.pdf(PDFの6ページと7ページ)

U+2028とU+2029は、通常、テキストエディタでは理解されないことに注意してください。プレーンテキスト形式でデータを保存するのに適しています。テキストをレンダリングする場合、レンダリングソフトウェアには、元の行への分割を無視し、ハイフンが前に付いている場合を除いて、U + 2028をスペースと同等に扱うオプションがあります(これは、より高いレベルなしでは解決できない問題を引き起こします)。情報:「foo-」で終わり、「bar」で始まる行が続く行は、改行のためにハイフンでつながれた単語「foobar」、またはハイフンでつながれた複合語「foo-bar」、または場合によっては、 「foobar」の組み合わせ)。

于 2012-07-10T15:48:24.593 に答える
0

改行文字(LF 、、"\n"0x0Aおよび/またはキャリッジリターン(CR 、、"\r")を使用し0x0Dます。
つまり、この目的のための通常の文字。

于 2012-07-10T11:31:51.100 に答える