1

ラテン語ベースの言語のセグメンテーション ロジックのテスト ケースを作成する必要があります。多くのサイト、セグメンテーションロジックのルールに関するドキュメントを見つけたというwrtは、1つのリンク「http://www.lisa.org/fileadmin/standards/srx20.pdf」を取得したことに関連していますが、これを使用したくありません. 現在、すべてのラテン語をサポートできる、より関連性の高いセグメンテーション ルールを探しています。句読点、ピリオド、コンマ、およびラテン語ベースの言語で使用されるその他の記号などのすべての可能性は、セグメンテーション後にこれらのセグメンテーション ルールを使用してテストできますか?

期待していただきありがとうございます、Manjushree

4

1 に答える 1

0

ラテン語ベースの言語の一般化されたセグメンテーションルールの最良のソースは、テキストセグメンテーションを扱うUnicode標準の付録です:http: //www.unicode.org/reports/tr29/

特に、この付録の文のセグメンテーション規則を参照してください。

于 2010-08-16T07:17:28.200 に答える