0

タスクは、各セクションに設定されたさまざまな制限に従って、特定のテキスト文字列をセクションにグループ化することです。「Lorem ipsum dolorem」という文字列 S があるとします。また、3 つのセクションがあります。各セクションには、セクションに含めることができるテキストの量に制限を設けることができる制限があります。これらの制限は、文字数または単語数で指定できます。たとえば、最初のセクションには、最小 5 文字、最大 10 文字を含めることができます。2 番目のセクションには、最小で 1 つの単語、最大で 5 つの単語を含めることができ、各単語は 2 ~ 10 文字です。3 番目のセクションは、最初のセクションと同じ制限を持つことができます。

利用可能なすべてのテキストを使用する必要があります。そうしないと、グループ化の解決策がありません。単語を分離することはできません (したがって、グループ化するときに単語を複数の部分に分割することはできません)。グループ化で文をまとめ、他のすべての条件を同じにすると、解決策はより良くなります。

テキストをグループ化する最も効率的な方法は何ですか?

4

1 に答える 1

0

文字/数字と単語のみを数える場合は、正規表現の場合です: http://en.wikipedia.org/wiki/Regular_expressions

編集

たとえば、次のことを考慮してください。

 sed -E -e 's/([a-z]{2,10}) (([a-z]{2,4} ){1,2})([a-z]{2,10})/G:\1 G:\2
 G:\4/'

これを「aaa bb bbbb ccccc」に適用すると、次のようになります。

 G:aaa G:bb bbbb  G:ccccc
于 2012-04-05T06:04:29.187 に答える