私たちは、ウェブサイトでユーザー エージェント文字列を追跡しています。それらについて統計を取り、IE6 ユーザーが何人いるか (何を対象に開発する必要があるかがわかります)、またモバイル ユーザーが何人いるかを確認したいと思います。
したがって、次のようなログ全体があります。
Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; FunWebProducts)
Mozilla/4.0 (compatible; MSIE 7.0; Windows NT 5.1; FunWebProducts; .NET CLR 1.0.3705; .NET CLR 1.1.4322; Media Center PC 4.0; .NET CLR 2.0.50727)
そして理想的には、すべての「意味のある」文字列を表示するのは非常にきれいです。これは、特定の長さよりも長い文字列を意味するだけです。たとえばFunWebProducts
、または.NET CLR
、または.NET CLR 1.0.3705
-- が含まれているエントリの数を確認したい場合がありますが、セミコロンが含まれているエントリの数は確認したくありません。したがって、必ずしも一意の文字列を探しているわけではありませんが、すべての文字列、さらにはサブセットも探しています。Mozilla
したがって、これには と のカウントが含まれていることがわかっているので、すべての のカウントを確認したいと思いMozilla/5.0
ますMozilla/4.0
。このためのネストされた表示があり、最短の文字列から開始して下に向かっていくとよいでしょう。おそらく次のようなもの
4,2093 Mozilla
1,093 Mozilla/5.0
468 Mozilla/5.0 (Windows;
47 Mozilla/5.0 (Windows; U
2,398 Mozilla/4.0
これはコンピュータ サイエンスの宿題のように思えます。これは何と呼ばれるでしょうか?このようなものはそこに存在しますか、それとも私が独自に作成しますか?