logstash の request_uri フィールドから部分文字列を抽出しようとしています。Grok は、apace access-log 行をいくつかのフィールドに分割します (既に機能しています)。そのため、独自のフィールドで request_uri を取得します。ここで、URI のルート コンテキストを取得します。
/en/some/stuff
/ApplicationName/some/path
/fr/some/french/stuff
しかし、en、ApplicationName、fr を独自のフィールド (他のフィールドに追加) に格納する方法がわかりません。このようなものがうまくいくのではないかと考えています。
grok {
pattern => "\"%{GREEDYDATA:domain}\" - %{IP:client_ip} \[%{GREEDYDATA:log_timestamp}\] \"%{WORD:method}\" \"%{GREEDYDATA:request_uri}\" - \"%{GREEDYDATA:query_string}\" - \"%{GREEDYDATA:protocol}\" - %{NUMBER:http_statuscode} %{NUMBER:bytes} \"%{GREEDYDATA:user_agent}\" %{NUMBER:seconds} %{NUMBER:milliseconds} \"%{GREEDYDATA:server_node}\""
match => [ "new_context_field", "SOME-REGEX fo parse request_uri" ]
}
ヒントを教えてください。