1

私はここでしばらく立ち往生しており、正規表現を使用したNEsperの不適切な動作に問題があるようです。問題を再現するための簡単なプロジェクトを作成しました。これはgithubから入手できます。

簡単に言うと、NEsper を使用すると、メッセージ (イベント) を一連のルール (SQL に似たもの) を通して送り込むことができます。イベントがルールに一致する場合、NEsper はアラートを発します。私のアプリケーションでは、正規表現を使用する必要がありますが、これは機能していないようです。

問題ステートメントを作成する両方
の方法を試しましたが、一致イベントは発生しませんが、正規表現と入力は .NET Regex クラスによって一致しています。正規表現 ("\b\d{1,3}.\d{1,3}.\d{1,3}.\d{1,3}\b") の代わりに、一致する値 (" 127.0.0.5") をステートメントに追加すると、イベントは正常に発生します。 createPatterncreateEPL

入力
127.0.0.5

==ルール失敗==
every (Id123=TestDummy(Value regexp '\b\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\b'))
// そしてこれを渡したい

==ルールパス==
毎 (Id123=TestDummy(Value regexp '127.0.0.5'))

質問
NEsper 正規表現マッチングのサンプルを教えてくれる人はいますか? または、コード内の私のばかげた間違いを指摘してください。

コード
これは私の NEsper デモ ラッパー クラスです。

public class NesperAdapter
{
    public MatchEventSubscrtiber Subscriber { get; set; }
    internal EPServiceProvider Engine { get; private set; }

    public NesperAdapter()
    {
        //This call internally depend on log4net, 
        //will throw an error if log4net cannot be loaded 
        EPServiceProviderManager.PurgeDefaultProvider();

        //config
        var configuration = new Configuration();
        configuration.AddEventType("TestDummy", typeof(TestDummy).FullName);
        configuration.EngineDefaults.Threading.IsInternalTimerEnabled = false;
        configuration.EngineDefaults.Logging.IsEnableExecutionDebug = false;
        configuration.EngineDefaults.Logging.IsEnableTimerDebug = false;

        //engine
        Engine = EPServiceProviderManager.GetDefaultProvider(configuration);
        Engine.EPRuntime.SendEvent(new TimerControlEvent(TimerControlEvent.ClockTypeEnum.CLOCK_EXTERNAL));
        Engine.Initialize();
        Engine.EPRuntime.UnmatchedEvent += OnUnmatchedEvent;
    }

    public void AddStatementFromRegExp(string regExp)
    {
        const string pattern = "any (Id123=TestDummy(Value regexp '{0}'))";
        string formattedPattern = String.Format(pattern, regExp);
        EPStatement statement = Engine.EPAdministrator.CreatePattern(formattedPattern);

        //this is subscription
        Subscriber = new MatchEventSubscrtiber();
        statement.Subscriber = Subscriber;
    }

    internal void OnUnmatchedEvent(object sender, UnmatchedEventArgs e)
    {
        Console.WriteLine(@"Unmatched event");
        Console.WriteLine(e.Event);
    }

    public void SendEvent(object someEvent)
    {
        Engine.EPRuntime.SendEvent(someEvent);
    }
}

次に、サブスクライバーと DummyType

public class MatchEventSubscrtiber
{
    public bool HasEventFired { get; set; }

    public MatchEventSubscrtiber()
    {
        HasEventFired = false;
    }

    public void Update(IDictionary<string, object> rows)
    {
        Console.WriteLine("Match event fired");
        Console.WriteLine(rows);

        HasEventFired = true;
    }
}

public class TestDummy
{
    public string Value { get; set; }
}

そしてNUnitテスト。1 つのコメントが nesper.AddStatementFromRegExp(regexp); の場合。行と行のコメントを外し//nesper.AddStatementFromRegExp(input);てから、テストに合格します。ただし、そこには正規表現が必要です。

//Match any IP address
[TestFixture(@"\b\d{1,3}\.\d{1,3}\.\d{1,3}\.\d{1,3}\b", "127.0.0.5")] 
public class WhenValidRegexpPassedAndRuleCreatedAndPropagated
{
    private NesperAdapter nesper;

    //Setup
    public WhenValidRegexpPassedAndRuleCreatedAndPropagated(string regexp, string input)
    {
        //check it is valid regexp in .NET
        var r = new Regex(regexp);
        var match = r.Match(input);
        Assert.IsTrue(match.Success, "Regexp validation failed in .NET");

        //create and start engine
        nesper = new NesperAdapter();

        //Add a rule, this fails with a correct regexp and a matching input
        //PROBLEM IS HERE 
        nesper.AddStatementFromRegExp(regexp);
        //PROBLEM IS HERE 

        //This works, but it is just input self-matching
        //nesper.AddStatementFromRegExp(input);

        var oneEvent = new TestDummy
        {
            Value = input
        };

        nesper.SendEvent(oneEvent);
    }

    [Test]
    public void ThenNesperFiresMatchEvent()
    {
        //wait till nesper process the event
        Thread.Sleep(100);

        //Check if subscriber has received the event
        Assert.IsTrue(nesper.Subscriber.HasEventFired,
            "Event didn't fire");
    }
}
4

1 に答える 1

1

この問題をしばらくデバッグしていたところ、NEsper が正しく処理していないことがわかりました。

WHERE regexp 'foobar'声明

だから私が持っているなら

SELECT * FROM MyType WHERE PropertyA regexp '何らかの有効な正規表現'

NEsper は、「何らかの有効な正規表現」を使用して文字列の書式設定と検証を実行し、重要な (そして有効な) 記号を正規表現から削除します。これが私が自分でそれを修正した方法です。推奨される方法かどうかはわかりません。

ファイル: com.espertech.esper.epl.expression.ExprRegexpNode

理由: 正規表現がどのように構築されるかはユーザー次第だと思います。これはフレームワークの一部ではありません。

// Inside this method
public object Evaluate(EventBean[] eventsPerStream, bool isNewData, ExprEvaluatorContext exprEvaluatorContext){...}

// Find two occurrences of
_pattern = new Regex(String.Format("^{0}$", patternText));

// And change to
_pattern = new Regex(patternText);

ファイル: com.espertech.esper.epl.parse.ASTConstantHelper

理由: すべての文字列に対して requireUnescape を使用しますが、regexp をスキップします。これは、有効な正規表現にブレーキがかかり、有効なシンボルがいくつか削除されるためです。

// Inside this method  
public static Object Parse(ITree node){...}

// Find one occurrence of
case EsperEPL2GrammarParser.STRING_TYPE:
{
    return StringValue.ParseString(node.Text, requireUnescape);
}

// And change to
case EsperEPL2GrammarParser.STRING_TYPE:
{
bool requireUnescape = true;

if (node.Parent != null)
{
    if (!String.IsNullOrEmpty(node.Parent.Text))
    {
        if (node.Parent.Text == "regexp")
        {
            requireUnescape = false;
        }
    }
}

return StringValue.ParseString(node.Text, requireUnescape);
}

ファイル: com.espertech.esper.type.StringValue

理由: すべての文字列をエスケープ解除しますが、正規表現の値はエスケープしません。

// Inside this method  
public static String ParseString(String value){...}

// Change from
public static String ParseString(String value)
{
    if ((value.StartsWith("\"")) & (value.EndsWith("\"")) || (value.StartsWith("'")) & (value.EndsWith("'")))
    {
        if (value.Length > 1)
        {               
            if (value.IndexOf('\\') != -1)
            {
                return Unescape(value.Substring(1, value.Length - 2));
            }

            return value.Substring(1, value.Length - 2);
        }
    }

    throw new ArgumentException("String value of '" + value + "' cannot be parsed");
}   

// Change to
public static String ParseString(String value, bool requireUnescape = true)
{
    if ((value.StartsWith("\"")) & (value.EndsWith("\"")) || (value.StartsWith("'")) & (value.EndsWith("'")))
    {
        if (value.Length > 1)
        {
            if (requireUnescape)
            {
                if (value.IndexOf('\\') != -1)
                {
                    return Unescape(value.Substring(1, value.Length - 2));
                }
            }

            return value.Substring(1, value.Length - 2);
        }
    }

    throw new ArgumentException("String value of '" + value + "' cannot be parsed");
}   
于 2012-01-12T17:33:38.563 に答える