シンタックスハイライトで使用される一般的なアルゴリズムは何ですか?正規表現で交互を使用する簡単なアプローチを実装しました。
STRING_PATTERN | COMMENT_PATTERN | KEYWORD_PATTERNS
何かが文字列であるかパターンであるかを検出するのは、どちらが先に来るかによって異なります。
// This is a "comment"
"This is a // string"
ただし、キーワードを使用すると少し複雑になります。このアプローチは私の現在の実装では機能していますが、それが最適であるとは確信していません。
もう1つの問題は、強調表示する順序です。識別子/キーワードの前に数字を強調表示すると、キーワード内の数字を誤って強調表示する可能性があります...
編集:
私のプラグインはここにあります:http ://wordpress.org/extend/plugins/crayon-syntax-highlighter/