この質問は別の方法で尋ねられた可能性があります。その場合は、私に指摘してください。検索結果から見つからなかっただけです。
ここSOのようなマークアップのテキストを解析したいと思います。
- 例えば。
* some string
箇条書き - 例えば。
*some string*
イタリックテキストの場合 - 例えば。
&some string&
URLの場合 - 例えば。
&some string&specific url&
文字列とは異なるURLの場合
等
文字列を処理して特別なマークアップシーケンスを見つけるには、次の2つの方法が考えられます。
a。文字中心の方法で進めることができます。つまり、文字列を解析してシーケンス1、2などを探します。ただし、文字列を複数回解析する必要があるため、非効率的です。
b。文字列を文字ごとに処理し、特殊文字とその位置を記憶しておく方がよいようです。メモリが上記のような特殊シーケンスに一致する場合、文字列内の特殊文字はHTMLに置き換えられます。しかし、それがより良いアイデアであるかどうかはよくわかりません。また、それをどのように実装すべきかについても確信がありません。
これを行うための最良の方法は何ですか?正規表現はどうですか?パターンaまたはbに従いますか?3番目のオプションはありますか?
PS私はPythonを使用しています。Pythonの例が最も高く評価されています。