テキスト、制御文字、数字、ウムラウト (ドイツ語)、およびその他の utf8 文字を含む文字列を取得しました。
「言語の一部」ではないすべての utf8 文字を取り除きたい。(完全ではないリスト) ":/\ßä,;\n \t" のような特殊文字はすべて保持する必要があります。
悲しいことに、stackoverflow はこれらの文字をすべて削除するため、画像を追加する必要があります ( link )。
何か案は?助けていただければ幸いです。
PS: 誰かがそれらの特殊文字を殺さない貼り付けサービスを知っていれば、私は喜んで文字列をアップロードします..私はそれを見つけることができませんでした..
[編集]: 正規表現 "\P{Cc}" はすべて保存したい文字だと思います。この正規表現に一致しないすべての文字が返されるように、この正規表現を反転できますか?