MS Word から貼り付けたテキストから箇条書き記号を削除する必要がありますが、何を一致させるべきかわかりません。
STDOUT に出力すると、記号は次のように表示されます。 • これらの文字の ASCII コードは 194 と 162 です。
JavaScript または Ruby コードで続行する方法について何か提案はありますか?
MS Word から貼り付けたテキストから箇条書き記号を削除する必要がありますが、何を一致させるべきかわかりません。
STDOUT に出力すると、記号は次のように表示されます。 • これらの文字の ASCII コードは 194 と 162 です。
JavaScript または Ruby コードで続行する方法について何か提案はありますか?
ルビーでは、次のようなものを使用できるはずです。
mystring.gsub(/[\xxx]/,'whatever')
xxx
探している文字コードはどこにありますか。puts mystring
irbでaを実行するだけで、そのコードが何であるかを確認できます。
あなたが説明する記号を取得するなど、箇条書きで同様の問題がありました。さまざまな regEx フィルターを試しましたが、箇条書きでも結果の ⢠文字でも、何も機能しませんでした。
ただし、カスタム メソッドを使用して箇条書き (または同様の文字) をフィルター処理する方法を見つけることができました。それはきれいでも理想的でもありませんが、うまくいきます:
def strip_bullet_point(value)
first_char = 0
value.each_char { |c| c =~ /[A-Za-z]/ ? break : first_char += 1 }
value[first_char...value.length]
end
=~ チェックで nil が返されるため、先行するすべての空白やアルファベット以外の文字も削除されます。
/[[:alpha:]]/
â の文字を文字と見なすため、式の一致には使用しないでください。/[A-Za-z]/
'ñ' などの英語以外の文字に対して偽陰性が発生することに注意してください。