誰かに私のスクリプトに穴をあけてもらうことはできますか? 私の正規表現は textwrangler で URL を見つけるのに問題なく動作しますが、スクリプトを実行すると、parseducc.txt ファイルが断片を別の行に配置します。
export = File.new("parseducc.txt" , "w+")
File.open("uccdata.txt").each_line do |line|
line.scan(/(([a-zA-Z0-9-])+\.)+([a-zA-Z]){3,4}/) do |x|
export.puts x
end
end
サンプル出力
dhl-米国。 m アップスフレイト
。 t m フェデックス。 x m myyellow. wm _
このスクリプトの目的は、ファイルを 1 行ずつスキャンして URL を取り出し、それらを 1 行に 1 つずつ新しい出力ファイルにダンプすることです。このスクリプトのいくつかのバリエーションを試しましたが、明らかに何かが欠けています。私の正規表現にあると思いますが、regexlib.comで見つけたもののさまざまなバリエーションを使用しましたが、同様の問題がさまざまに表示されました。