0

誰かに私のスクリプトに穴をあけてもらうことはできますか? 私の正規表現は textwrangler で URL を見つけるのに問題なく動作しますが、スクリプトを実行すると、parseducc.txt ファイルが断片を別の行に配置します。

export = File.new("parseducc.txt" , "w+")
File.open("uccdata.txt").each_line do |line|

    line.scan(/(([a-zA-Z0-9-])+\.)+([a-zA-Z]){3,4}/) do |x|
        export.puts x
    end
end

サンプル出力

dhl-米国。 m アップスフレイト
。 t m フェデックス。 x m myyellow. wm _










このスクリプトの目的は、ファイルを 1 行ずつスキャンして URL を取り出し、それらを 1 行に 1 つずつ新しい出力ファイルにダンプすることです。このスクリプトのいくつかのバリエーションを試しましたが、明らかに何かが欠けています。私の正規表現にあると思いますが、regexlib.comで見つけたもののさまざまなバリエーションを使用しましたが、同様の問題がさまざまに表示されました。

4

1 に答える 1

1

これを試してください:

export = File.new("parseducc.txt" , "w+") 
File.open("uccdata.txt").each_line do |line| 
  line.scan(/(https?:\/\/\S+)/) do |x| 
    export.puts x 
  end 
end
于 2012-06-27T13:24:14.253 に答える