Twitter のデータに基づいてニュース記事の人気度を計算しようとしています。ただし、ツイートを取得しているときに、使用できないファイルになってしまう文字をエスケープするのを忘れていました。
ファイルの行は次のとおりです。
1369283975$,$337427565662830592$,$0$,$username$,$Average U.S. 401(k) balance tops $80$,$000$,$ up 75 pct since 2009 http://t.co/etHHMUFpoo #news$,$http://www.reuters.com/article/2013/05/23/funds-fidelity-401k-idUSL2N0E31ZC20130523?feedType=RSS&feedName=marketsNews
'$,$' パターンは、フィールド区切り文字としてだけでなく、削除したいツイート内にもあります。正しい行は次のようになります。
1369283975$,$337427565662830592$,$0$,$username$,$Average U.S. 401(k) balance tops $80000 up 75 pct since 2009 http://t.co/etHHMUFpoo #news$,$http://www.reuters.com/article/2013/05/23/funds-fidelity-401k-idUSL2N0E31ZC20130523?feedType=RSS&feedName=marketsNews
cut と sed を使用しようとしましたが、必要な結果が得られません。これを解決するための良い戦略は何でしょうか?