0

次のように、さまざまな分野と時間からのニュースに関する txt データセットの構造化に問題があります。

court agrees to expedite n.f.l.'s appeal  
the decision means a ruling could be made nearly two months before the regular season begins, time for the sides to work out a deal without delaying the season.
http://feeds1.nytimes.com/~r/nyt/rss/sports/~3/nbjo7ygxwpc/04nfl.html               
0    
04 May 2011 07:39:03
nyt   
sport

investing: can you profit in agricultural commodities?  
bad weather is one factor behind soaring food prices. can you make hay with farm stocks? possibly: but be prepared to harvest gains on a moment's ...  
http://rssfeeds.usatoday.com/~r/usatodaycommoney-topstories/~3/qbhb22sut9y/2011-05-19-can-you-make-gains-in-grains_n.htm  
1   
20 May 2011 15:13:57   
ut  
business

no tsunami but fifa's corruption storm rages on   
though jack warner's threatened soccer "tsunami" remains stuck in the doldrums, the corruption storm raging around fifa shows no sign of abating after another extraordinary week for the game's governing body.   
2    
07 Jun 2011 17:54:54    
reuters   
sport   

今、R を使用して、このデータセットを列の異なる変数として読み取ろうとしています。それぞれの最初の行は「Topic」、次に「Description」、「Link」、「ID」、「Data&Time」、「City」、最後の行は「Fields」です。ファイルには数千の行が含まれており、それらの多くには変数がありません。

どこから、どのように始めればよいのか本当にわかりません。誰でも私を助けてくれることを願っています!

4

0 に答える 0