0

data.frame に変換しようとしているテキスト ファイル (myFile.txt) があります。

ここに抜粋があります

 <li>

                    <a title="Data table: Grand Falls-Windsor (Census Agglomeration), Newfoundland and Labrador" href="../../details/page.cfm?Lang=E&amp;Geo1=CMA&amp;Code1=010&amp;Geo2=PR&amp;Code2=01&amp;Data=Count&amp;SearchText=Grand%20Falls-Windsor&amp;SearchType=Begins&amp;SearchPR=01&amp;B1=All&amp;GeoLevel=PR&amp;GeoCode=010&amp;TABID=1">Grand Falls-Windsor&nbsp;(<acronym title="Census Agglomeration">CA</acronym>)</a> [<a href="../../details/page_Map_Carte_Detail.cfm?Lang=E&amp;G=1&amp;Geo1=CMA&amp;Code1=010&amp;Geo2=PR&amp;Code2=01&amp;Data=Count&amp;SearchText=&amp;SearchType=Begins&amp;SearchPR=01&amp;B1=All&amp;Custom=&amp;TABID=1&amp;geocode=010" title="Map: Grand Falls-Windsor (Census Agglomeration), Newfoundland and Labrador">map</a>]

         </li>

<li>

                    <a title="Data table: St. John's (Census Metropolitan Area), Newfoundland and Labrador" href="../../details/page.cfm?Lang=E&amp;Geo1=CMA&amp;Code1=001&amp;Geo2=PR&amp;Code2=01&amp;Data=Count&amp;SearchText=St.%20John's&amp;SearchType=Begins&amp;SearchPR=01&amp;B1=All&amp;GeoLevel=PR&amp;GeoCode=001&amp;TABID=1">St. John's&nbsp;(<acronym title="Census Metropolitan Area">CMA</acronym>)</a> [<a href="../../details/page_Map_Carte_Detail.cfm?Lang=E&amp;G=1&amp;Geo1=CMA&amp;Code1=001&amp;Geo2=PR&amp;Code2=01&amp;Data=Count&amp;SearchText=&amp;SearchType=Begins&amp;SearchPR=01&amp;B1=All&amp;Custom=&amp;TABID=1&amp;geocode=001" title="Map: St. John's (Census Metropolitan Area), Newfoundland and Labrador">map</a>]

         </li>


df <- read.table("myFile.txt",sep="\n")

これは、Grand Falls 抽出の最後まで機能しますが、その後は\n効果がないようです。\n有効になっていない s が最後にあることがわかるように、これはコンソールの読み出しの行です。

\t\t\t\t\t\t<a title=Data table: St. John's (Census Metropolitan Area), Newfoundland and Labrador href=../../details/page.cfm?Lang=E&amp;Geo1=CMA&amp;Code1=001&amp;Geo2=PR&amp;Code2=01&amp;Data=Count&amp;SearchText=St.%20John's&amp;SearchType=Begins&amp;SearchPR=01&amp;B1=All&amp;GeoLevel=PR&amp;GeoCode=001&amp;TABID=1>St. Johns&nbsp;(<acronym title="Census Metropolitan Area">CMA</acronym>)</a> [<a href="../../details/page_Map_Carte_Detail.cfm?Lang=E&amp;G=1&amp;Geo1=CMA&amp;Code1=001&amp;Geo2=PR&amp;Code2=01&amp;Data=Count&amp;SearchText=&amp;SearchType=Begins&amp;SearchPR=01&amp;B1=All&amp;Custom=&amp;TABID=1&amp;geocode=001" title="Map: St. Johns (Census Metropolitan Area), Newfoundland and Labrador>map</a>]\n\t\t\t\t\t\n             </li>\n\t\t\t \n

このプレゼンテーションで申し訳ありませんが、コンソールからコピーしようとすると Rstudio がクラッシュするという問題がたくさんあります

誰かがここで助けてくれますか。とにかく、おそらくread.table()正しいアプローチではありませんか?

4

2 に答える 2

1

次のいずれかを使用できます。

read.table("test.txt", sep="\n", quote="")
readLines(con=file("test.txt"))

一重引用符の不一致の問題があります。

于 2012-12-05T22:03:35.693 に答える
1

閉じられていないオープン クォートがあるようです"

おそらく、ここにコピーして貼り付けたものだけにあるのでしょうか、それともデータ自体にあるのでしょうか?

于 2012-12-05T20:37:47.023 に答える