オンラインからスクレイピングした .txt ファイルの文字行から日付を抽出しようとしています。日付は常に同じ行にあり、その後に同じ HTML が続きますが、日付自体はテキストごとに異なります。以下は、2 つの .txt ファイルからのコードの 2 つの例を示しています。
"17" <div align=\\center\\><br /><font face=\\Times New Roman\\ size=\\3\\><b>Tuesday, 3 February 2009</b></font>
"17" "<div align=\"center\"><br /><font face=\"Times New Roman\" size=\"3\"><b>Tuesday, 10 February 2009</b></font>"
文字として読み取られる .txt ファイルとして R にインポートしているため、 xpathSApply() は機能しません。それを最もよく抽出する方法について何か考えはありますか?ありがとう!