wgetを使用して、scholar.google.comの特定のクエリに一致する論文の数をダウンロードし、ページのすべてのコンテンツを示すファイルを取得します。
ファイルの次の部分の最後の番号「約8,890の結果1-10」を取得したいと思います。
私は試した:
cat /dir/file | tr -d "," | grep -o -E -- 'about ([^"]+) \w+'
しかし、それは出力します:
about <b>8890</b>. (<b>0.12</b> sec) </font></td></tr></table></form> <div class
一方、私は8890が欲しいだけです(tr -d "、"によって処理されるコンマはありません
それを改善する方法について何か提案はありますか?前もって感謝します!