Google Ngram の結果 http://books.google.com/ngrams/ を csv として保存する簡単な方法はありますか?
次のようなリストを取得するように
1900 peace 500000times
1901 peace 540000times
等々?
生データをダウンロードしましたが、その処理方法がわかりません。それらの csv を OpenOffice で開くと、単語が 1 つも表示されません。
Google Ngram の結果 http://books.google.com/ngrams/ を csv として保存する簡単な方法はありますか?
次のようなリストを取得するように
1900 peace 500000times
1901 peace 540000times
等々?
生データをダウンロードしましたが、その処理方法がわかりません。それらの csv を OpenOffice で開くと、単語が 1 つも表示されません。
それは可能であり、実際には非常に簡単です。Google Ngramビューアで必要なグラフを生成し、ブラウザの機能を使用してページのソースコードを表示します(これは詳細オプションまたは開発者オプションで非表示になっている場合があります)。次に、コード(おそらく297行目)に、単純にリストされたデータがあります。任意のワードプロセッサやスプレッドシートソフトウェアを使用して、データをクリーンアップし、CSVとしてエクスポートできます。
いいえ、データセットにアクセスする必要があり、必要なものを見つけるのは困難です。または、Microsoft Research のN-Gram サービスを試すこともできます。