Freebase のトピックをフィルターを適用して取得することはできますか?
Freebase には現在、約 2,800 万のトピックが含まれています。
たとえば、レコード名(〜700万件のトピック)を除くすべてのトピック名を取得したい。
出来ますか?
Freebase のトピックをフィルターを適用して取得することはできますか?
Freebase には現在、約 2,800 万のトピックが含まれています。
たとえば、レコード名(〜700万件のトピック)を除くすべてのトピック名を取得したい。
出来ますか?
もちろん。これは API を使用して簡単に行うことができますが、必要なトピックの数については、データ ダンプを使用することをお勧めします。
この 1.4 GB ファイルを入手してください: http://download.freebase.com/datadumps/latest/freebase-simple-topic-dump.tsv.bz2
コマンドを使用します
bzegrep -v $'/music/recording[\t,]' freebase-simple-topic-dump.tsv.bz2 | cut -f 2 > names.txt
数分で、2,100 万の名前が表示されます。