2

私が理解しているように、Freebase の分類法は一般的に次の階層に要約されます。

Domain Category > Domain > Type > Topic

私は、入力を受け取り、いくつかの用語を吐き出す自然言語処理を少し行うアプリケーションを持っています。用語が有用かどうかを体系的に「判断」するための最初の取り組みとして、それがトピックであると仮定し、Freebase が少なくとも 1 つのタイプに分類された用語を持っているかどうかを確認することで、Freebase に対してそれを「テスト」することを考えています。

そこで、私が今やろうとしているのは、与えられたトピックについて、そのタイプ ID (および理想的には名前) を見つけることです。何も返されない場合、いわゆるトピックについて何かがわかります。1 つ以上のタイプが返された場合、用語の有用性をある程度測定できるだけでなく、Freebase 分類法をオーバーレイして、人々に別のアクセス方法を提供することもできます (そのツリー メタファを介して)。

たとえば、NLP エンジンから「政治」、「政治組織」、「行政」、「写真」、「MSN」などを受け取ることがあります。どの種類の MQL クエリが、それらのトピックに関連付けられているタイプを教えてくれますか?

ご協力いただきありがとうございます。

アップデート

私はちょうどそれらの壮大なヘッドスラップの瞬間の1つを持っていました. しばらくいじっていたクエリから離れ、戻ったときに自分のやり方の誤りに気づきました。私はこの方法を難しすぎないようにしようとしていましたが、いつものように、私が見ることができなかった単純な解決策はまさに私が必要としていたものでした:

[{
  "id": null,
  "name": "Politics",
  "type": [{"id": null, "name": null }]
}]​

ただし、これは少し異なる質問につながります。私が得たのは複数のトピックで、そのうちの 1 つは en/politics であり、id が である他のトピック/m/...などです。Freebase システムが複雑であることは理解していますが、その複雑さを理解するにはほど遠いです。この種の演習では、ほとんどの場合、その/en/トピックが必要ですか?

4

1 に答える 1

1

一般に、/en/ トピックは /m/ トピックよりも注目に値します。/m/ ID は Freebase に追加される新しいトピックに自動的に割り当てられますが、/en/ はコミュニティによって手動または半自動で追加される必要があります。これまでのところ、ほとんどの /en/ キーは Wikiedia (独自の特筆性要件があります) から取得されていますが、どこからでも取得できます。

Freebase で使用されているその他の一般的な名前空間のリストを次に示します。

また、テキストから Freebase へのトピックのマッチングに NLP を使用すると述べたので、実験的なReconciliation APIについて読むことに興味があるかもしれません。これは、データで利用可能なコンテキストの手がかりを考慮して、トピックの「最適な一致」を見つける方法です。

于 2010-06-30T17:22:04.840 に答える