私は、コンテンツが豊富なサイトの1つ(場合によっては複数)で自然言語処理(NLP)を実行するプロセスに取り組んでいます。NLPが完了したら、出力(通常、そのメタファーの普及を考慮してタグと考えることができる一連の用語)を、ある種の標準または一般的に受け入れられている組織構造に自動的に編成します。
完璧な世界では、最終的な目標は「ドメインエキスパート」ではなく実際の人々をターゲットにしてアピールすることなので、これをフォークソノミーの概念(分類法ではなく)でクラウドソーシングしてほしいと思っていますが、私はオープンですアイデアとベストプラクティスに。スケーラビリティの明らかな目的のために、私はこの税/フォークソノミーの人口を自動化して、チーム/組織の「誰か」が(コンテキストの有無にかかわらず)大量の単語を任意に見る責任を負わないようにしたいと思いますツリーのコンテキストコンポーネントを肉付けします。
これを行うためのアイデアがいくつかあり、実行可能性を確立するためにいくつかの調査が必要ですが、この種のことについての実際的な経験はまったくないので、アイデアは実際には、タスクを達成する上で何らかの役割を果たす可能性のあるものに要約されます。他の人がこの種のことについてはるかに多くの経験を持っていることを想像して、私はあなたの肩に立つことができることを望んでいます。
あなたの考えと洞察に感謝します。
実例
私は自分のブログの記事に対してNLPを実行しました。NLPは、十分なレベルの関連性を持つ次の用語を返しました。
- ロブウィルカーソン
- 変化する
- ギット
今、私はそれらの用語を人間の介入なしに税/フォークソノミーに入れたいと思います。この場合、「Git」と「Rob Wilkerson」は分類できる用語です。これらの用語が追跡する価値のある十分な牽引力を生成しない場合、構造から用語を削除するプロセスに追加の規定があります。 。一方、「変更」はおそらく曖昧すぎて曖昧すぎて、問題を起こす価値はありません。