0

今、私は一見簡単ですがやりがいのあるタスクを持っています。質問のデータセットを開発する必要があり、質問を2つのカテゴリに分類します。

  1. ファクトイドの質問:「フランスの現在の大統領は誰ですか」。
  2. 無料の質問:「下のカメラを評価していただけませんか?」

今、私はYahoo!の両方のカテゴリーのパーセンテージを知る必要があります。それに応じてデータセットを維持できるように答えてください、しかし私はこの統計を行う良い方法を知りません。手動で行うことは本当に不可能に思えます、誰かが考えを持っていますか?私は本当に感謝します、ありがとう。

4

1 に答える 1

1

つまり、一方を他方から認識しますか?自動的に、サイトの端からの分類なしで?それはおそらく不可能になるでしょう。

あなたができる最善のことは、いくつかの指標を比較することだと思います。「無料」の質問は、おそらくより多くのテキストでより多くの貢献をする傾向があります。Y!Answersにディスカッションシステムがあれば、彼らはもっと激しく議論されるでしょう...「ファクトイド」の質問「Whatis...」で始まることがよくあります...など。

たぶん100のランダムな質問を取得し、手動でチェックしてパーセンテージを書き留めます。

于 2010-09-20T09:33:38.303 に答える