machine-learning - 二項分類に関して、評価指標と機能の違いは何ですか?

Question

この 2 つの概念を頭の中で区別するのに苦労しています。

BLEUなどの評価メトリクスを使用して、(機械翻訳のように) 参照に対する特定の入力の品質を測定できることを私は知っています。しかし、このスコアを利用して、文を 2 つのカテゴリに分類できるでしょうか? たとえば、特定の評価メトリクススコアが 0.50 を超える文には「はい」が与えられ、0.50 未満のすべての文には「いいえ」が与えられます。

また、これは機械学習アルゴリズムで使用される機能に関連している可能性がありますか? たとえば、「過去に」というフレーズは、データの可能な特徴であり、入力をこの特徴を持つかどうかに分類するために使用できます。

score 1 · Accepted Answer

ここで基本的な概念の意味を完全に見逃しているようです。

評価指標は、与えられた関数です: いくつかのモデル/アルゴリズムの回答といくつかのゴールデンスタンダード(専門家によって提供される真の回答) は、モデル/アルゴリズムがどれだけ優れているかを測定します。実際の分類プロセスとは関係ありません (クロス検証とモデルのパラメーターの調整中によく使用されるため、何もありません)。決定を下すために使用されるのではなく、結果がどれほど優れているかを定量化する方法です。
機能は単なるデータ表現であるため、問題の一部であるという意味で関連があり、明らかに正しい機能の選択 (機能エンジニアリングとも呼ばれます) は、モデルの品質に大きな影響を与えます。しかし、「入力をこの特徴を持つかどうかに分類するために使用できるデータの可能な特徴」は、かなり無意味です。機能は、多くの場合機能検出器と呼ばれる関数の値でありf、入力オブジェクトに適用されると、xいくつかの値を返します。たとえば、数値、またはいくつかの現象の 0/1 (存在しない/存在する) 表現です。たとえば、そのような機能は (テキストドキュメントの場合) " 与えられたテキストには "過去" の部分文字列が含まれているか、などのようf("I like trains")=false (0)になります。f("I liked trains in the past")=1 (true). 特徴を検出するために分類器をトレーニングするのではなく、単純な (効率的な) アルゴリズムを使用してデータを抽出し、それを使用していくつかのクラスに分類します。まさにこれを行うfため、「入力をこの機能を持つように分類する」ことは意味がありません。もちろん、一部のデータポイントで利用できない場合、欠落している機能を「埋める」ために分類子を実際にトレーニングすることは可能ですが、これはより高度なトピックであり、質問の一部ではないようです。f

コースラプラットフォームで利用できる Andrew Ng による機械学習の優れた紹介ビデオをご覧になることをお勧めします: https://class.coursera.org/ml/lecture/preview

machine-learning - 二項分類に関して、評価指標と機能の違いは何ですか?

1 に答える 1

Related

Reference