問題タブ [categorization]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
2 に答える
1973 参照

classification - トレーニング データがない場合にチャット テキストを分類する方法は?

チャット テキストを分類するユース ケースがあります。Apache OpenNLP で DocumentCategorizer を使用してチャットを分類したいと考えています。しかし、そのためには、チャットが既に分類されているはずのトレーニング データが必要です。トレーニング データとテスト データを準備するために、何百ものチャットを手動で分類する必要がありますか? 他に何ができますか?チャット カテゴリは、サービス関連の問題になる予定です。このカテゴリのリストは、ドメイン固有のものになります。このデータの提供者は、分類されたチャット データを私に提供する必要がありますか? 前もって感謝します。

0 投票する
2 に答える
1439 参照

r - 因子ごとにデータを二分する

2 つの要因に基づいて二分された変数を作成する必要があります (可能であることを願っています)。

私がデータを持っているとしましょう:

性別および年齢層固有の中央値を使用してバイナリ (LowWalkHrs) を作成したいと思います (たとえば、年齢層 = 1 および性別 = 1 の場合、中央値 = 2.1 (中央値は Excel を使用して見つけました))。LowWalkHrs はデータセットに追加された変数になるため、出力は次のようになります。

私はかなり大きなデータセット (約 10,000 件の観測) を持っているので、Excel は問題外です。

R では、因子変数を使用していないように見えるカットとカット 2 と、(Error in $<-.data.frame( *tmp*, "lowWalkHrs", value = list(hourwalking = c(0.63, : 置換には 949 行があり、データには 11303 があります)。

0 投票する
2 に答える
102 参照

c# - 異なるアナグラムを分離する

たとえば、特定の数の文字列がn配列にランダムな順序で格納されているとします。いくつかは、たとえばm1のアナグラムでstring1ありm2、 のアナグラムなどstring2です。特定の文字列のアナグラムである文字列を分離し、各セットの文字列の数を決定するための効率的なアルゴリズムは何でしょうか?

0 投票する
1 に答える
1024 参照

excel - Excel でデータを分類する

次のような値を持つシート「データ」があります。

別のシート「カテゴリ」があります。

シート「カテゴリのデータ」を取得したい:

数式を使用してこれを達成するにはどうすればよいですか?

0 投票する
2 に答える
3086 参照

mechanicalturk - Mechanical Turk - HIT を表示できず、空白で表示されます

Mechanical Turk サンドボックス開発者バージョンでいくつかの画像分類タスクをセットアップしようとしています。HIT (注釈画像) を表示しようとすると、何も表示されません。[Accept HIT] ボタンをクリックしましたが、まだ何も表示されません。

プロジェクトのセットアップに特に問題がないことを確認するために、画像分類を含む他のプロジェクトで HITS を受け入れる作業者としてサインインしました。注釈を付ける画像が表示されるはずの分類プロジェクトで、まだ空白の画像を見続けています。

誰でもこの問題を解決できますか?ありがとう。

0 投票する
3 に答える
3147 参照

python - データを分類し、各カテゴリの平均と標準偏差を計算します

データを分類し、平均と標準偏差を取得するコードを書いています。これが私のデータの例です。

ご覧のとおり、6 つの列があります。ここでは3段階の計算を考えています。

  1. これらの数値を 6 列目に基づいて分類します。6 列目は 0 ~ n の浮動小数点数で構成されます。0~1、1~2、2~3 .... n-1 ~ n のように、n 個のセクション (またはサブ マトリックスなど) を生成したいと考えています。最後の数字は、セクションを作りたいので、最後のデータの切り上げ数にする必要があります。たとえば、最後の番号が 121.2513 の場合、そのデータを含めるには、最後のセクションを 120~121 にする必要があります。

  2. 1~5 列目の他のすべての番号を、6 列目に基づいて対応するサブセクションに再割り当てします。特定のセクションに番号がない場合は、0 として出力します。サブセクションの数は n になります。各サブセクションの要素数はランダムです。

  3. サブセクションごとに 3 列目、4 列目、5 列目の平均と標準偏差を取得し、「サブセクション内の要素数、サブセクションの開始数、3 列目、4 列目、5 列目の平均偏差と標準偏差」を出力ファイルに書き込みます。桁'

複数の for ループでこれを試していましたが、複雑になりすぎてエラーになります。データを分類し、各サブセクションで遊んで、Python で出力する他の簡単な方法はありますか? また、for ループがまったく機能しません。このデータを使用した簡単な例の提案はありますか?

0 投票する
1 に答える
2146 参照

php - 2 つの列でグループ化されたテーブルからすべてのデータを取得する - mysql、php

テーブルにあるすべての詳細をフェッチしようとしていますが、それらを2つの異なる列名でグループ化し、phpから同じものをフェッチします

例:

最終的に欲しいもの

最初にカテゴリがグループ化され、id によって並べ替えられます。次に、サブカテゴリがグループ化され、サブカテゴリの昇順で並べ替えられます。

また、phpを使用して同じものを取得するにはどうすればよいですか

私の試み:

mysql:

PHP: