問題タブ [categorization]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
classification - トレーニング データがない場合にチャット テキストを分類する方法は?
チャット テキストを分類するユース ケースがあります。Apache OpenNLP で DocumentCategorizer を使用してチャットを分類したいと考えています。しかし、そのためには、チャットが既に分類されているはずのトレーニング データが必要です。トレーニング データとテスト データを準備するために、何百ものチャットを手動で分類する必要がありますか? 他に何ができますか?チャット カテゴリは、サービス関連の問題になる予定です。このカテゴリのリストは、ドメイン固有のものになります。このデータの提供者は、分類されたチャット データを私に提供する必要がありますか? 前もって感謝します。
r - 因子ごとにデータを二分する
2 つの要因に基づいて二分された変数を作成する必要があります (可能であることを願っています)。
私がデータを持っているとしましょう:
性別および年齢層固有の中央値を使用してバイナリ (LowWalkHrs) を作成したいと思います (たとえば、年齢層 = 1 および性別 = 1 の場合、中央値 = 2.1 (中央値は Excel を使用して見つけました))。LowWalkHrs はデータセットに追加された変数になるため、出力は次のようになります。
私はかなり大きなデータセット (約 10,000 件の観測) を持っているので、Excel は問題外です。
R では、因子変数を使用していないように見えるカットとカット 2 と、(Error in $<-.data.frame
( *tmp*
, "lowWalkHrs", value = list(hourwalking = c(0.63, : 置換には 949 行があり、データには 11303 があります)。
c# - 異なるアナグラムを分離する
たとえば、特定の数の文字列がn
配列にランダムな順序で格納されているとします。いくつかは、たとえばm1
のアナグラムでstring1
ありm2
、 のアナグラムなどstring2
です。特定の文字列のアナグラムである文字列を分離し、各セットの文字列の数を決定するための効率的なアルゴリズムは何でしょうか?
excel - Excel でデータを分類する
次のような値を持つシート「データ」があります。
別のシート「カテゴリ」があります。
シート「カテゴリのデータ」を取得したい:
数式を使用してこれを達成するにはどうすればよいですか?
mechanicalturk - Mechanical Turk - HIT を表示できず、空白で表示されます
Mechanical Turk サンドボックス開発者バージョンでいくつかの画像分類タスクをセットアップしようとしています。HIT (注釈画像) を表示しようとすると、何も表示されません。[Accept HIT] ボタンをクリックしましたが、まだ何も表示されません。
プロジェクトのセットアップに特に問題がないことを確認するために、画像分類を含む他のプロジェクトで HITS を受け入れる作業者としてサインインしました。注釈を付ける画像が表示されるはずの分類プロジェクトで、まだ空白の画像を見続けています。
誰でもこの問題を解決できますか?ありがとう。
python - データを分類し、各カテゴリの平均と標準偏差を計算します
データを分類し、平均と標準偏差を取得するコードを書いています。これが私のデータの例です。
ご覧のとおり、6 つの列があります。ここでは3段階の計算を考えています。
これらの数値を 6 列目に基づいて分類します。6 列目は 0 ~ n の浮動小数点数で構成されます。0~1、1~2、2~3 .... n-1 ~ n のように、n 個のセクション (またはサブ マトリックスなど) を生成したいと考えています。最後の数字は、セクションを作りたいので、最後のデータの切り上げ数にする必要があります。たとえば、最後の番号が 121.2513 の場合、そのデータを含めるには、最後のセクションを 120~121 にする必要があります。
1~5 列目の他のすべての番号を、6 列目に基づいて対応するサブセクションに再割り当てします。特定のセクションに番号がない場合は、0 として出力します。サブセクションの数は n になります。各サブセクションの要素数はランダムです。
サブセクションごとに 3 列目、4 列目、5 列目の平均と標準偏差を取得し、「サブセクション内の要素数、サブセクションの開始数、3 列目、4 列目、5 列目の平均偏差と標準偏差」を出力ファイルに書き込みます。桁'
複数の for ループでこれを試していましたが、複雑になりすぎてエラーになります。データを分類し、各サブセクションで遊んで、Python で出力する他の簡単な方法はありますか? また、for ループがまったく機能しません。このデータを使用した簡単な例の提案はありますか?
php - 2 つの列でグループ化されたテーブルからすべてのデータを取得する - mysql、php
テーブルにあるすべての詳細をフェッチしようとしていますが、それらを2つの異なる列名でグループ化し、phpから同じものをフェッチします
例:
最終的に欲しいもの
最初にカテゴリがグループ化され、id によって並べ替えられます。次に、サブカテゴリがグループ化され、サブカテゴリの昇順で並べ替えられます。
また、phpを使用して同じものを取得するにはどうすればよいですか
私の試み:
mysql:
PHP: