問題タブ [data-mining]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
1 に答える
293 参照

sql-server - セットアップの一部として「DataMiningAddingforOffice2007」をインストールするにはどうすればよいですか?

DataMining Adding forOffice2007をインストールするために必要なセットアッププログラムを作成しています。

1)すでにインストールされているかどうかを検出するにはどうすればよいですか?

2)インストールされていない場合は、MSI(SQLServer2008_DMAddin.msi)をダウンロードして実行します。しかし、サーバー構成(Microsoft.SqlServer.DataMining.Office.ServerConfiguration.exe)ツールを自分で実行し、ユーザーが初めてExcelを開いたときにアドインに質問をさせないようにするにはどうすればよいですか?

0 投票する
6 に答える
1382 参照

sorting - テキストをデータマイニングするにはどうすればよいですか?

これが問題です。文章の段落と段落を含む大きなテキスト ファイルがたくさんあります。各段落には、数人の人物 (名前) への参照が含まれており、いくつかのトピック (場所、オブジェクト) が文書化されています。

この山をデータマイニングして、分類されたライブラリを組み立てるにはどうすればよいですか? ...一般的に、2つのこと。

  1. 何を探しているのかわからないので、最もよく使われる単語/複数の単語 (「Jacob Smith」または「bluewater inn」または「arrow」) を取得するプログラムが必要です。

  2. 次に、キーワードを知っているので、関連するパラグラフを検索し、結果を並べ替えて絞り込むのに役立つプログラムが必要です (手動で)。

0 投票する
6 に答える
55371 参照

text - テキストで使用されているキーワードを抽出するにはどうすればよいですか?

大量のテキストをデータマイニングして、使用法ごとにキーワードを取得するにはどうすればよいですか? (「ジェイコブ・スミス」または「フェンス」)

そして、これを行うソフトウェアはすでにありますか?半自動でも、「the」、「and」、「or」などの単純な単語を除外できれば、トピックにすばやく到達できます。

0 投票する
2 に答える
1056 参照

php - 字句解析ライブラリ

文章が肯定的か否定的かを認識できるソフトウェアを作りたいです。

字句解析ライブラリはありますか?

どこから始めればいいのかよくわかりません。

0 投票する
5 に答える
442 参照

algorithm - 多くのページから同様のテキストを取得するには?

多数のテキストから 1 つのテキストに最も類似した x 個のテキストを取得します。

ページテキストに変更する方が良いかもしれません。

遅すぎるため、テキストをすべてのテキストと比較しないでください。

0 投票する
2 に答える
720 参照

f# - FORTRAN または C (またはマネージド コード) のデータマイニング モデル?

Windows 用のデータマイニング パッケージを開発する予定です。プログラムコア/計算エンジンはF#で開発され、GUI関連/DBバインディングなどはC#とF#で行われます。

ただし、モデルの実装についてはまだ決定していません。高いパフォーマンスが必要なため、ここではマネージ コードを使用できない可能性があります (異論はありますか?)。問題は、モデルを FORTRAN で開発するのが合理的か、それとも C (または C++) にこだわるべきかということです。適切なモデルのために、ある時点で OpenCL を使用することを検討しています。これらの状況で、マネージド コード -> FORTRAN -> C -> OpenCL 呼び出しから移動する必要があるのはおかしいと感じています。

推奨事項はありますか?

0 投票する
7 に答える
229 参照

algorithm - ユーザーの反応を評価するためのアルゴリズム

自動車の写真を分類するために使用される Web アプリケーションに取り組んでいます。ユーザーにはさまざまな車両の写真が表示され、見たものについて一連の質問に答えるよう求められます。結果はデー​​タベースに記録され、平均化されて表示されます。

グループに頻繁に投票しないユーザーを特定するのに役立つアルゴリズムを探しています。これは、おそらく写真に注意を払っていないか、自分が見ているものについて嘘をついていることを示しています. 次に、これらのユーザーを除外し、結果を再計算して、既知の信頼度で、この特定の写真がこれとあれの車両を示していると言えるようにします。

この質問は、そのようなアルゴリズムをどこで見つけるか、またはそのようなアルゴリズムを設計するための理論的背景を自分自身に与えるために、すべてのコンピュータ サイエンス関係者に向けられています。確率と統計、おそらくデータマイニングを学ぶ必要があると思います。いくつかの本の推奨事項は素晴らしいでしょう。ありがとう!

PS これらは多肢選択問題です。

これらはすべて良い提案です。ありがとうございました!スタック オーバーフローで複数の正解を選択できる方法があればいいのにと思います。

0 投票する
1 に答える
432 参照

algorithm - ソーシャルネットワークで友達を分類する

私は次
の問題に直面しています。たとえば、 uがソーシャルネットワークユーザーであり、友人のリストF(u)があるとします。パーティションは関数F->Gであり、Gは高校、大学、職場などのグループのセットです。F
を分割するアルゴリズムを考え出す必要があります:

  • 入力はFであり、Fのすべてのf ( uの各友達の友達のリスト)のF (f)でもあります。
  • 実行中、アルゴリズムはuの質問をすることができます(たとえば、「特定のユーザーvに最適なグループは何ですか?」)。
  • 質問の量は最小限に抑える必要があります(最小限の数は実際には明確な数ではありませんが、友人の数の5%はほぼ正しいように思われます)。

明らかに、結果のパーティションは最適ではありませんが、後の改良の開始点として受け入れられるはずです。

どんな考えでも大歓迎です

編集:いいえ、宿題ではありません。宿題には、より明確に定義された要件と目標機能があると思います。とにかくいいえ、これは実際に私が直面している現実の問題です。

また、私はそれを少し単純化したかもしれませんが、実際にはユーザーは多くのグループの一部である可能性があります(したがって、F-> P(G)のようになります。ここで、P(G)はGの場合のパワーグループです)、より良いアルゴリズムそれを行うことができるでしょう。

0 投票する
1 に答える
258 参照

sql-server - ナレッジディスカバリーとデータマイニングとは?

SQLクエリは「生データ」をフェッチすると思います...

SQL サーバーでのデータ マイニングに関して、何か良い点はありますか?

MS-SQL サーバー 2005、2008 ですぐに使用できる KDD アルゴリズムはありますか?

0 投票する
12 に答える
165884 参照

text - 非常に単純でグラフィカルな方法で、誰かがコサインの類似性の例を挙げてもらえますか?

ウィキペディアの余弦類似度の記事

ここにベクトルを (リストか何かで) 示してから、計算を行って、それがどのように機能するかを見てもらえますか?