問題タブ [categorization]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - スーパーセットを分割し、各パーティションの元のセットのリストを取得する
序章
グラフ内のノードでいくつかの分類を行おうとすると(レンダリングが異なります)、次の問題に直面しました。
問題
要素のスーパーセットとその素でないサブセットS = {0, 1, ... M}
の数が与えられた場合、と呼ばれるセットの分割を見つけるための最良のアルゴリズムは何ですか?n
T_i
0 <= i < n
S
P
P = S
は、元のスーパーセットのすべての互いに素なパーティションの和集合であり、すべての要素について、すべてが「元の」セットの中で同じ「親」のリストを持つようになります。P_j
S
0 <= j < M
x in P_j
x
T_i
例
したがって、すべてP_j
は次のようになります。
質問
- すべて
P_j
のsとその「親」のリストを計算するためのPythonパッケージの優れた関数/クラスは何ですか?理想的にはとに制限されnumpy
ていscipy
ますか?おそらく、それを実行する関数がすでに存在します - それらのパーティションと、それぞれの「親」のリスト
P_j
を見つけるための最良のアルゴリズムは何ですか?注意しましょうT_0 = S
力ずくのアプローチは、セットの2つの組み合わせをすべて生成しT
、それらを最大3つの互いに素なセットに分割し、それらをセットのプールに追加して、結果のすべてのが互いに素にT
なるまでプロセスを繰り返すことだと思いますT
。私たちは答えに到達しました-セットのP
セット。少し問題があるのは、そこに行く途中ですべての「親」をキャッシュすることです。
動的計画法のアプローチを使用してアルゴリズムを最適化できると思います。
注:私は(MathJaxを介して)ラテックスで数学の部分を書くのが好きでしたが、残念ながらこれはアクティブ化されていません:-(
text - ブログエントリから性別を分類するためのテキスト分類
「テキスト解析」について研究しています。これで一連のコーパスができ、各ファイルの作成者の性別がわかります。では、分類器 (ベイズ、SVM...) の特徴ベクトルを構築する方法。または、このトピックに関する有用なドキュメントを提案していただけますか? ありがとうございました!
ruby - Rails3を使用した分類の構成
ユーザーにカテゴリを割り当てられるようにしたい(最大2つ、1つを許可)。このユーザーによる投稿には、同じカテゴリのリスト(私のアプリでは職業と呼ばれます)から1つのカテゴリのみを割り当てたいと思います。
現在、ユーザー、投稿、および職業モデル間に単純なbelongs_toおよびhas_manyの関連付けを使用して、それぞれに1を割り当てることができるように構成しています。これは、1つの職業の割り当てしか必要としないため、投稿には問題なく機能しますが、ユーザーには2つの能力が制限されます。
ユーザーのビューには、職業のアイテムが入力された2つのドロップダウンリストがあります。2つの異なる職業を選択できますが、職業の価値を保持するのは1つだけです。両方を保持するか、1つだけが選択されている場合は1つだけを受け入れます。私の主な制限は、ユーザーデータベースには、profession_idを参照するprofession列が1つしかないことです。職業列を複製できないので、2番目の職業フィールドを追加できるように設定するにはどうすればよいですか?
または、これを実現するためにデータベースの設計とモデルをどのように変更する必要がありますか?
user.rb:
post.rb:
profession.rb:
umbraco - Umbraco - 分類のための究極のピッカー
私は umbraco の簡単なプロジェクトに取り組んでおり、カテゴリ セクションが必要です。そういうわけで、カテゴリー用のページを作り始めました。Web サイトでは、究極のピッカーを使用してカテゴリを選択しています。この時点までは、すべて問題なく、Web サイトのページで選択したカテゴリを確認できます。
私の問題は、ファッション カテゴリ ページの下にすべてのファッションの選択された Web サイトをリストすることです。この例は見つかりませんでした。この件でお役に立てば幸いです。
classification - Weka 動的文分類
WEKAでこれを行うことができるかどうか(およびその方法)についてヒントを教えてください。
たくさんの文があり、分類しなければならない新しい文を受け取ります。
既存のカテゴリは、既存の文に基づいて作成されます。まず、これらのカテゴリを作成する方法は?
次に、新しい文が来たら、それを以前に作成されたカテゴリ (新しいものではない) のいずれかに分類するにはどうすればよいでしょうか。
database - キーワードで分類するよりスマートな方法はありますか?
私たちのサイトにはユーザー生成コンテンツがあり、ユーザーはハッシュタグを使用してコンテンツを分類できます。コンテンツの検索を容易にするために、次のような「関心」カテゴリを作成することを考えています。
これを実現する 1 つの方法は、キーワードを各インタレスト カテゴリに関連付けることです。したがって、ユーザーが Hobbies をクリックすると、システムは Hobbies に関連付けられた次のようなキーワードを検索します。
ただし、ユーザーは「セクシー」という言葉を本文に含むホットロッドの写真を投稿でき、当社のシステムでは「セクシー」という言葉は「セックス」と「ファッションと美容」の 2 つのインタレスト カテゴリに関連付けられているため、この方法には限界があるようです。 .
この方法をよりスマートにする方法について何か提案はありますか? または、企業がこのようなものをどのように実装するかについての提案/アドバイスはありますか?
mediawiki - コンテンツを整理するための mediaWiki カテゴリとサブページ
検索機能と明確さのために、コンテンツをカテゴリ別に明確に分類できる Wiki を作成したいと考えています。
ランダムな例として、すべてのサイトが特定の時点での映画監督の状況を説明しているウィキを取り上げてみましょう。次のような組織ロジックを持つページがあります: Year > Month > director's situation
, だけでなくYear > Month > Day > director's situation
とYear > director's situation
.
1976年 > 9月 > ウディ・アレン: アレン氏はアニー・ホールを撃っていた。
1977 > ウディ・アレン: アレン氏はその年に○歳になりました。
1979年 > 2月 > ウディ・アレン: アレン氏はマンハッタンを切り刻んでいた。
これはばかげた例ですが、要点はわかります。そのため、時間枠ごとに異なるコンテンツの Woody Allen ページがあります。私の実際のアプリケーションのタイトルは名前ほど明白ではなく、さまざまなページの一意の識別であるため、優れた検索機能を実現したいと考えています。私の質問は、コンテンツの明確な分類を考えると、mediaWiki でこれを達成するための最良の戦略は何ですか?
- カテゴリの階層 (例: 年 > 月 > 日: ディレクター) とサブページの対応する階層 (年/月/日/ディレクター) を作成します。
- カテゴリの階層を作成し、「ディレクター、年、月、日」のようなページ タイトルのみを作成します。
- サブページですべてを整理するだけです。
- ....
私は#1を選びます。カテゴリの階層によりクリーンな検索が可能に+incategory:"Category Name"
なり、サブページの階層によりきれいなページ タイトルが可能になります (特にカテゴリに長い名前がある場合)。このソリューションに落とし穴はありますか?
java - テキスト分類分類子
優れたオープンソースのテキスト分類モデルを知っている人はいますか?スタンフォード分類器、ウェカ、マレットなどについて知っていますが、それらはすべてトレーニングが必要です。
ニュース記事をスポーツ/政治/健康/ゲームなどに分類する必要があります。事前にトレーニングされたモデルはありますか?
Alchemy、OpenCalaisなどはオプションではありません。オープンソースツール(できればJava)が必要です。
regex - SAS Content Categorization Studio で 2 つの正規表現を使用できません
SAS Content Categorization Studio で作業しています。多数の一致を返すために、それぞれ 1 つの正規表現で構成される 2 つの概念を取得しようとしています。1 つは日付を検索するためのもので、もう 1 つは特別にフォーマットされた数値を検索するためのものです。
書式設定された数値を検索する正規表現 (後者) は、日付を検索する正規表現 (前者) がアクティブであるかコメントアウトされていない限り、ヒットを返しません。日付の正規表現をコメントアウトするとすぐに、後者は再び機能し続けます。それらは相互に排他的であるようです。誰が私が間違っているのか教えてもらえますか?
sql - SQL/PLSQL の 1 つのステートメントで複数の列を分類する方法
次のように分類したい20列のテーブルがあります。
私は 20 case ... when ステートメントを使用しないことを好みます。これをより動的かつ効率的に行う方法を知っている人はいますか? SQL または PL/SQL を指定できます。
PL/SQL をいくつか試しましたが、列名を変数として使用する簡単な方法が見つかりませんでした。
どうもありがとう。
フランス