問題タブ [fuzzy]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
matlab - 入力は空またはフォーマット文字列である必要があります
こんにちは私はこれでエラーが発生し続けます:
??? ==> textscanの使用エラー2番目の入力は、空またはフォーマット文字列である必要があります。
私はこの方法を試しました:
しかし、エラーが発生します:
artificial-intelligence - ファジー k モード クラスタリング メンバーシップ値の計算
ファジー クラスタ カテゴリ属性に対するクラスタリング アルゴリズムを探していたところ、k モード アルゴリズムが見つかりまし たc平均アルゴリズム?「いいえ」の場合、計算方法を明確にしていただけますか?
よろしくお願いします。
artificial-intelligence - ファジー K モード クラスタリング クラスターの中心を見つける方法
それを実装するために、ファジー k モードアルゴリズム (主に 3 ページを参照)を理解しようとしています。写真に示されているように、彼らが言った
クラスター中心の計算に行き詰まっています
以下が正しいか間違っているかを知る必要があり、訂正してください
クラスターの中心を取得するには、次のことを行う必要があります。
- 変数の各カテゴリについて、カテゴリが属するすべてのポイントのメンバーシップ値の合計をこのクラスタに計算します
- 中央のカテゴリとして設定される最高の取得値
php - PHP で文字列から日付を抽出する
「Joe Soap は 1981 年 2 月 12 日に生まれた」などの任意の文字列から日付を抽出するにはどうすればよいですか?
Python には、この質問python-dateutil
で説明されているように、によって提供される素晴らしいファジー解析機能があります。
PHP で同じタイプの機能を提供するライブラリを探しています。
database - あいまい文字列のマッチング
共通変数「companyname」で、PostgreSQLでマージする必要のある2つのテーブルがあります。残念ながら、会社名の多くは完全には一致していません(つまり、一方のテーブルではMICROSOFT、もう一方のテーブルではMICROSFT)。両方のテーブルで名前を標準化するために、「corporation」、「inc」、「ltd」などの一般的な単語を両方の列から削除しようとしましたが、追加の戦略を考えるのに苦労しています。何か案は?
ありがとう。
また、必要に応じてRでこれを行うことができます。
matlab - MatlabまたはRで重複クラスタ分析を行うには?
サイズが 20 × 300 のバイナリ マトリックスがあります。20 個の変数を 5 つまたは 6 つのグループにクラスター化したいと考えています。これまでのところ、matlab でさまざまな距離メトリックを使用して kmeans と階層的クラスタリング アルゴリズムを使用しましたが、どちらも重複しないクラスターを提供してくれました。私のデータを見ると、一部の変数は複数のグループに配置する必要があります。matlab または R で重複するクラスターを実行する方法があるかどうかは誰にもわかりませんか? どんな助けでも大歓迎です。前もって感謝します!
r - Rの「ファーストネーム・ラストネーム」/「ラストネーム・ファーストネーム」の順序に依存しないファジーマッチング?
別々に収集された、同じ生徒のセットの名前のリストが 2 つあります。誤植が多いので、あいまい一致を使用して 2 つのリストをリンクしています。私は 99+%agrep
と似ていますが、次の基本的な問題で立ち往生しています: どうすれば (たとえば) フォアネーム "Adrian Bruce" と "Bruce Adrian" を一致させることができますか? レーベンシュタイン編集距離は、置換の数をカウントするため、この特定のケースには適していません。
これは非常に一般的な問題に違いありませんが、それに対処するための標準の R パッケージやルーチンが見つかりません。明らかな何かが欠けていると思います...???
matlab - 菅野出力の計算
MATLABが入力に基づいて出力値を計算する方法がわかりません。mamdami関数がどのように機能するか(面積と重心を介して)を理解することができましたが、出力の計算方法を理解することはできません。
以下のリンクは式を示していますが、これを適用する方法がわかりません...すべての重みは1であり、このシステムには現在3つのルールがあります。
http://www.mathworks.co.uk/help/toolbox/fuzzy/fp49243.html
助けていただければ幸いです
sql-server - SQL Server全文:同じように聞こえる人間の名前
たくさんの顧客がいるデータベースがあります。システムのユーザーは、とりわけ、名前で顧客のアカウントを検索できることを望んでいます。
私が行ったことは、CustomerFullTextという新しいテーブルを作成することです。このテーブルには、CustomerIdとnvarchar(max)フィールド「CustomerFullText」があります。「CustomerFullText」では、顧客のすべてのテキスト(名、姓、住所など)を連結し、そのフィールドにフルテキストインデックスを設定して、ユーザーが1つだけ入力できるようにします。検索ボックスと一致する結果を取得します。
これは、多くの異なる列に格納されているデータを検索しようとするよりも良い結果をもたらすことがわかりましたが、これ自体がひどい考えであるかどうかを聞きたいと思います。
多くの人は同じように聞こえますが、綴りが異なる名前を持っています。キャサリンとキャサリンとキャサリン、そしておそらくデータベースに記録されている人はキャサリンですが、ケイトとして自己紹介します。また、マクドナルド対マクドナルド、リズ対エリザベスなど。
したがって、私が行っているのは、元の名前を正しく保存しながら、フルテキストを作成する前に一連の置換を行うことです。そのため、キャサリンやキャセインなどはすべて、全文フィールドで「KATE」に置き換えられます。データベースにクエリを実行する前に、検索パラメータに対して同じ変換を行うため、検索ボックスに「Catherine」と入力すると、データベース内の全文インデックスに対して「KATE」のクエリが実際に実行されます。これは、CatherineとKatherineに一致します。等々。
私の質問は、これは既存のSQL Serverフルテキスト機能の一部を複製しますか?見てみましたが、カスタムステマーやワードブレーカーなどと同じではないと思います。