問題タブ [normalize]

For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.

0 投票する
0 に答える
885 参照

internet-explorer - TinyMCE とブートストラップの競合

tinyMCE エディターを使用してサイトの記事コンテンツを編集し、bootstrap.css を使用してコンテンツをスタイリングしています。Internet Explorer でそれを行うと、いくつか問題が発生します。TinyMCE は、幅と高さの属性を設定するネイティブ ブラウザー メソッドによって画像のサイズを変更します。しかし、Bootstrap は normalize.css を使用します。これは、画像の幅と高さをリセットし、IE の幅と高さの属性を壊します。これを避けるにはどうすればよいですか?記事のコンテンツをサーバーに送信する前に属性をスタイルに変換する必要がありますが、getContent イベントの挿入ハンドラーは役に立ちません

0 投票する
2 に答える
1314 参照

java - わずかに異なる複数のファイルから複数の列をマップする

Talend のバッチ ETL ジョブのスキーマがわずかに異なる複数のファイル間でメタデータの正規化に取り組むための実用的な方法を探しています。

Excel ファイルごとに約 100 から 150 列の数百の履歴レポート (それぞれ約 25K から 200K レコード) があります。ほとんどの列名はすべてのファイルで同じですが (98% 重複)、微妙な違いがあります。

  • 異なる列の順序
  • 異なる列名 (略語を使用する場合と使用しない場合があります)
  • 異なる列数
  • 列の単語間にスペースがある場合もあれば、ドット、ダッシュ、またはアンダースコアがある場合もあります

特殊なアプリケーションを作成したり、すべてのファイルを手動で修正してブルートフォースしたりする以外に、ファイル列名間の差分と修正をインテリジェントまたは半自動化された方法で提供する優れた無料のツールまたは方法はありますか?

0 投票する
1 に答える
771 参照

string - WP7 で文字列からアクセントを削除する方法

Windows Phone 7 の文字列からアクセント (分音符号) を削除したいです。ここでの解決策は .NET (デスクトップ バージョン) で機能します。ただし、WP7 文字列にはNormalizeメソッドがありません。

誰かが string から byte への変更を提案していますが、彼が何を意味するのかわかりません。アクセントを取り除くには?

0 投票する
7 に答える
25211 参照

javascript - JavaScriptで正の数のリストを正規化する方法は?

正のint値で満たされた配列がありますが、このリストを正規化して最大値が常に100になるようにするにはどうすればよいですか?前もって感謝します!

0 投票する
1 に答える
822 参照

sql - XSLTとSQLServerによって生成されたXMLを正規化するためのキーの使用方法

SQLServerからデータをXMLとしてクエリすると、重複するXMLノードが生成されることがよくあります。多くの場合、クエリを微調整してこれを排除できますが、常にそうとは限りません。できないときは、次のようなXMLになります。

属性が同じである2つの<House>ノードが隣り合っていることに注意してください。それらは子ノードのみが異なります。同一の兄弟ノードを取得し、それらをすべての子ノードのスーパーセットを含むものに折りたたむXSLTを作成しようとしています。この例では、<House houseId = "3">には、<Dog>ノードと<Human>ノードの両方が含まれます。このような:

2つの同一のHouseノードが結合されただけでなく、重複したDogノードとHumanノードが結合されました。ただし、2つの異なる<House>ノードの下にリストされている<Dog dogId = '13' name ='Rover'>ノードは、同一ではないため、結合されていないことに注意してください。(彼らの祖先のために。)それが私が目指していることです:一致する兄弟ノードを組み合わせます。

XMLはSQLによって生成されるため、XSLTはさまざまな名前と配置のノードを処理します。したがって、ノード名をハードコーディングすることはできません。ただし、すべてのノードには、数値を含む対応するid属性があります。例:<House houseId = "3">、<Dog dogId = "17">、および<Flea fleaId="13">。
また、ルートノードには属性がないこともわかっているので、ルートの子であるノードの処理を開始できます。

私の戦略は、ノードごとにxsl:keyを作成することです。ここで、ノードのkey-valueは、その祖先ノードとid値の連結です。キー値の例は以下のコメントにあります

したがって、<Dog dogId = '13' name ='Rover'>の2つの一見一致するオカレンスは、それらの祖先によって区別されます。

<Xml> <House houseId = "3"> <Dog dogId = '13' name ='Rover'>

houseId = 3; dogId = 13

対。

<Xml> <House houseId = "5"> <Dog dogId = '13' name ='Rover'>

houseId = 5; dogId = 13

これにより、重複(兄弟)ノードを組み合わせることができます。残念ながら、XSLとxslt:keyを使用してこれを実装する方法を理解するのに苦労しています。どんな助けでも大歓迎です。

0 投票する
1 に答える
150 参照

math - スケールに正規化

データの 2 次元配列 ( C ) があり、C(:,1)にはC(:,2) に対応する値があります。C(:,2)は、0.0001:0.0001:1、つまり 10,000 の値から変化します。d(log(C(i,1))) / d(log(C(i,2)))を計算する必要があります。これは単純にlog(C(i,1)) / log(C (i,2)) . しかし、C(i,2) が 1 に近づくと、分母がゼロに近づき、商が急増します。これを抑える 1 つの方法は、パラメーターを使用して正規化することですが、その方法がわかりません。誰かがこれについて考えを持っていますか?

0 投票する
2 に答える
6024 参照

css - Twitter ブートストラップでスタイルシートを正規化する

Twitters Bootstrap を使用しているプロジェクトを開始したばかりで、独自のリセット ルールがあるかどうか疑問に思っていました。

通常、私は自分のサイトがより一貫性のあるクロスブラウザーに見えるように正規化スタイルシートを挿入しますが、Bootstrap ではこれが必要ですか?

0 投票する
1 に答える
445 参照

javascript - javascript で既存のデータセットを正規化する最も効率的な方法

正規化したいフラットなデータセットがあります。データセットは存在し、ソースは変更できないため、より良いデータ構造を定義することはできません。データを「正規化」して再構築することはできましたが、行数が増え始めたときにどれだけ効率的かわかりません。これが私が持っているものです。私が言ったように、よりエレガントなソリューションを探すだけで機能します...

理想的な出力は次のようになります

ここにjsFiddleへのリンクがあります

0 投票する
1 に答える
738 参照

sql - 食品のデータベースを作成するには、どのような方法がよいでしょうか?

私は、現代の料理で使用するすべての基本的な食材を含む関係データベースを作成するプロジェクトを引き受けました. ご想像のとおり、何千ものアイテムが存在することになります。私はSQLの経験があまりないので、材料を保存する一見効率的な方法にたどり着くのに苦労しています. http://en.wikipedia.org/wiki/Outline_of_food_preparation#General_ingredientsにアクセスすると、現在データベースに入れようとしているリストが表示されます。

現在のデータベースには、食品のすべてのメインおよびサブカテゴリのテーブルがあります。穀物用のテーブルと小麦用の別のテーブル。最初はこれで問題ないように思えましたが、サブカテゴリがさらに数十あることに気付きました。その Wiki リストの項目ごとに、さらに多くのテーブルを作成する必要があります。このように大量のテーブルがあると、プロジェクトが非常に非効率になると思います。データベースを作成するより良い方法はありますか? それとも私は正しい軌道に乗っていますか?私のテーブルの列の例を次に示します。

親 INT(11) は、親テーブルが何であれ外部キーになるため、すべてこの方法で接続されると考えました。どんなアドバイスでも大歓迎です!〜ありがとう

0 投票する
5 に答える
23944 参照

preprocessor - ニューラル ネットワーク入力用のテキスト文字列の処理

ANN 入力を正規化、標準化などする必要があることは理解しています。さまざまな ANN の特性とモデルはさておき、{0,1} の範囲内または範囲 {-1, 1}ニューラルネットワークへの入力として与えられる前に?Google でこれを検索していますが、情報が見つかりません (間違った用語を使用している可能性があります)。

  1. それは理にかなっていますか?
  2. それが、ニューラル ネットワーク用にテキストを前処理する方法ではないでしょうか。
  3. 代替手段はありますか?

2013 年 11 月の更新

私は長い間、ピートの答えを正しいものとして受け入れてきました。しかし、主にシンボリック知識と ANN について行ってきた最近の調査のために、私は深刻な疑問を抱いています。

Dario Floreano と Claudio Mattiussiは、著書の中で、分散エンコーディングを使用することで、このような処理が実際に可能であると説明してい。

実際、グーグルの学者で検索してみると、シンボリック知識をエンコードするために脳が分散エンコードを使用すると仮定されている神経科学の記事や論文が大量に存在します。

Teuvo Kohonenは、論文「Self Organizing Maps」で次のように説明しています。

ニューラル適応法則をシンボル セット (ベクトル変数のセットと見なされる) に適用すると、シンボル間の「論理距離」を表示する地形図が作成されると考える人もいるかもしれません。しかし、連続データと比較してシンボルの性質が異なるという問題が生じる。後者の場合、類似性は、連続エンコーディング間のメトリックの違いとして、常に自然な方法で表示されます。これは、メトリックが定義されていない単語などの個別の象徴的なアイテムには当てはまりません。記号の意味がその符号化から切り離されるのは、記号の性質そのものです。

しかし、Kohonen は SOM のシンボリック情報をうまく処理できました。

さらに、Alfred Ultsch 博士は論文「The Integration of Neural Networks with Symbolic Knowledge Processing」で、ANN での記号知識 (テキストなど) の処理方法を正確に扱っています。Ultsch は、シンボリック知識を処理するための次の方法論を提供します: ニューラル近似推論、ニューラル統合、イントロスペクション、および統合知識取得。とはいえ、グーグルの学者やその他の場所にあるものについては、ほとんど情報が見つかりません。

彼の答えのピートは、セマンティクスについて正しいです。通常、ANN のセマンティクスは切り離されています。ただし、以下の参考文献は、研究者が RBM をどのように使用して、異なる単語入力のセマンティクスの類似性を認識するように訓練したかについての洞察を提供します。したがって、セマンティクスを持つことは不可能ではありませんが、セマンティクスが必要な場合は、階層化されたアプローチまたは二次 ANN が必要になります。 .

Subsymbolic Neural Networks による自然言語処理、Risto Miikkulainen、1997 Word Observations に関する制限付きボルツマン マシンのトレーニング、GEDahl、Ryan.P.Adams、H.Rarochelle、2012

2021 年 1 月の更新

NLP とディープ ラーニングの分野では、過去数年間、そして私がその質問をして以来、研究が復活しています。現在、私が達成しようとしていたことをさまざまな方法で解決する機械学習モデルがあります。

ディープ ラーニングまたはニューラル ネットワークでテキストを前処理する方法について疑問に思っているこの質問にたどり着いた人のために、いくつかの役立つトピックを次に示します。いずれもアカデミックではありませんが、理解しやすく、同様のタスクの解決を開始するのに役立つトピックです。

私がその質問をしたとき、RNN、CNN、および VSM が使用され始めようとしていました。現在、ほとんどのディープ ラーニング フレームワークは広範な NLP サポートをサポートしています。上記がお役に立てば幸いです。