問題タブ [pattern-finding]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
algorithm - 画像内の最大の凸状の黒い領域を見つける
私はこれが小さな切り抜きである画像を持っています:
ご覧のとおり、黒い背景に白いピクセルです。これらのピクセル (または点) の間に想像上の線を描くことができます。これらの線で領域を囲むことができます。
この画像で白いピクセルを含まない最大の凸状の黒い領域を見つけるにはどうすればよいですか?
これは、最大の凸状の黒い領域によって私が意味することの小さな手描きの例です:
PS: 画像はノイズではなく、10000000 未満の素数を水平方向に並べたものです。
string - 文字列内の構造を見つける
私の最初の投稿を見ていただきありがとうございます。相当な長さの文字列の中で、その文字列を構造のコンポーネントに分割できるパターンを見つける必要があります。この質問は、DNA には遺伝子をコードする領域とコードしない領域がある生物学的配列に関連しています。使用できる文字は A、C、G、T のみです。コーディング領域と非コーディング領域が不明であると仮定します。したがって、目標は、コーディング領域と非コーディング領域の区別を可能にするストリング内のパターンを見つけることです。実際には、既知のコーディング領域がありますが、この情報がない場合にこの問題にどのようにアプローチするかを理解したいと思いました. いくつかのアイデアがありますが、経験豊富なプログラマーや数学者がこれにどのようにアプローチするかを知りたかったのです。私は初心者のプログラマーで、数学のバックグラウンドがないので、皆さんから学びたいと思っています。ご清聴ありがとうございました。
regex - Solrクエリがスペースを含む入力に対して機能しないが、分析フェーズからの出力は機能するように見える
ここで詳しく説明されている問題に行き詰まっています。ベッドとバスの情報を格納するテキスト フィールドがあり、インデックスを作成するときに、2 つのベッドと 3 つのバスに対してそれぞれ 2b 3bt のような値を格納します。最後に、「2 ベッド 3 バス」、「ベッド 2 3 バス」、「2 ベッド ルーム 3 バス」、「2bd 3bth」などのクエリをサポートする必要があります。
これを達成するために、以下のように text_general タイプのテキスト フィールドを使用します。
管理インターフェイスでSolrクエリを試してみましたが、「6ベッド6バス」または「6ベッドルーム6バスルーム」のような中間スペースが同時に「6ベッド6バス」で正しい場合を除いて、すべての組み合わせでほとんど正常に機能しています結果。これは、このクエリのsolrに渡したパラメーターを含むURLです
これらのケースのそれぞれについて、Solr 管理分析インターフェースを確認しましたが、違いはまったく見つかりませんでした。分析フェーズで同じ結果が生成されるため、これらのクエリは両方とも同様に機能することを期待していました。これら2つのクエリが同じように動作しないのはなぜですか?
これは、問題の 2 つのクエリの solr 管理者分析インターフェイスに表示されるものです。
入力と出力の例- 上記のフィールド定義を使用して試した入力の例をいくつか示します。注: (#) は単なるシリアル番号であり、入力の一部ではありません。
上記はすべて今でも問題なく機能しています。現在のフィールド定義でまだ懸念されている入力をいくつか示します
同じシリアル番号の順序で分析フェーズ後に上記の入力に対して期待する出力は次のとおりです (2beds 3 baths のインデックスを作成している間、データを 2b 3bt としてインデックス付けします)。
しかし、この時点までは、Solr 管理者の分析インターフェイスで確認したのとまったく同じ出力を分析で生成できるので、うまくやっていると思います。ここでの本当の問題は、クエリを取得して正しい検索結果を取得できることです。入力の最初のセクション (つまり) #5 までですが、#6 から #9 までの入力については結果が得られません
これは、入力 #1 で試したサンプル クエリ形式です。例) 2beds 3baths Fresno
そして、これは#6用です。つまり)2ベッド3バスフレズノ
string - 部分文字列のテキストファイル内のすべての文字列を確認します
私は長い間検索してきましたが、私の問題に役立つものは見つかりませんでした。簡単に聞こえるかもしれませんが、誰かが私を助けてくれたらとても嬉しいです:
テキストファイル内のすべての文字列に特定の部分文字列が含まれているかどうかを証明するバッチ スクリプトを作成したいと考えています。この場合、この部分文字列を含む文字列全体を出力する必要があります。私が探している文字列は、二重引用符で囲まれています。
私のコードはテキストファイルのすべての行で機能しますが、すべての文字列で必要です。
事前にthx!
dm-script - パターン画像(バイナリファイル)を探す
DigitalMicrograph の文字列変数の場合、「find」関数を使用して特定のパターンの位置を見つけることができます。
同じことをしたいのですが、画像データを使用します。たとえば、次のようにイメージを作成できます
見つけたいパターンは
上記のケースでは、データに対するパターンのオフセットが列番号 64 にあることがわかっています。実際のケースでは、そのような単純なパターン (つまり、直線) はありません。「for」ループを使用した残忍なアプローチは確かに機能しますが、データ サイズが大きくなると、非常に遅くなります。誰もがより良い/エレガントな提案をしていますか? 1D画像の方が簡単かもしれませんが、2D画像はどうですか?
どうもありがとう!
java - 文字配列内のセルの座標を見つける
2D char テーブルのセルの座標を見つけるにはどうすればよいですか。たとえば、私のテーブルが次のように表示されるとします。
- ……@@@@……
- .........@@@.....
- ……@@@@……
これは 3x3 の正方形を生成するため、2 行目の 2 番目の「@」を見つけたいと考えています。私が見つけようとしている正方形は、3x3、5x5 の奇数でできています...そして、同じ寸法の 2 つの正方形が隣り合っている場合は、それらを分離する必要があります。
すべての値をテーブルに格納していて、奇数を見つけるためc[row][column]
に使用することを考えましたが、どのように座標を見つけて、2 つの正方形が隣り合っている場合に繰り返されないようにするかわかりません。mod 2=1
これまでのところ、私は持っています:
java - Java、ファイル内のパターンを見つけて行全体を読み取るにはどうすればよいですか?
ファイル内の特別な文字シーケンスを見つけたいのですが、出現箇所の行全体を読みたいと思っています。
次のコードは、最初の行をチェックし、この (最初の) 行を取得します。どうすれば修正できますか?
パターンとファイルはパラメーターです