問題タブ [substring]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
indexing - ディスク部分文字列インデックス上
インデックスを作成したいファイル (具体的には fasta ファイル) があるので、ファイル内の部分文字列をすばやく見つけて、元の fasta ファイル内の場所を見つけることができます。
これは多くの場合、Trie または部分文字列配列を使用して簡単に実行できますが、残念ながら、インデックスを作成する必要がある文字列は 800 MB 以上であるため、メモリ内でそれらを実行することは受け入れられないため、これを作成する合理的な方法を探しています。メモリ使用量を最小限に抑えて、ディスク上にインデックスを作成します。
(明確にするために編集)
私が関心があるのはタンパク質のヘッダーだけなので、関心のある最大のデータベースの場合、これは約 800 MB のテキストになります。
入力文字列に基づいて、O(N) 時間以内に正確な部分文字列を見つけられるようにしたいと考えています。これは 32 ビット マシンで使用できる必要があります。これは、64 ビット マシンを使用することが想定されていないランダムな人々に出荷されるためです。
行内の任意の単語区切りに対して、行の最後までインデックスを作成できるようにしたいと考えています (ただし、行の長さは数 MB になる場合があります)。
これにより、何が必要であり、現在の解決策が明らかにされていない理由が明確になることを願っています。
また、これはJava内から実行する必要があり、さまざまなオペレーティングシステムのクライアントコンピューターで実行する必要があるため、OS固有のソリューションを使用できず、プログラムソリューションでなければならないことも付け加えておく必要があります.
c# - この SubString.PadLeft が何をしているのかわかりません
デバッグ中のこのコードには、次のコード スニピットがあります。
これは何を返しますか?これは実際のクレジット カード アプリケーションの一部であるため、あまり実行できません。名前から想像できるように、DropDownList には 4 桁の年が含まれています。
更新: みんなありがとう。私は .NET 開発をあまりしないので、簡単なテストをセットアップするのは簡単ではありません。
string - Bashで文字列に部分文字列が含まれているかどうかを確認する方法
Bashに文字列があります:
別の文字列が含まれているかどうかをテストするにはどうすればよいですか?
??
不明なオペレーターはどこですか。と を使用echo
しgrep
ますか?
それは少し不器用に見えます。
java - 文字列比較なしで数値部分文字列を数学的に見つける
これはもともと私が仕事で遭遇した問題でしたが、今は自分の好奇心のために解決しようとしているだけです。
可能な限り最も効率的な方法で、int 'a' に int 'b' が含まれているかどうかを調べたいと思います。私はいくつかのコードを書きましたが、何を書いても、それを文字列に解析してから indexOf を使用すると、数学的に行うよりも 2 倍高速です。
メモリは (当然のことながら) 問題ではなく、単に処理速度が速いだけです。
これは私が数学的にそれを行うために書いたコードです:
私が使用している文字列メソッドは次のとおりです。これは、上記の数学的方法よりも優れているようです。
したがって、これは私の仕事を完了するために実際に必要なわけではありませんが、数学的にそれを行う方法をさらに最適化する方法、またはまったく新しいアプローチを誰かが考えられるかどうか疑問に思っていました. 繰り返しますが、メモリは問題ありません。私はただスピードを求めて撮影しています。
誰かがこれについて提供しなければならないものを見たり聞いたりすることに本当に興味があります.
編集: 含むと言うときは、どこにでもあることを意味します。たとえば、findMatch(1234, 23) == true
編集:このがらくたは読めず、不必要だと言っているすべての人のために:あなたは要点を逃しています。重要なのは、興味深い問題を掘り下げることであり、製品コードで使用するための答えを思いつくことではありません。
c++ - Symbian C++ - 記述子に対する部分文字列操作
部分文字列を取得するなど、TDesC 文字列を操作するための推奨/最も簡単な方法は何ですか。
私のシナリオの例を挙げます。
buf から部分文字列を取得したい。では、RBuf16 を直接操作したいのですか? もしそうなら、最善の方法は何ですか?
標準の C 文字列操作を使用できるように、const char* に変換する方法はありますか。
前もって感謝します
regex - Perl を使用して文字列内の部分文字列を見つけるにはどうすればよいですか?
単一の単語を抽出したい文字列がありますが、数値が追加されているため、行ごとに異なる場合があります。
このファイルを解析して、0 から 100 までの「stringXXX」の値を取得したい
上記は行全体を出力します。stringXXX のみを取得したい
string - Perlで人々のフルネームをユーザー名に解析するにはどうすればよいですか?
Parisi、Kennethという形式の名前をkparisiという形式に変換する必要があります。
Perlでこれを行う方法を知っている人はいますか?
異常なサンプルデータは次のとおりです。
Zelleb、CharlesF。,,IV
Eilt、John ,, IV
Wods、CharlesR。,,III
Welkt、CraigP。,,Jr。
これらの特定の名前は、最終的にczelleb、jeilt、cwoods、cwelktなどになります。
これまでのところ、私の名前ビルダー
O'Neil、Paulを台無しにしているもう1つの条件があり
ます。奇妙な/破損した名前が混在している場合、Vinko Vrsalovicの答えが最も効果的ですが、上記の例は「pneil」として表示されます...私がpとnの間にそのoを得ることができない場合、idはjudasの下で酷評されます
php - PHP 文字列内の単語の複数回の出現
文字列をチェックして、その中の単語が複数回出現するかどうかを確認する必要があります。したがって、基本的に私は受け入れます:
「グーグルは恋をする」
しかし、私は受け入れません:
「Google は Google を愛します」または「Google は Google を愛します」など。
何か案は?これにアプローチする方法が本当にわかりません。どんな助けでも大歓迎です。
string - Bash で部分文字列を抽出する
形式のファイル名を指定するsomeletters_12345_moreleters.ext
と、5桁を抽出して変数に入れたいと思います。
要点を強調するために、x 個の文字のファイル名と、両側に 1 つのアンダースコアで囲まれた 5 桁のシーケンス、さらに x 個の文字の別のセットがあります。5桁の数字を変数に入れたいです。
これを実現するさまざまな方法に非常に興味があります。