問題タブ [character-replacement]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
sed - 「;」をすべて削除 SED を使用した C++ コメント内
私は初めてでsed
、それを使用してすべての「;」を削除することはできません C++ ファイルのコメント内の文字、つまり文字列 "//" で始まる行または文字列を含む行 (既に "/* ... */" コメントを "// ..." コメントに変換しています)。
例えば :
そして、私はしたい:
私のC++ファイルのコメントについて。
********* 編集 *********
これは、2 つのステップで SED を使用したソリューションです。AWK を使用したソリューションも回答で利用できます。
- すべてのコメントを改行してください:
sed 's/\/\//\n\/\//g'
- 削除する ';' "//" で始まる行のみ:
sed '/^\/\// s/;//g'
regex - 正規表現の間の文字列を置き換えます
次の内容の csv ファイルがあります。
INTERB-MNT,2008-09-10T21:05:38Z,2008-09-10T21:05:38Z,MARIA
ファイルの内容が次のように変更されるように、文字とsed
を置き換えるにはどうすればよいですか?:'T'
'Z'
INTERB-MNT,2008-09-10,21:05:38,UTC,2008-09-10,21:05:38,UTC,MARIA
私は次のことを試しましたが、望ましい結果が得られないため、明らかに何かが欠けています:
sed -e 's/[0-9]{4}-[0-9]{2}-[0-9]{2}.T.[0-9]{2}:[0-9]{2}:[0-9]{2}Z/[0-9]{4}-[0-9]{2}-[0-9]{2},[0-9]{2}:[0-9]{2}:[0-9]{2}UTC/g'
javascript - Javascript:すべての「\」文字を「」に置き換える方法
「\」文字を空の「」に置き換えようとしましたが、できません。それを解決する方法は?
これが私のコードです
python - Pythonでバイトペアエンコーディングバイグラムのカウントと置換を効率的に行うには?
Byte Pair Encodingアルゴリズムには、スペースで区切られた文字列をバイグラムに変更する置換ステップがあります。
str
つまり、次のようなタプルのリストが与えられた場合:
そして文字列タプル:('i', 's')
すべてのタプルキーを反復処理して に置き換えるようにリストを処理するにはどうすればよい('i', 's')
です('is')
か? 、つまり、出力Counter
は次のようになります。
私はこれを試しました:
しかし、各単語をループしてから文字列に変更して置換し、再度分割してからタプルにキャストするよりも効率的な方法はありますか?
正規表現の置換はより高速でしょうか? 文字列を扱わずにタプルのリストを操作する方法はありますか?
これを試してみましたが、文字列をに置き換えることstr.replace
は問題ではないようです。それは実際にバイグラムを数えて抽出しています:
これは、norvig.com/big.txtでテストされています
[アウト]:
私はすでにscikit-learn
CountVectorizer を試しましたが、 を使用するほど高速ではないようです。Python での Fast/Optimize N-gram implementations をzip
参照してください。
また、ステップでそれらfilter
の操作がないCounter
と、さらに時間がかかりました。Counter 操作は反復ごとに 3 秒かかります =(
この操作を他にどのように最適化できますか?
java - 一連の文字を別の一連の文字にそれぞれ置き換えます
Javaを使用して、 などの一連の文字を 、 、 、 、 ... 、 を使用して文字ごとに ( 、 、 ... 、 )などの別のシリーズにそれぞれ置き換え{a,b,...,x}
たい{α,β,...,ω}
と考えています。a
α
b
β
x
ω
だから私はこのコードを使用し、正しく動作します:
より良い方法はありますか (例: を使用regex
)? また、パフォーマンスにも参加しています。
r - 位置と新しい文字を含むマトリックスを使用して、特定の位置で参照文字列の文字を置き換える方法は?
文字列内の定義された位置にある文字を置き換えたい R スクリプトのヘルプが必要です。定義された位置と置換文字はマトリックスに保持されます。
私は Bioconductor パッケージを頻繁に使用しましたが、実際のプログラミングは行っていません。他の言語の経験がないので、できればRを使いたいです。
これが私の例の文字列です (30 bp 参照アミノ酸 (AA) シーケンス):
以下は data.frame の例です。
サンプル <- read.csv("samples.csv")
列 1 はサンプル番号です。サンプル 1 ~ 10 をリストしました。次の列のラベルは、参照シーケンス内の位置に対応しています。各行には、サンプルの AA が含まれています。
私の出力は、サンプルの一意の完全なシーケンスになります。マトリックスに含まれる情報を使用して、各サンプルのリファレンス シーケンスの AA を置き換え、シーケンスを出力する必要があります。
私が始めるのに役立つ提案はありますか? 私のサンプル セットは大きく、225 個のサンプルと 60 個のポリモーフィック サイトがあります。前もって感謝します。