問題タブ [findall]
For questions regarding programming in ECMAScript (JavaScript/JS) and its various dialects/implementations (excluding ActionScript). Note JavaScript is NOT the same as Java! Please include all relevant tags on your question; e.g., [node.js], [jquery], [json], [reactjs], [angular], [ember.js], [vue.js], [typescript], [svelte], etc.
python - Python - re.findall が望ましくない結果を返す
これは結果のみ[89]
を返し、89% 全体を返す必要があります。それを行う方法はありますか?
python - Python - findall で最長のシーケンスを見つける
findall を使用してパターンの最長一致を見つけたいと思います。いくつかの解決策を見つけましたが、re.match
またはのみですre.finditer
。誰かアドバイスをください。
python - Python で re.findall を使用して、各行のパラメーターのセットではなく、1 つのパラメーターのセットを出力する
以前readlines
はファイル内のすべての文を分割していましたre.findall
が、それらを調べてその中の大文字を見つけたいと思っています。ただし、取得できる唯一の出力は、すべての文の大文字のセットですが、ファイル内の各文の大文字のセットが必要です。
現時点では for ループを使用してこれを試みていますが、これがこのタスクの最善の方法であるかどうかはわかりません。
入力:
これは私が出力として得ているものです:
出力を取得したい:
これを行う方法はありますか?以下の分にコーディングを入れました。ありがとう!
python - 文のファイルを行ごとに分割し、findall を使用して特定のパラメーターを抽出する
私は文のファイルを調べて、それらの文の中から行ごとに大文字を抜き出そうとしています。
私が取り組んでいるデータファイルは次のとおりです。
基本的には、行ごとに 'SUBJ'、'VERB'、'OBJ' を出力するプログラムが必要です。ただし、現在取り組んでいるスクリプトの各行では、出力は、その行の大文字だけではなく、各行のファイル内のすべての大文字です。
これが私が今得ている出力です:
行 0:the dog_SUBJ bit_VERB the cat_OBJ
ライン1:the man_SUBJ ran_VERB
2行目:the cat_SUBJ ate_VERB the cheese_OBJ
たとえば、0 行目、'SUBJ'、'VERB'、'OBJ' を、その行にあるものとしてプログラムに出力させたいとします。
現時点で使用しているスクリプトは次のとおりです。
ありがとう!
python - 美しいスープでfind_allのみを使用してテキストを表示する方法は?
美しいスープを使用して div からテキストを表示するための非常に簡潔なソリューションがあり、find
ここでは https://stackoverflow.com/a/8994150/1063287 :
result = soup.find('div', {'class' :'flagPageTitle'}).text
次のシナリオで同じロジックを適用したいと考えています。
content = original_content("div","class1 class2")
これを次のように変更すると:
content = original_content("div","class1 class2").text
エラーが発生しています:
AttributeError: 'ResultSet' object has no attribute 'text'
上記のように find_all を使用しているシナリオで、最初に示したのと同じロジックを使用する方法を教えてください。(入力しないショートカットを使用していることに注意してください。こちらfind_all
を参照してください)
ありがとうございました。
grails - Grails: ArrayList - 取得速度
内の特定の属性コレクションを見つける現在動作中のメソッドで速度の問題に取り組んでいArrayList
ます。サイズによっては、リスト内の値を見つけるのに 7 秒以上かかる場合があります。
より大量のデータを処理できるように、このプロセスを高速化する必要があります。どんな援助でも大歓迎です。これが私の例です。
方法:
crmMapping コンテンツ
"[{ATTRIBUTE=AcademicIndex, INTEGRATION_TAG=Contact~nAcademic_Index}, {ATTRIBUTE=AcademicInterest, INTEGRATION_TAG=Contact~msplAcademic_Interest},.......]"
python - re.findall が文字列内のトリプレット項目の検索に固有でないのはなぜですか。パイソン
だから私は4行のコードを持っています
私が最初にやろうとしていることを説明させてください。. . 混乱させて申し訳ありませんが、説明するために最善を尽くします。
だから私は、「ATG」で始まり、その後に「TAA」、「TAG」のいずれかに遭遇するまで、任意の単語文字の 3 単位が続くシーケンスを探しています [例えば、「GGG」、「GTT」、「TTA」など]または 'TGA'また、少なくとも 30 文字の長さにしたいと考えています。. . したがって、{9,}?
これはある程度機能しますが、seqにATG GAA GTT GGA TGA AAG TGG AGG TAA AGA GAA GAC GTT TGAがあることに気付いた場合
したがって、この場合、最初の「ATG」から始まり、次の「TAA」、「TAG」、または「TGA」まで進むと、「ATGGAAGTTGGATGA」が見つかるはずです。
ただし、コードの OR_0 行を実行すると、seq 文字列全体が吐き出されます。最初の 'TAA'、'TAG'、または 'TGA' とそれに続く最初の 'ATG' のみを考慮するようにする方法がわかりません
3 単位で読み取ったときに「ATG」の後に別の「ATG」が続く場合は問題ありません。最初からやり直す必要はありませんが、3 単位で読み取ったときに「TAA」、「TAG」、または「TGA」に遭遇した場合停止する必要があります。
私の質問は、「TAA」、「TAG」、または「TGA」の最初の出現ではなく、「ATG」xxx-xxx-[「TAA」、「TAG」または「TGA」] の最長シーケンスを見つける re.findall の理由です。 3 ? 単位の単語文字で区切られた ATG の後
繰り返しますが、これが紛らわしい場合は申し訳ありませんが、このテキストの最初の行に基づいて私が持っている複数のデータセットを台無しにしており、その理由を見つけようとしています.
python - スラッシュからスペースまたは文字までの文字列を検索
たとえば、スラックとブラケットまたは「]」の間にある文字列を見つける方法を知りたいです。
si アイデアは、最初の と だけを取得 することxx@xx.xx
です。+44648474
data
xx@xx.xx
thisword
data2
私はこの正規表現を試しました:
しかし、それは戻ってき<xxx@xx.xx>)
て<thisword>
取得したいのは、 xx @xx.xxとthiswordです