“findall”の関連問題_Stack Overflow日本語サイト

0 投票する

3 に答える

533 参照

python - Python - re.findall が望ましくない結果を返す

これは結果のみ[89]を返し、89% 全体を返す必要があります。それを行う方法はありますか？

2013-04-16T19:39:14.080

0 投票する

1 に答える

836 参照

python - Python - findall で最長のシーケンスを見つける

findall を使用してパターンの最長一致を見つけたいと思います。いくつかの解決策を見つけましたが、re.matchまたはのみですre.finditer。誰かアドバイスをください。

python regex findall

2013-04-17T08:04:51.570

0 投票する

2 に答える

669 参照

python - Python で re.findall を使用して、各行のパラメーターのセットではなく、1 つのパラメーターのセットを出力する

以前readlinesはファイル内のすべての文を分割していましたre.findallが、それらを調べてその中の大文字を見つけたいと思っています。ただし、取得できる唯一の出力は、すべての文の大文字のセットですが、ファイル内の各文の大文字のセットが必要です。

現時点では for ループを使用してこれを試みていますが、これがこのタスクの最善の方法であるかどうかはわかりません。

入力：

これは私が出力として得ているものです：

出力を取得したい：

これを行う方法はありますか？以下の分にコーディングを入れました。ありがとう！

python for-loop findall

2013-04-17T17:32:55.207

0 投票する

2 に答える

149 参照

python - 文のファイルを行ごとに分割し、findall を使用して特定のパラメーターを抽出する

私は文のファイルを調べて、それらの文の中から行ごとに大文字を抜き出そうとしています。

私が取り組んでいるデータファイルは次のとおりです。

基本的には、行ごとに 'SUBJ'、'VERB'、'OBJ' を出力するプログラムが必要です。ただし、現在取り組んでいるスクリプトの各行では、出力は、その行の大文字だけではなく、各行のファイル内のすべての大文字です。

これが私が今得ている出力です：

行 0:the dog_SUBJ bit_VERB the cat_OBJ

ライン1：the man_SUBJ ran_VERB

2行目：the cat_SUBJ ate_VERB the cheese_OBJ

たとえば、0 行目、'SUBJ'、'VERB'、'OBJ' を、その行にあるものとしてプログラムに出力させたいとします。

現時点で使用しているスクリプトは次のとおりです。

ありがとう！

python findall

2013-04-19T11:24:49.980

0 投票する

1 に答える

4718 参照

python - 美しいスープでfind_allのみを使用してテキストを表示する方法は?

美しいスープを使用して div からテキストを表示するための非常に簡潔なソリューションがあり、findここでは https://stackoverflow.com/a/8994150/1063287 :

result = soup.find('div', {'class' :'flagPageTitle'}).text

次のシナリオで同じロジックを適用したいと考えています。

content = original_content("div","class1 class2")

これを次のように変更すると:

content = original_content("div","class1 class2").text

エラーが発生しています：

AttributeError: 'ResultSet' object has no attribute 'text'

上記のように find_all を使用しているシナリオで、最初に示したのと同じロジックを使用する方法を教えてください。（入力しないショートカットを使用していることに注意してください。こちらfind_allを参照してください）

ありがとうございました。

python text python-2.7 beautifulsoup findall

2013-04-20T09:11:15.400

0 投票する

2 に答える

554 参照

grails - Grails: ArrayList - 取得速度

内の特定の属性コレクションを見つける現在動作中のメソッドで速度の問題に取り組んでいArrayListます。サイズによっては、リスト内の値を見つけるのに 7 秒以上かかる場合があります。

より大量のデータを処理できるように、このプロセスを高速化する必要があります。どんな援助でも大歓迎です。これが私の例です。

方法：

crmMapping コンテンツ

"[{ATTRIBUTE=AcademicIndex, INTEGRATION_TAG=Contact~nAcademic_Index}, {ATTRIBUTE=AcademicInterest, INTEGRATION_TAG=Contact~msplAcademic_Interest},.......]"

grails arraylist findall collect

2013-04-26T16:06:14.740

0 投票する

4 に答える

532 参照

python - re.findall が文字列内のトリプレット項目の検索に固有でないのはなぜですか。パイソン

だから私は4行のコードを持っています

私が最初にやろうとしていることを説明させてください。. . 混乱させて申し訳ありませんが、説明するために最善を尽くします。

だから私は、「ATG」で始まり、その後に「TAA」、「TAG」のいずれかに遭遇するまで、任意の単語文字の 3 単位が続くシーケンスを探しています [例えば、「GGG」、「GTT」、「TTA」など]または 'TGA'また、少なくとも 30 文字の長さにしたいと考えています。. . したがって、{9,}?

これはある程度機能しますが、seqにATG GAA GTT GGA TGA AAG TGG AGG TAA AGA GAA GAC GTT TGAがあることに気付いた場合

したがって、この場合、最初の「ATG」から始まり、次の「TAA」、「TAG」、または「TGA」まで進むと、「ATGGAAGTTGGATGA」が見つかるはずです。

ただし、コードの OR_0 行を実行すると、seq 文字列全体が吐き出されます。最初の 'TAA'、'TAG'、または 'TGA' とそれに続く最初の 'ATG' のみを考慮するようにする方法がわかりません

3 単位で読み取ったときに「ATG」の後に別の「ATG」が続く場合は問題ありません。最初からやり直す必要はありませんが、3 単位で読み取ったときに「TAA」、「TAG」、または「TGA」に遭遇した場合停止する必要があります。

私の質問は、「TAA」、「TAG」、または「TGA」の最初の出現ではなく、「ATG」xxx-xxx-[「TAA」、「TAG」または「TGA」] の最長シーケンスを見つける re.findall の理由です。 3 ? 単位の単語文字で区切られた ATG の後

繰り返しますが、これが紛らわしい場合は申し訳ありませんが、このテキストの最初の行に基づいて私が持っている複数のデータセットを台無しにしており、その理由を見つけようとしています.

python regex string findall

2013-04-28T07:48:51.223

0 投票する

2 に答える

159 参照

python - スラッシュからスペースまたは文字までの文字列を検索

たとえば、スラックとブラケットまたは「]」の間にある文字列を見つける方法を知りたいです。

si アイデアは、最初のとだけを取得することxx@xx.xxです。+44648474dataxx@xx.xxthisworddata2

私はこの正規表現を試しました：

しかし、それは戻ってき<xxx@xx.xx>)て<thisword>

取得したいのは、 xx @xx.xxとthiswordです

python regex findall

2013-04-29T12:57:21.203

問題タブ [findall]

Reference