現在、HTML ページのメタ ブロックから情報を取得する python ボットに取り組んでいます。メタ ブロックのコンテンツを取得しましたが、それを 2 つの異なる文字列に解析しようとしています。
コンテンツの例は次のとおりです。
Lowercase Words WITH UPPERCASE CONTAINING 2 AND ALSO ', AND MANY MORE CHARACTERS
これまでのところ、私は持っています:
lowercase = ' '.join(w for w in content.split() if (not w.isupper()) and (not w.isdigit()))
uppercase = ' '.join(w for w in content.split() if (w.isupper() or w.isdigit()))
大文字の文字列には、「Lowercase」または「Words」という単語以外のすべてが含まれることを意味します
私はこの種の問題について多くの助けを見つけることができませんでした.誰かがトリックや回避策を知っているかどうか疑問に思っていました. ありがとう