0

私は作業中のIRCボットを持っていますが、それが欲しい機能の1つは、人が投稿したリンクを取得し、BeautifulSoupを使用してそのページを解析することです。これで、ボットが機能し、人々が投稿するメッセージを取得するなどのことができます。しかし、IRCメッセージからリンクを取得するにはどうすればよいですか?誰かがこれを言うと言う:

人:http://www.site.comをチェックしてください、それはクールです!

メッセージの他の部分をプルせずに、リンクを取り出して後で使用するために変数に割り当てるにはどうすればよいですか?

regexsと関係があると思いますが、よくわかりません。

4

2 に答える 2

1

実際、正規表現を使用する必要があります。

URLを照合するための正規表現と、大胆な火の玉で何をしているのかについての説明が記載されたまともな記事があります。

ここで、Djangoがどのようにそれを行うかを見ることができます。

最後に、Pythonの正規表現のドキュメントも役立つ場合があります。

于 2012-07-27T18:42:15.310 に答える
0

あなたはこれを完了するための正確な軌道に乗っています。あなたは自分の質問の最後の文で自分自身に答えを与えました。キャプチャグループで正規表現を使用してURLを取得し、そこからユーザーがircで言ったページを解析/取得できます。

このサイトはあなたのためにいくらか役に立つかもしれません:http://www.regular-expressions.info/

于 2012-07-27T18:36:41.363 に答える