11

私はPythonで小さなプロジェクトに取り組んでいます。それは2つの部分に分かれています。

最初の部分は、Webをクロールし、情報を抽出してデータベースに挿入する役割を果たします。

2番目の部分は、データベースを使用してこれらの情報を提示する責任があります。両方の部分がデータベースを共有します。第2部では、Flaskフレームワークを使用して、情報をhtmlとして表示し、書式設定やスタイル設定などを行って、見栄えを良くします。

両方の部分のソースファイルは同じパッケージに含まれていますが、このプログラムを適切に実行するには、ユーザーは次のようにクローラーと結果プレゼンターを別々に実行する必要があります。

Pythoncrawler.py

その後

python presenter.py

1つを除いてすべてが大丈夫です。プレゼンターが行うことは、結果をhtml形式で作成し、結果を使用してユーザーのデフォルトブラウザーでページを開くことですが、おそらくrun()メソッドが存在するため、新しいスレッドでFlaskを開始します。物事は私にとって曇ってしまいます。presenter.pyを実行した後に1つのタブ/ウィンドウのみを開くようにするにはどうすればよいかわかりません。

これが私のコードの抜粋です:

from flask import Flask, render_template
import os
import sqlite3


# configuration
DEBUG = True
DATABASE = os.getcwd() + '/database/database.db'

app = Flask(__name__)
app.config.from_object(__name__)
app.config.from_envvar('CRAWLER_SETTINGS', silent=True)



def connect_db():
    """Returns a new connection to the database."""
    try:      
        conn = sqlite3.connect(app.config['DATABASE'])
    return conn
except sqlite3.Error:
    print 'Unable to connect to the database'
    return False


@app.route('/')
def show_entries():
    u"""Loads pages information and emails from the database and
    inserts results into show_entires template. If there is a database
    problem returns error page.
    """
    conn = connect_db()


    if conn:        
    try:            
        cur = connect_db().cursor()

        results = cur.execute('SELECT url, title, doctype, pagesize FROM pages')    
        pages = [dict(url=row[0], title=row[1].encode('utf-8'), pageType=row[2], pageSize=row[3]) for row in results.fetchall()]   


        results = cur.execute('SELECT url, email from emails')
        emails = {}


        for row in results.fetchall():                
            emails.setdefault(row[0], []).append(row[1])                

        return render_template('show_entries.html', pages=pages, emails=emails)

    except sqlite3.Error, e:
        print ' Exception message %s ' % e
        print 'Could not load data from the database!'
        return render_template('show_error_page.html')


else:
    return render_template('show_error_page.html')        


if __name__ == '__main__':
    url = 'http://127.0.0.1:5000'
    webbrowser.open_new(url)
    app.run()
4

1 に答える 1

30

Mac OS X (Safari、Firefox、および Chrome ブラウザーを使用) で同様のコードを常に使用していますが、問題なく動作します。Flask の自動リロード機能を実行している可能性があると推測します。設定debug=Falseすると、自動リロードを試みません。

私の経験に基づく他の提案:

  • 使用するポートをランダム化することを検討してください。編集-実行-テストのクイック ループでは、OS がポート 5000 がまだ使用中であると認識していることがあります。(または、誤ってコードを同時に数回実行した場合、ポートは実際にはまだ使用されています。)
  • ブラウザー リクエストを開始する前に、アプリが起動するまで少し待ちます。を呼び出すことでそれを行いthreading.Timerます。

これが私のコードです:

import random, threading, webbrowser

port = 5000 + random.randint(0, 999)
url = "http://127.0.0.1:{0}".format(port)

threading.Timer(1.25, lambda: webbrowser.open(url) ).start()

app.run(port=port, debug=False)

(これはすべて の下if __name__ == '__main__':、または必要に応じて別の「アプリの起動」機能にあります。)

于 2012-06-20T19:09:51.880 に答える