私はPythonで小さなプロジェクトに取り組んでいます。それは2つの部分に分かれています。
最初の部分は、Webをクロールし、情報を抽出してデータベースに挿入する役割を果たします。
2番目の部分は、データベースを使用してこれらの情報を提示する責任があります。両方の部分がデータベースを共有します。第2部では、Flaskフレームワークを使用して、情報をhtmlとして表示し、書式設定やスタイル設定などを行って、見栄えを良くします。
両方の部分のソースファイルは同じパッケージに含まれていますが、このプログラムを適切に実行するには、ユーザーは次のようにクローラーと結果プレゼンターを別々に実行する必要があります。
Pythoncrawler.py
その後
python presenter.py
1つを除いてすべてが大丈夫です。プレゼンターが行うことは、結果をhtml形式で作成し、結果を使用してユーザーのデフォルトブラウザーでページを開くことですが、おそらくrun()メソッドが存在するため、新しいスレッドでFlaskを開始します。物事は私にとって曇ってしまいます。presenter.pyを実行した後に1つのタブ/ウィンドウのみを開くようにするにはどうすればよいかわかりません。
これが私のコードの抜粋です:
from flask import Flask, render_template
import os
import sqlite3
# configuration
DEBUG = True
DATABASE = os.getcwd() + '/database/database.db'
app = Flask(__name__)
app.config.from_object(__name__)
app.config.from_envvar('CRAWLER_SETTINGS', silent=True)
def connect_db():
"""Returns a new connection to the database."""
try:
conn = sqlite3.connect(app.config['DATABASE'])
return conn
except sqlite3.Error:
print 'Unable to connect to the database'
return False
@app.route('/')
def show_entries():
u"""Loads pages information and emails from the database and
inserts results into show_entires template. If there is a database
problem returns error page.
"""
conn = connect_db()
if conn:
try:
cur = connect_db().cursor()
results = cur.execute('SELECT url, title, doctype, pagesize FROM pages')
pages = [dict(url=row[0], title=row[1].encode('utf-8'), pageType=row[2], pageSize=row[3]) for row in results.fetchall()]
results = cur.execute('SELECT url, email from emails')
emails = {}
for row in results.fetchall():
emails.setdefault(row[0], []).append(row[1])
return render_template('show_entries.html', pages=pages, emails=emails)
except sqlite3.Error, e:
print ' Exception message %s ' % e
print 'Could not load data from the database!'
return render_template('show_error_page.html')
else:
return render_template('show_error_page.html')
if __name__ == '__main__':
url = 'http://127.0.0.1:5000'
webbrowser.open_new(url)
app.run()