python - PandaSQL でクエリを最適化するにはどうすればよいですか?

翻译自：https://stackoverflow.com/questions/48948063 2018-02-23T12:35:44.407

136 次

ビジネスでは、PandaSQL を使用してデータを取得する必要があります。コードで約 4 つのクエリを使用しており、基本データサイズは 2,000,000 です。

コードで次のタイプのクエリを使用しています。変数はダミーですが、構文は同じであることに注意してください。

import pandasql as pdsql    
str1="""select distinct class,year,section,student_name  from student_data where class=%d and year='%s'"""
        str2=str1%(class,year)
        pysql = lambda q: pdsql.sqldf(q, globals())
        df1 = pysql(str2)

現在、コードの実行には 5 分 30 秒かかります。Python 3.x で PandaSQL を使用してこれをより高速に実行するにはどうすればよいですか?

python - PandaSQL でクエリを最適化するにはどうすればよいですか?

0 に答える 0

Related

Reference