0

ビジネスでは、PandaSQL を使用してデータを取得する必要があります。コードで約 4 つのクエリを使用しており、基本データ サイズは 2,000,000 です。

コードで次のタイプのクエリを使用しています。変数はダミーですが、構文は同じであることに注意してください。

import pandasql as pdsql    
str1="""select distinct class,year,section,student_name  from student_data where class=%d and year='%s'"""
        str2=str1%(class,year)
        pysql = lambda q: pdsql.sqldf(q, globals())
        df1 = pysql(str2)

現在、コードの実行には 5 分 30 秒かかります。Python 3.x で PandaSQL を使用してこれをより高速に実行するにはどうすればよいですか?

4

0 に答える 0