ビジネスでは、PandaSQL を使用してデータを取得する必要があります。コードで約 4 つのクエリを使用しており、基本データ サイズは 2,000,000 です。
コードで次のタイプのクエリを使用しています。変数はダミーですが、構文は同じであることに注意してください。
import pandasql as pdsql
str1="""select distinct class,year,section,student_name from student_data where class=%d and year='%s'"""
str2=str1%(class,year)
pysql = lambda q: pdsql.sqldf(q, globals())
df1 = pysql(str2)
現在、コードの実行には 5 分 30 秒かかります。Python 3.x で PandaSQL を使用してこれをより高速に実行するにはどうすればよいですか?