次の SQL クエリを変換して、大きな pandas HDFStore で実行しようとしています。
SELECT * FROM mytable
JOIN (
SELECT col1, col2, col3, max(colN) as maxColN
FROM mytable
GROUP BY col1, col2, col3
) m
ON m.col1=mytable.col1 AND m.col2=mytable.col2 AND m.col3=mytable.col3
WHERE colN=maxColN
これを実装する最良の方法は何ですか?col1
、col2
、 にインデックスがありますcol3
。