python - quip-api と pandas を使用した Quip スプレッドシートの読み取り

Question

Quip API の調査を開始しました。

以下の詳細を含むスプレッドシートを Quip で作成しました。

スプレッドシートのタイトルを追加しました
スプレッドシートに以下のデータを追加しました:

ID	名前
1	ハリー
2	ハーマイオニー
3	ロン

そして、これが私がQuipから読み取ろうとしている方法です:

import quip
import pandas as pd
import numpy as np
import html5lib

client = quip.QuipClient(token, base_url = baseurl)
rawdictionary = client.get_thread(thread_id)

dfs=pd.read_html(rawdictionary['html'])
raw_df = dfs[0]
raw_df.drop(raw_df.columns[[0]], axis = 1, inplace = True) 
#raw_df.dropna(axis=0,inplace=True)
print(raw_df.replace(r'^\s+$', np.nan, regex=True))

行を nan オブジェクトで削除しようとし、空白文字列を nan に置き換えようとしました。ただし、次のように、これらの null 行と列がデータフレームに表示されていることがまだわかります。

         A         B  C  D  E  F  G  H  I  J  K  L  M  N  O  P
0   id      name                            
1    1    harry                            
2    2  hermione                            
3    3  ron                            
4                                         
5                                         
6                                         
7                                         
8                                         
9                                         
10                                        
11                                        
12                                        
13                                        
14                                        
15                                        
16                                        
17

</p>

質問

Python 経由で Quip スプレッドシートを読み取る最良の方法は何ですか?
余分な行と列を消去し、有効なレコードとヘッダーを持つ行のみを pandas データフレームとして処理する方法idはname?
raw_df.dropna(axis=0,inplace=True)を実行しているときに追加した後print(raw_df)、取得してNoneいます。なんで？

python - quip-api と pandas を使用した Quip スプレッドシートの読み取り

1 に答える 1

Related

Reference