Quip API の調査を開始しました。
以下の詳細を含むスプレッドシートを Quip で作成しました。
- スプレッドシートのタイトルを追加しました
- スプレッドシートに以下のデータを追加しました:
ID | 名前 |
---|---|
1 | ハリー |
2 | ハーマイオニー |
3 | ロン |
そして、これが私がQuipから読み取ろうとしている方法です:
import quip
import pandas as pd
import numpy as np
import html5lib
client = quip.QuipClient(token, base_url = baseurl)
rawdictionary = client.get_thread(thread_id)
dfs=pd.read_html(rawdictionary['html'])
raw_df = dfs[0]
raw_df.drop(raw_df.columns[[0]], axis = 1, inplace = True)
#raw_df.dropna(axis=0,inplace=True)
print(raw_df.replace(r'^\s+$', np.nan, regex=True))
行を nan オブジェクトで削除しようとし、空白文字列を nan に置き換えようとしました。ただし、次のように、これらの null 行と列がデータフレームに表示されていることがまだわかります。
A B C D E F G H I J K L M N O P
0 id name
1 1 harry
2 2 hermione
3 3 ron
4
5
6
7
8
9
10
11
12
13
14
15
16
17
</p>
質問
- Python 経由で Quip スプレッドシートを読み取る最良の方法は何ですか?
- 余分な行と列を消去し、有効なレコードとヘッダーを持つ行のみを pandas データフレームとして処理する方法
id
はname
? raw_df.dropna(axis=0,inplace=True)
を実行しているときに追加した後print(raw_df)
、取得してNone
います。なんで?