ここから Google 検索の履歴をダウンロードしましたが、JSON ファイル (utf-8 でエンコード) の分音記号 (ラテン拡張文字) がめちゃくちゃです。
例えば:
dva na ôsmu
として表示されます
dva na �smu
Sublime Text で JSON intedation パッケージを使用すると、次のようになります。
dva na \ufffdsmu
すべての特殊文字は、この同じ壊れた文字に置き換えられます。これを修正する方法はありますか? Google が壊れた JSON をエクスポートしているだけなので、英語以外のユーザーはこのエクスポートを使用できませんか? 検索で使用された単語の統計を表示するアプリを作成したいのですが、このように壊れた JSON で可能になりました。