bash - Bash: .csv 形式の国レベルのデータセットが 2 つあり、それらをフィルター処理して共通要素を抽出し、結果をプロットしたいと考えています。

Question

ウィキペディアから国に関する 2 つのデータセットを取得し、それらを LibreOffice calc に貼り付けて、.csv ファイルとして保存しました。例えば：

最初の .csv ファイル:

"Algeria", 76
"Angola", 100
...
"United Arab Emirates", 27

2 番目の .csv ファイル:

"Algeria", .67
"Argentina", .45
...
"Zimbabwe", .57

両方の .csv ファイルにデータポイントがある国のリストをフィルター処理し (重複や別のスペルがないことを前提とします)、2 つのデータポイント (アルジェリアの場合は 76、.67 など) を一致させ、初歩的な散布図を出力して、簡単な視覚的アイデアを得たいと考えています。彼らの関係の。

私はファイルを解析するためにさまざまな方法を試しましたが、そのうちのいくつかはほとんど機能しましたが、awk、grep、bash パイプ、gnuplot などについて十分に知らなかったためにつまずき続けました。

Python や Perl などでより簡単に、またはより適切に実行できると確信しており、最終的に LibreOffice Calc の「ルックアップ」関数を使用することになりましたが、開始したので、bash でどのように実行できるか知りたいと思います。理想的には、データ収集は html を解析することによって自動化されますが、これらのデータセットを pdf テーブルなどで取得することがあります。

どのクラスのポインターも高く評価されます。ありがとう。

bash - Bash: .csv 形式の国レベルのデータセットが 2 つあり、それらをフィルター処理して共通要素を抽出し、結果をプロットしたいと考えています。

1 に答える 1

Related

Reference