回答の内容に従ってタグ付けされた何千もの調査回答があります。各応答には 1 つまたは複数 (最大 20) のタグを付けることができ、タグはカテゴリ-サブカテゴリなどに構造化されるのではなく、互いに独立しています。
以下のような分析ができるようになりたいです。
- 特定のタグのインスタンスはいくつありますか?
- 全体で最も頻繁に発生するタグはどれですか?
- タグ X が存在する場所で、他のどのタグが最も頻繁に表示されますか?
- すべてのタグのリストとその横にある各タグの数
- 同様の分析を行うデータのサブセットを選択します (国別など)。
私が一緒に働いている人々は、伝統的にすべてを Excel で取り組んできました (一般的なビジネス戦略のコンサルティング業務)。この場合、それはうまくいきません。彼らの対応は、プロジェクト フレームワークを Excel がピボット テーブルで処理できるものに変更することですが、より洗練された関係を可能にする、より堅牢なツールを使用できれば、はるかに優れています。
私は SQLite を学んでいますが、やりたいことがかなり複雑になるのではないかと恐れ始めています。
私は Python も学んでおり (別の理由で)、ORM ツールといくつかの Python コードがより良い方法ではないかと考えています。
そして、Access のようなものがあります (私は持っていませんが、この種のものに最適な場所である場合は、喜んで取得する可能性があります)。
要約すると、これらの種類の分析を全体的に行うのがどれほど難しいか、またどのツールがその仕事に最も適しているかを知りたい. 私は、問題の一部またはすべてについて後ろ向きに考えているという考えに完全にオープンであり、私がここに書いたことのあらゆる側面に関するアドバイスを歓迎します.