最近、特に機械学習アルゴリズムを使用したインターネット トラフィックの分類に関するいくつかの論文を読んでいます。
私はそれについて勉強する予定であり、今学期の機械学習クラスでインターネット トラフィック分類に関するプロジェクトのアイデアを提案したいと考えています。
私の最初のステップは、3 ~ 4 個のクライアントで構成されるローカル ネットワークでデータを収集することです。Wireshark ツールを使用してパケットを盗聴しています。
次のステップは、wireshark パケットから TCP フローを抽出することです。このステップでは、Linux で tcpflow を使用しようとしています。tcpflow は、フローごとに異なるファイルを作成します。ここでは、ファイルの内容はほとんどバイナリであり、これらのファイルから識別子を抽出する方法がわかりません。
誰かが私にアイデアを与えたり、tcpflow ファイルを解釈する方法について彼/彼女の経験を共有したりできますか? あなたの推薦を聞いて、私はさらに嬉しく思います。
前もって感謝します。