-2

私はSOFWARE PLAGIARISM DETECTIONに関するプロジェクトを行っています..私は言語 C でそれを行うことを意図しています..そのため、トークンジェネレータとパーサーを作成することになっています..しかし、どこから始めればよいかわかりません..誰でもできるこれで私を助けて..

トークンのデータベースを作成し、プログラムからトークンを分離しました。次にやりたいことは、2 つのプログラムを比較して、盗用されているかどうかを調べることです。そのためには、構文アナライザーを作成する必要があります。どこから始めればよいかわかりません...

つまり、Python で C プログラム用のパーサーを作成したい

4

3 に答える 3

3

Python でパーサーを作成したい場合は、次のライブラリを参照してください:
PLY
pyparsing
Lepl - 新しいが非常に強力です。

于 2010-10-20T12:05:56.777 に答える
1

本物の C パーサーを自分で構築するのは、本当に大変な作業です。

すでに行われているものを見つけることをお勧めします。pycparserまたは、簡単に解析できる C の非常に単純なサブセットを定義します。

C の解析が終わったら、剽窃検出器のためにやるべきことがたくさんあります。

于 2010-10-20T19:29:52.130 に答える
0

探している機能を検出するためにトークン ストリームを解析する必要があるかどうかはわかりません。実際、それはおそらく何よりも物事を複雑にするでしょう。

実際に探しているのは、テストされている疑わしいサンプル コードと非常によく似た一連の元のソース コードです。これは、スパム フィルタリングや言語検出で使用さ れるベイズ分類器の目的と非常によく似ています。

于 2010-10-20T19:55:32.310 に答える