古い問題用紙から問題のデータバンクを作成するアプリに取り組んでいます。挿入された同様の質問をリンクする表を維持したかったのです。(私が念頭に置いていたテーブルは、修正済みの事前注文トラバーサル ツリーでした)。
私が持っている要件は次のとおりです。
- 数字が変わった単語の問題は、一緒にリンクする必要があります
- 固有名詞・固有名詞が異なる単語問題は、相互にリンクする必要があります。
- XYZ、ABC、PQR、MNO は同等です (例: 三角形の命名法)
- 句読点や接続詞、「小さな言葉」は無視してください。
- タグ!各質問に件名のタグを付けています。数学の問題が歴史の問題に似ている可能性はまれです。しかし、化学の熱力学の問題は、物理学の熱力学の問題に似ている可能性があります。
物事のアルゴリズム側でどのように進めるかについてのアイデアは非常に高く評価されます.
また、数学表記を含む画像も扱います。すべての画像の 'ALT' 属性に LaTeX が含まれていることを確認して、このアルゴリズムで処理しすぎないようにする必要がありますか、それとももっと良い方法がありますか?