私は、症状に基づいて患者を正しい診断に分類できるデータ マイニング アプリケーションを作成しています。私が必要とする最も適切なデータセットは何か、どこから入手できるかを誰かが知っているかどうか疑問に思っていました. 特定の領域 (心臓病、糖尿病など) に特化する方が良いアプローチですか、それとも病気以外のすべてのタイプに基づいて患者を全体的に分類する必要がありますか? 理想的には、データセットが患者の医者への訪問に基づいていることを望みます。したがって、症状と診断を含める必要があります。ただし、年齢、性別などの他の属性を含むデータセットを取得できれば、さらに良いでしょう。誰かが私を助けて、適切なデータセットを教えてくれるなら、私はそれを感謝します.
1 に答える
1
そこにはいくつかのサンプルデータセットがあります。
たとえば、Wekaには糖尿病データを含むデータセットがあります。変数は次のとおりです。
% 1. Number of times pregnant
% 2. Plasma glucose concentration a 2 hours in an oral glucose tolerance test
% 3. Diastolic blood pressure (mm Hg)
% 4. Triceps skin fold thickness (mm)
% 5. 2-Hour serum insulin (mu U/ml)
% 6. Body mass index (weight in kg/(height in m)^2)
% 7. Diabetes pedigree function
% 8. Age (years)
% 9. Class variable (0 or 1)
また、公開されているリソースのリストについては、このページを参照してください (医学的背景を持つものもあります)。
于 2013-01-15T19:29:15.833 に答える