正しい用語を知らないと、物事を検索するのは難しいです:-(
利用可能なすべてのデータが各分類に関連しているわけではありませんが、すべてのタイプのデータが少なくともいくつかの品目クラスの分類に関連している可能性のある分類アプリケーションを調べるように依頼されました。
たとえば、見つかったものすべてを完全に分類する必要がある考古学的掘削ロボットを想像できます。「絶対にすべて」とは、ふるいにかける土、粘土、砂の種類、見つけたさまざまな種類の岩、小石、陶器の破片、見つけた菌類、細菌、土壌生物の種類、および見つけたすべてのアーティファクトを意味します。より直接的には、その地域での以前の人間の活動に関係しています。
So you might have DNA or other analyses that tell you whether those bones are human or animal, and which also apply to the bacteria and fungi, but simply don't apply to the sand and clay and stones. Note that data of any type will always be available for every item analysed and then classified, but will likely be some kind of noisy null value when it is not relevant to classifying an item. That is, there is no basis to classify in advance and generate relevant data selectively. So data is generated uniformly, but with non-uniform relevance. This is what I mean by "non-homogeneous".
これが何と呼ばれるかを知ることができれば、問題へのアプローチ方法と適切な分類手法を見つける可能性が高くなります。「それはXと呼ばれ、[リンク]で建設的な議論があります」という形式の回答は素晴らしいでしょう:-)