0

10001行のテキストファイルがあります。最初の行には属性の名前が含まれ、次の行には値が含まれています。属性タイプは混合され(文字列と浮動小数点数)、「\t」で区切られます。

そのようなテキストファイルをmatlabにインポートし、さらに分析するためにこれらのデータを適切な構造に整理するための最良の方法を知っている人はいますか?

これらのデータを一部のデータマイニングアプリケーションに使用したいので、各列にメタデータ(変数タイプ、数値/カテゴリ値など)も含めることができれば非常に便利です。

提案ありがとうございます!

4

1 に答える 1

2

名前または整数インデックスによって、列はどのようにインデックス付けされていますか?

最初のケースでは、最良のアプローチはstruct-arrayを使用することです。元のデータの各行の配列要素。答えられるべき2つの質問があります:

  1. フィールドにはどのように名前が付けられますか?ヘッダーを事前に知っていますか?すべてのヘッダー文字列は有効なMATLAB変数名であり、フィールド名として使用できますか?関数genvarnameは、いくつかのシナリオで役立つ可能性があります。

  2. データマトリックスをからの出力としてtextscan構造体配列に変換するにはどうすればよいですか?cell2structMATLABヘルプの関数を見てください。フィールド名(ヘッダー)が本当に動的である場合でもcell2struct、引数セルを動的に作成してから呼び出すことで使用できますcell2struct(args{:})

列に数値のインデックスが付けられている場合は、の出力としてセルマトリックスを使用しますtextscan

メタデータには、構造体または構造体配列である別の変数を使用します。

于 2010-08-05T17:02:07.793 に答える