0

私はRの初心者です。人の名前が付いた2つの列を含むデータでクラスター分析を行う必要があります。データフレームに変換しましたが、文字タイプです。dist()関数を使用するには、データフレームが数値である必要があります。私のデータの例:

     Interviewed.Type                 interviewed.Relation.Type
1.            An1                           Xuan
2.            An2                           The
3.            An3                           Ngoc
4.            Bui                            Thi
5.            ANT                           feed
7.           Bach                            Thi
8.           Gian1                            Thi
9.           Lan5                            Thi
.
.
.
1100.       Xung                           Van

私はあなたの助けに感謝します。

4

1 に答える 1

1

を使用して、文字ベクトルを因子に変換できますfactorlevels因子は基本的に、Rで呼び出される、各数値に関連付けられたテキストを与える属性を伴う数値のベクトルです。生の数値を取得するには、as.numericまたはを使用できます。unclassこれらは、たとえば のような数値を必要とするアルゴリズムに入力できますdist

数値がテキストに関連付けられる順序はほとんど恣意的 (実際にはアルファベット順) であるため、ほとんどのアプリケーションでは数値の違いは意味をなさないことに注意してください。したがって、この結果を呼び出すdistことは技術的には可能ですが、必ずしも意味のあるものではありません。このため、元の投稿者が満足しているように見えても、この回答の作成者は満足していません。:-)

また、異なるベクトルが存在する場合、それぞれを個別に変換すると、同じ数値が異なるテキスト値を表すことになり、その逆も同様です。両方の因子に同じレベルが必要な場合は、さらに注意が必要です。1 つの方法は、両方のベクトルを連結し、それを因子に変換してから、結果を 2 つの因子ベクトルに分割することです。

于 2012-07-09T16:16:48.343 に答える