Keras の Sequential モデルを使用してシーケンスを予測したい。私のデータフレームには文字列データが含まれているためLabelEncoder
、sklearn ライブラリから使用して文字列データをエンコードすることにしました。
このコードスニペットを試しました:
import pandas as pd
df = pd.read_csv("sample-03.csv")
from sklearn.preprocessing import LabelEncoder
df.apply(LabelEncoder().fit_transform)
この結果を与える:
このラベル エンコーディングは、異なる値を持つ各列に適用されます。つまり、データセット全体でhttp://example.com/296を「2」と表す必要があります。解決策を提案していただければ幸いです。
また、データセットをタプルに変換し、このデータセットに辞書を使用しようとしましたが、キーは異なる列の同じ値に対して一意ではありません。