r - tidytext を使用して txt 形式でトークン化を実現する

Question

texto_revision次の構造を持つ.txtファイルを使用して、tidytextで作業しようとしています:

# A tibble: 254 x 230
   X1     X2     X3     X4    X5    X6    X7    X8    X9    X10   X11   X12   X13   X14   X15   X16  
   <chr>  <chr>  <chr>  <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr> <chr>
 1 la     expro~ de     la    tier~ ocur~ con   frec~ dura~ el    proc~ rapi~ de    la    urba~ en   
 2 como   las    difer~ en    el    moti~ del   cons~ cons~ en    esta~ unid~ y     china afec~ la   
 3 las    desig~ etnic~ en    los   patr~ de    cons~ (pre~ de    vest~ joye~ auto~ han   sido  obje~
 4 este   artic~ exami~ el    impa~ de    vari~ dife~ indi~ en    la    prop~ de    los   cons~ a    
 5 este   artic~ inves~ la    infl~ de    los   regi~ poli~ sobre la    impo~ 
 #   ...

formatを使用しようとするunnest_tokensと、次のコードで:

library(tidytext)

texto_revision %>%
    unnest_tokens(word, text)

次のエラーが表示されます。

エラー: check_input(x) のエラー: 入力は任意の長さの文字ベクトル、またはそれぞれの長さが 1 の文字ベクトルのリストでなければなりません。

エラーを修正してトークン化を続行するために、次のコードを使用してテキストをデータフレームに変換しようとしました。

text_df <- as.data.frame(texto_revision)

しかし、私はまだ次のエラーが発生します

check_input(x) のエラー: 入力は任意の長さの文字ベクトル、またはそれぞれの長さが 1 の文字ベクトルのリストでなければなりません。

r - tidytext を使用して txt 形式でトークン化を実現する

2 に答える 2

Related

Reference