0

R では、Tabulizer ライブラリを使用して Pdf テーブルからデータを抽出しています。名前はネパール語で、抽出後、このテーブルを取得します [1]: https://i.stack.imgur.com/Ltpqv.png

しかし今、私はその列 2 の名前を英語の同等のものに変更したい

Rでこれを行う方法はありますか

私が書いたRコードは

library(tabulizer)
location <- "https://citizenlifenepal.com/wp-content/uploads/2019/10/2nd-AGM.pdf"
out <- extract_tables(location,pages = 113)
##write.table(out,file = "try.txt")
final <- do.call(rbind,out)  

final <- as.data.frame(final) ### creating df 
col_name <- c("S.No.","Types of Insurance","Inforce Policy Count", "","Sum Assured of Inforce Policies","","Sum at Risk","","Sum at Risk Transferred to Re-Insurer","","Sum At Risk Retained By Insurer","") 
names(final) <- col_name

final <- final[-1,]
write.csv(final,file = "/cloud/project/Extracted_data/Citizen_life.csv",row.names = FALSE)
View(final)```

4

1 に答える 1

1

ドキュメントが非 Unicode エンコーディングを使用しているようです。この Web サイトhttps://www.ashesh.com.np/preeti-unicode/では、適切なフォントが読み込まれていれば、一部のネパール語エンコーディングを Unicode に変換できます。これは R で適切に表示されます。コードの出力で試してみたところ、問題ないように見えましたが、ネパール語はわかりません。

> out[[1]][1,2]
[1] ";fjlws hLjg aLdf"

その文字列の内容を変換すると、

सावधिक जीवन बीमा

ドキュメントのそのページのテキストのように見えます。実際に正しく書かれている場合、それを英語に変換するには、翻訳を行うためにネパール語を話す人が必要です。うまくいけばそれはあなたですが、Google翻訳を使用すると、次のようになります

Term life insurance

だからここに私の提案があります: そのwww.ashesh.com.npウェブサイトの所有者に連絡して、彼らがあなたに翻訳規則を与えることができるかどうか調べてください. 他の人が見つけられない場合は、それらを実装する R 関数を作成します。次に、英語の翻訳を手動で行います。

于 2021-01-13T11:27:38.453 に答える