R言語で、文字列のエンコードを指定する方法について解説します。文字列の操作には、tidyverseパッケージに含まれているstringrパッケージを使用するのが便利です。ここでは、stringrパッケージのstr_conv()を使用した方法についてお伝えします。
str_conv()の概要
str_conv()は、文字列のエンコードを指定するための関数です。str_conv()は、文字列の現在のエンコードをオーバーライドする便利な方法です。
str_conv()の使い方
stringr::str_conv()の使い方は次になります。
str_conv(string, encoding)
str_conv()の引数の意味
string
文字ベクトルまたは文字ベクトルに変換可能なものを指定します。
encoding
エンコーディングの名前を指定します。
完全なリストについては、stringi::stri_enc_list()を参照してください。
準備
あらかじめ、tidyverseパッケージを読み込んでおきます。
library(tidyverse)
str_conv()の使用例
s <- rawToChar(as.raw(177))
s
[1] "\xb1"
str_conv(x, "SHIFT_JIS")
[1] "キ"
str_conv(x, "ISO-8859-1")
[1] "·"
R×stringr::str_conv 文字列のエンコードを指定する