テーブルに挿入するときにUnicode文字列をUTF-8にデコードしたい。これが私が持っているものです:
('\u0645\u064e\u062b\u0652\u0646\u064e\u0649 \u00a0\u062c \u0645\u064e\u062b\u064e\u0627\u0646\u064d')
したがって、これらの値をUTF-8に変換する必要があります。次に例を示します。
INSERT INTO `nouns`(`NOUNID`, `WORDID`, `SINGULAR`, `PLURAL`) VALUES (781, 3188, '\u0646\u064e\u062c\u0652\u0645', ('\u0646\u064e\u062c\u0652\u0645'))
h2データベースをMySQLに移行しているので、h2dbのスクリプトを作成するときにこれを取得しました。
INSERT INTO PUBLIC.NOUNS(NOUNID, WORDID, SINGULAR, PLURAL) VALUES
(1, 5, STRINGDECODE('\u0623\u0628\u0651 '), STRINGDECODE
('\u0623\u0624\u064f\u0628\u0651')),
(2, 9, STRINGDECODE('\u0623\u064e\u0628\u0627\u0628'), ''),
基本的に、これらの\ u0623 \ u0632 \ u0651は、Unicode表現のアラビア文字であり、データベースにそのように格納するために、実際のアラビア文字に変換したいと思います。私は変換関数を試していましたが、mysqlを初めて使用するため、これを実現できませんでした。
SELECT CONVERT(_ucs2'\u0623' USING utf8);