0

だから私は奇妙な切り捨ての問題を抱えています! これに関する特定の答えが見つかりません。

したがって、基本的には、UTF-8 が指定された列に挿入すると、残りのテキストが切り捨てられる明らかな ISO 文字 ½ に問題があります。

私の文字列が「1/2 カップの水を追加する必要があります」であるとしましょう。MySQLはそれを「追加する必要があります」に切り捨てます

もし私が:

print iconv("ISO-8859-1", "UTF-8//IGNORE", $text);

次に、次のように出力します。

½

O_o

1/2 だけが必要なので、それはうまくいきません。phpMyAdmin に移動してその文をコピー アンド ペーストして送信すると、文字列全体が半分の記号と残りのテキストでそこにあるので、魅力的に機能します! 何かが間違っていて、それが何なのか戸惑っています。これがおそらく他のキャラクターに影響を与えることはわかっているので、根本的な問題に対処する必要があります.

私が使用している言語はphpで、ファイル自体はUTF-8としてエンコードされており、持ち込んでいるデータのコンテンツタイプはISO-8859-1に設定されています。列は utf8_general_ci で、すべての mysql 文字セットは php で UTF-8 に設定されています: "SET character_set_result = 'utf8', etc..."

4

3 に答える 3

4

コード内の何かが文字列を UTF8 として処理していません。PHP/HTML、DB への接続、または DB 自体である可能性があります。すべてを一貫して UTF8 に設定する必要があります。 UTF8/非 UTF8 の境界を越える場合に参照してください。

あなたのDBはUTF8に準拠していると仮定します - それはチェックするのが最も簡単です. 照合順序は、サーバー レベル、データベース レベル、テーブル レベル、およびテーブル内の列レベルで設定できることに注意してください。列に UTF8 照合を設定すると、ストレージのために他のものをオーバーライドする必要がありますが、UTF8 でない場合は、DB と通信するときに他のものも開始されます。よくわからない場合は、開いた後に明示的に接続を UTF8 に設定してください。

$dbh->setAttribute(PDO::MYSQL_ATTR_INIT_COMMAND, "SET NAMES 'utf8'");

DB と接続が UTF8 になりました。Web ページも UTF8 であることを確認してください。繰り返しますが、これは複数の場所 (.htaccess、php.ini) で設定できます。よくわからない場合やアクセス権がない場合は、ページの上部で PHP がデフォルトとして選択しているものをオーバーライドしてください。

<?php ini_set('default_charset', 'UTF-8'); ?>

ページからテキストが出力される前に、最初に上記のことが必要であることに注意してください。テキストが出力されると、エンコーディングを試して指定するには遅すぎる可能性があります。サーバーのデフォルトにすでにロックされている可能性があります。また、ヘッダーでこれを繰り返します(おそらくやり過ぎです):

<head>
<meta charset="UTF-8">
<meta http-equiv="Content-type" content="text/html; charset=UTF-8">
</head>

そして、データを取得しているフォームでもそれをオーバーライドします:

<FORM NAME="utf8-test" METHOD="POST" ACTION="utf8-test.php" enctype="multipart/form-data" accept-charset="UTF-8">"

正直なところ、エンコーディングを一番上に設定した場合、他のオーバーライドは必要ないというのが私の理解ですが、何も壊れないので、とにかくそれらを保持します。サーバーに仮定をさせるよりも、明示的にエンコードしてください。

最後に、phpMyAdmin に文字列を挿入したところ、期待どおりに見えたとのことですが、phpMyAdmin ページが UTF8 であることは確かですか? そうではないと思います。PHP コードから UTF8 データを保存すると、phpMyAdmin で生の 8 ビット文字のように表示されます。同じ文字列を取得して phpMyAdmin に直接保存すると、「正しい」ように見えます。したがって、phpMyAdmin は、必ずしも UTF8 ではなく、ローカル サーバーのデフォルトの文字セットを使用していると思います。

たとえば、私の Web ページから保存された次の文字列:

I can¹t wait

私のphpMyAdminで次のように読みます:

I can’t wait

そのため、phpMyAdmin が表示または DB 接続に使用しているエンコーディングが実際にはわからないため、そのようにテストするときは注意してください。

それでも問題が解決しない場合は、以下のコードを試してください。まず、テキストを UTF8 で格納するテーブルを作成します。

CREATE TABLE IF NOT EXISTS `utf8_test` (
  `id` int(11) NOT NULL AUTO_INCREMENT,
  `my_text` varchar(8000) NOT NULL,
  PRIMARY KEY (`id`)
) ENGINE=MyISAM  DEFAULT CHARSET=utf8 AUTO_INCREMENT=1 ;

そして、これをテストするためのPHPがあります。基本的に、フォームに入力を受け取り、その入力をエコーし​​て返し、DB からテキストを保存/取得します。前述のように、データを phpMyAdmin で直接表示すると、正しく表示されないことがありますが、ページとデータベース接続の両方が UTF8 にロックされているため、下のページでは常に期待どおりに表示されます。

<?php
  // Override whatever is set in php.ini
  ini_set('default_charset', 'UTF-8');

  // The following should not be required with the above override
  //header('Content-Type:text/html; charset=UTF-8');

  // Open the database
  $dbh = new PDO('mysql:dbname=utf8db;host=127.0.0.1;charset=utf8', 'root', 'password');

  // Set the connection to UTF8
  $dbh->setAttribute(PDO::MYSQL_ATTR_INIT_COMMAND, "SET NAMES 'utf8'");
  // Tell MySql to do the parameter replacement, not PDO
  $dbh->setAttribute(PDO::ATTR_EMULATE_PREPARES, false);
  // Throw exceptions (and break the code) if a query is bad
  $dbh->setAttribute(PDO::ATTR_ERRMODE, PDO::ERRMODE_EXCEPTION);

  $id = 0;
  if (isset($_POST["StoreText"]))
  {
    $stmt = $dbh->prepare('INSERT INTO utf8_test (my_text) VALUES (:my_text)');
    $stmt->execute(array(':my_text' => $_POST['my_text']));
    $id = $dbh->lastInsertId();
  }
?>

<!DOCTYPE html PUBLIC "-//W3C//DTD XHTML 1.0 Transitional/EN" "http://www.w3.org/TR/xhtml11/DTD/xhtml11-transitional.dtd">
<html xmlns="http://www.w3.org/1999/xhtml">
<head>
<meta charset="UTF-8">
<meta http-equiv="Content-type" content="text/html; charset=UTF-8">

<title>UTF-8 Test</title>
</head>

<body>

<?php
  // If something was posted, output it
  if (isset($_POST['my_text']))
  {
    echo "POSTED<br>\n";
    echo $_POST['my_text'] . "<br>\n";
  }

  // If something was written to the database, read it back, and output it
  if ($id > 0)
  {
    $stmt = $dbh->prepare('SELECT my_text FROM utf8_test WHERE id = :id');
    $stmt->execute(array(':id' => $id));
    if ($result = $stmt->fetch())
    {
      echo "STORED<br>\n";
      echo $result['my_text'] . "<br>\n";
    }
  }

  // Create a form to take some user input
  echo "<FORM NAME=\"utf8-test\" METHOD=\"POST\" ACTION=\"utf8-test.php\" enctype=\"multipart/form-data\" accept-charset=\"UTF-8\">";

  echo "<br>";

  echo "<textarea name=\"my_text\" rows=\"20\" cols=\"90\">";

  // If something was posted, include it on the form
  if (isset($_POST['my_text']))
  {
    echo $_POST['my_text'];
  }

  echo "</textarea>";

  echo "<br>";
  echo "<INPUT TYPE = \"Submit\" Name = \"StoreText\" VALUE=\"Store It\" />";

  echo "</FORM>";
?>
<br>

</body>

</html>
于 2014-11-11T23:50:46.903 に答える
0

MySQLi データベース接続を呼び出しset_charset()ましたか? を適切に使用するために必要ですreal_escape_string()

$db = new mysqli(...);
$db->set_charset('utf8');

接続でセッション変数を設定するだけでは不十分です。これらはサーバー側で何が起こるかに影響します。これset_charsetは、クライアント側で何が起こるかに影響します。

PHP リファレンスmysqli::real_escape_stringをチェックアウトできます。

于 2014-01-30T15:40:07.293 に答える