私はウェブサイトで簡単な検索を実装していますが、現在、入力のサニタイズに取り組んでいます。私の計画は、許可された文字のホワイトリストを作成することです. 私はPHPを使用していますが、これまでのところ現在の正規表現を取得しています:
preg_replace('/[^a-z0-9 -]/i', '', $s);
そのため、英数字、スペース、ハイフン以外のものはすべて削除しています。
この種のことに対して一般的に受け入れられているホワイトリストはありますか、それともアプリケーションに依存しているだけですか? 本のタイトル、著者名、本の宣伝文句で検索します。