2

私は、あるホスティング環境から別のホスティング環境に数十万のユーザーファイルを移行するための1回限りの変換ツールを開発しています。移行の一環として、ファイル名をクリーンアップしてURLセーフにします。私のPHPスクリプトはこれを行います(これが最もエレガントで、正しい、または最適化されたコードであるとは言えませんが、必要なことは行います)。ファイル拡張子は個別に処理されるため、ここでは問題になりません。

<?php
$fileName = $_POST['name'];
$swap_chars = array('%20'=>'-', '&'=>'and', '@'=>'at', '='=>'eq', '#'=>'num', '%'=>'pct', '+'=>'-', ' '=>'-', ','=>'-', '/'=>'-', ':'=>'-', ';'=>'-', '\\'=>'-', '|'=>'-', '~'=>'-', 'Š'=>'S', 'š'=>'s', 'Ð'=>'Dj', 'Ž'=>'Z', 'ž'=>'z', 'À'=>'A', 'Á'=>'A', 'Â'=>'A', 'Ã'=>'A', 'Ä'=>'A', 'Å'=>'A', 'Æ'=>'A', 'Ç'=>'C', 'È'=>'E', 'É'=>'E', 'Ê'=>'E', 'Ë'=>'E', 'Ì'=>'I', 'Í'=>'I', 'Î'=>'I', 'Ï'=>'I', 'Ñ'=>'N', 'Ò'=>'O', 'Ó'=>'O', 'Ô'=>'O', 'Õ'=>'O', 'Ö'=>'O', 'Ø'=>'O', 'Ù'=>'U', 'Ú'=>'U', 'Û'=>'U', 'Ü'=>'U', 'Ý'=>'Y', 'Þ'=>'B', 'ß'=>'ss', 'à'=>'a', 'á'=>'a', 'â'=>'a', 'ã'=>'a', 'ä'=>'a', 'å'=>'a', 'æ'=>'a', 'ç'=>'c', 'è'=>'e', 'é'=>'e', 'ê'=>'e', 'ë'=>'e', 'ì'=>'i', 'í'=>'i', 'î'=>'i', 'ï'=>'i', 'ð'=>'o', 'ñ'=>'n', 'ò'=>'o', 'ó'=>'o', 'ô'=>'o', 'õ'=>'o', 'ö'=>'o', 'ø'=>'o', 'ù'=>'u', 'ú'=>'u', 'û'=>'u', 'ü'=>'u', '†'=>'t', '°'=>'deg', '¢'=>'c', '£'=>'L', '§'=>'S', '•'=>'o', '¶'=>'P', '®'=>'R', '©'=>'C', '™'=>'TM', 'ý'=>'y', 'ý'=>'y', 'þ'=>'b', 'ÿ'=>'y', 'ƒ'=>'f');
$fileName = str_replace('\\\'', '', $fileName);             // strip escaped apostrophes
$fileName = str_replace('\\"', '', $fileName);              // strip escaped quotes
$fileName = strtr($fileName, $swap_chars);                  // swap special characters
$fileName = preg_replace("/[^0-9a-zA-Z._-]/","",$fileName); // strip remaining bad characters
$fileName = preg_replace("/--+/","-",$fileName);            // trim repeating dashes
$fileName = preg_replace("/\.\.+/",".",$fileName);          // trim repeating periods
$fileName = preg_replace("/__+/","_",$fileName);            // trim repeating underscores
$fileName = trim($fileName, '.-_');                         // remove leading or trailing punctuation
$fileName = substr($fileName, 0, 62);                       // truncate long filenames
echo $fileName;
?>

ツールの大部分もJavaScriptに含まれているので、可能であれば、代わりにそこでクリーンアップを実行したいと思います。おそらく、PHP関数text.replace(old,new)を複製するために使用できると思います。str_replace()preg_replace()

ただし、PHPstrtr()trim()関数はかなりクールな機能を果たし(strtrは一致/置換に連想配列を使用できます。トリムは複数の指定された文字を削除します)、JSに相当するものは見つかりませんでした。

それで、私が見落としていたこれを行うためのより簡単な方法はありますか、それとも私は自分の関数を掘り下げて書くべきですか?あるいは、PHP.jsは実行可能なオプションですか?

ソリューション付きの更新:

@Matt Wincklerからの非常に迅速で役立つ回答を使用して、JavaScriptでクリーンアップコードを書き直すことができました。以下は、上記のPHP配列に基づくJavaScriptオブジェクト「swapchars」とともに、以下の受け入れられた回答で提供されるコードと組み合わせて(少なくとも私のユースケースでは)機能します。

function cleanname(name) {
    name = name.replace('\'', '');              // strip escaped apostrophes
    name = name.replace('\"', '');              // strip escaped quotes
    name = name.replace('%20', '-');            // replace encoded spaces
    name = strtr(name, swapchars);              // swap special characters
    name = name.replace(/[^0-9a-z_\.\-]/gi,''); // strip remaining bad characters
    name = name.replace(/-+/g,'-');             // trim repeating dashes
    name = name.replace(/\.+/g,'.');            // trim repeating periods
    name = name.replace(/_+/g,'_');             // trim repeating underscores
    name = trim(name, '.-_');                   // remove leading or trailing punctuation
    name = name.substr(0, 62);                  // truncate long names
    return name;
}
4

1 に答える 1

0

Javasriptのtrimand関数を置き換えるのは難しくありません。strtrここに、法案にほぼ適合すると思われるいくつかの機能があります。

function strtr(str, swapChars) {
    var ret = '';
    for (var i = 0; i < str.length; i++) {
        ret += swapChars[str[i]] || str[i];
    }
    return ret;
}

function trim(str, chars) {
    var lowerIndex = 0;
    for (var i = 0; i < str.length; i++) {
        if (chars.indexOf(str[i]) === -1) {
            lowerIndex = i;
            break;
        }
    }
    for (var i = str.length - 1; i > -1; i--) {
        if (chars.indexOf(str[i]) === -1) {
            return str.substring(lowerIndex,i+1);
        }
    }
    return '';
}

例:

alert(trim('edcbabcde', 'cde'])); // 'bab'
alert(strtr('edcbabcde', {'e': 'E', 'd': 'D', 'c': 'C'})); // 'EDCbabCDE'

注意点は、strtr上記の実装は単一の文字に対してのみ機能するため、「%20」の置換が検出されないことです。複数文字の置換が 1 つまたは 2 つしかない場合は、個人的には通常の置換を行ってから strtr を実行します。文字。

于 2012-10-24T21:22:01.553 に答える