0

%%問題は解決し、以下のコードは期待どおりに機能します%%

着信ファイルのUTF-8エンコーディングをテストするSVNpre-commitフックをBashで作成しようとしています。着信ファイルのパスを取得し、dirs / pictures /削除されたファイルなどを無視するために多くの文字列ジャグリングを行った後、「svnlook cat」を使用して着信ファイルを読み取り、「iconv-fUTF-8」にパイプします。この後、${PIPESTATUS[1]}を使用してiconv操作の終了ステータスを読み取りました。

私のコードは次のようになります。

REPOS="$1"
TXN="$2"

SVNLOOK=/usr/bin/svnlook
ICONV=/usr/bin/iconv

# The file endings to ignore when checking for UTF-8:
IGNORED_ENDINGS=( png jar )

# Prepairing to set the IFS (Internal Field Separator) so "for CHANGE in ..." will iterate
# over lines instead of words
OIFS="${IFS}"
NIFS=$'\n'

# Make sure that all files to be committed are encoded in UTF-8
IFS="${NIFS}"

for CHANGE in $($SVNLOOK changed -t "$TXN" "$REPOS"); do
    IFS="${OIFS}"
    # Skip change if first character is "D" (we dont care about checking deleted files)
    if [ "${CHANGE:0:1}" == "D" ]; then
        continue
    fi

    # Skip change if it is a directory (directories don't have encoding)
    if [ "${CHANGE:(-1)}" == "/" ]; then
        continue
    fi

    # Extract file repository path (remove first 4 characters)
    FILEPATH=${CHANGE:4:(${#CHANGE}-4)}

    # Ignore files that starts with "." like ".classpath"
    IFS="//" # Change seperator to "/" so we can find the file in the file path
    for SPLIT in $FILEPATH
    do
        FILE=$SPLIT
    done
    if [ "${FILE:0:1}" == "." ]; then
        continue
    fi
    IFS="${OIFS}" # Reset Internal Field Seperator

    # Ignore files that are not supposed to be checked, like images. (list defined in IGNORED_ENDINGS field above)
    IFS="." # Change seperator to "." so we can find the file ending
    for SPLIT in $FILE
    do
        ENDING=$SPLIT
    done
    IFS="${OIFS}" # Reset Internal Field Seperator
    IGNORE="0"
    for IGNORED_ENDING in ${IGNORED_ENDINGS[@]}
    do
        if [ `echo $IGNORED_ENDING | tr [:upper:] [:lower:]` == `echo $ENDING | tr [:upper:] [:lower:]` ] # case insensitive compare of strings
        then
            IGNORE="1"
        fi
    done
    if [ "$IGNORE" == "1" ]; then
        continue
    fi

    # Read changed file and pipe it to iconv to parse it as UTF-8
    $SVNLOOK cat -t "$TXN" "$REPOS" "$FILEPATH" | $ICONV -f UTF-8 -t UTF-16 -o /dev/null

    # If iconv exited with a non-zero value (error) then return error text and reject commit
    if [ "${PIPESTATUS[1]}" != "0" ]; then
        echo "Only UTF-8 files can be committed (violated in $FILEPATH)" 1>&2
        exit 1
    fi
    IFS="${NIFS}"
done

IFS="${OIFS}"

# All checks passed, so allow the commit.
exit 0

問題は、「æøå」のようなスカンジナビア文字を含むファイルをコミットしようとするたびに、iconvがエラー(出口1)を返すことです。

スクリプトを無効にした場合は、「æøå」を使用してファイルをコミットし、「svnlook-t」および「svnlookcat -t」の-t(トランザクション)を-r(リビジョン)に変更して、リビジョンを使用してスクリプトを手動で実行します「æøå」ファイルの番号、次にiconv(およびそのためのスクリプト)はexit0を返します。そしてすべてがダンディです。

svnlook cat -rが期待どおりに機能する(UTF-8でエンコードされた「æøå」文字列を返す)のに、svnlook cat -tが機能しないのはなぜですか?

4

1 に答える 1

0

問題は、出力エンコーディングが選択されていない場合、iconvが明らかに予期しない動作をすることでした。

変化

$SVNLOOK cat -t "$TXN" "$REPOS" "$FILEPATH" | $ICONV -f UTF-8 -o /dev/null

$SVNLOOK cat -t "$TXN" "$REPOS" "$FILEPATH" | $ICONV -f UTF-8 -t UTF-16 -o /dev/null

問題を解決し、スクリプトを期待どおりに動作させました:)

于 2011-12-09T10:23:50.907 に答える