私のプログラムは、インターネットから任意の文字列を取得し、それらをファイル名に使用します。これらの文字列から悪い文字を削除する簡単な方法はありますか、それともカスタム関数を作成する必要がありますか?
14 に答える
うーん、人々がどの文字が有効であるかを推測しようとするとき、私はそれを嫌います。完全に移植性がない(常にMonoについて考えている)ことに加えて、以前のコメントは両方とも25以上の無効な文字を見逃していました。
foreach (var c in Path.GetInvalidFileNameChars())
{
fileName = fileName.Replace(c, '-');
}
またはVBの場合:
'Clean just a filename
Dim filename As String = "salmnas dlajhdla kjha;dmas'lkasn"
For Each c In IO.Path.GetInvalidFileNameChars
filename = filename.Replace(c, "")
Next
'See also IO.Path.GetInvalidPathChars
無効な文字を削除するには:
static readonly char[] invalidFileNameChars = Path.GetInvalidFileNameChars();
// Builds a string out of valid chars
var validFilename = new string(filename.Where(ch => !invalidFileNameChars.Contains(ch)).ToArray());
無効な文字を置き換えるには:
static readonly char[] invalidFileNameChars = Path.GetInvalidFileNameChars();
// Builds a string out of valid chars and an _ for invalid ones
var validFilename = new string(filename.Select(ch => invalidFileNameChars.Contains(ch) ? '_' : ch).ToArray());
無効な文字を置き換える (そして、Hell* と Hell$ のような潜在的な名前の競合を回避するには):
static readonly IList<char> invalidFileNameChars = Path.GetInvalidFileNameChars();
// Builds a string out of valid chars and replaces invalid chars with a unique letter (Moves the Char into the letter range of unicode, starting at "A")
var validFilename = new string(filename.Select(ch => invalidFileNameChars.Contains(ch) ? Convert.ToChar(invalidFileNameChars.IndexOf(ch) + 65) : ch).ToArray());
この質問はこれまで何度も出されてきましたが、何度 も 指摘されているように、適切ではありません。IO.Path.GetInvalidFileNameChars
まず、PRN や CON など、予約されていてファイル名に使用できない名前が多数あります。ルート フォルダーでのみ許可されていない他の名前があります。ピリオドで終わる名前も許可されていません。
第二に、さまざまな長さの制限があります。NTFS の完全なリストについては、こちらを参照してください。
第 3 に、他の制限があるファイルシステムにアタッチできます。たとえば、ISO 9660 ファイル名は「-」で始めることはできませんが、含めることはできます。
第 4 に、2 つのプロセスが「恣意的に」同じ名前を選んだらどうしますか?
一般に、ファイル名に外部で生成された名前を使用することはお勧めできません。独自のプライベート ファイル名を生成し、人間が判読できる名前を内部に保存することをお勧めします。
私はGrauenwolfに同意し、強くお勧めしますPath.GetInvalidFileNameChars()
ここに私のC#の貢献があります:
string file = @"38?/.\}[+=n a882 a.a*/|n^%$ ad#(-))";
Array.ForEach(Path.GetInvalidFileNameChars(),
c => file = file.Replace(c.ToString(), String.Empty));
ps -- これは必要以上に不可解です -- 簡潔にしようとしていました。
これが私が現在使用している関数です(C#の例についてjcollumに感謝します):
public static string MakeSafeFilename(string filename, char replaceChar)
{
foreach (char c in System.IO.Path.GetInvalidFileNameChars())
{
filename = filename.Replace(c, replaceChar);
}
return filename;
}
便宜上、これを「ヘルパー」クラスに入れました。
これを使用すると、すばやく簡単に理解できることがわかります。
<Extension()>
Public Function MakeSafeFileName(FileName As String) As String
Return FileName.Where(Function(x) Not IO.Path.GetInvalidFileNameChars.Contains(x)).ToArray
End Function
これstring
はIEnumerable
、 aがchar
配列であり、配列string
を取るコンストラクター文字列があるため機能しchar
ます。
Path.GetInvalidFileNameChars()
多くの答えは、私には悪い解決策のように思える使用を提案しています。ブラックリストではなくホワイトリストを使用することをお勧めします。ハッカーは常に最終的にそれを回避する方法を見つけるからです。
使用できるコードの例を次に示します。
string whitelist = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ.";
foreach (char c in filename)
{
if (!whitelist.Contains(c))
{
filename = filename.Replace(c, '-');
}
}