私は基本的にファイル(mp3ファイルなど)を読みたいと思っています。ファイルで使用されているすべての ASCII 文字をスキャンし、それらを辞書、配列、またはリストに入れます。そして、そこから各文字に数値を割り当てます。
例えば:
ファイル blabla.mp3 を読み込むとします (明らかに、このタイプのファイルはエンコードされているため、単なる英字ではありません)。
これはその内容です:
╤dìúúH»╓╒:φººMQ╤╤╤╤┤i↔↔←GGGΦ⌠i←E::2E┤tti←╙╤ΦΦ⌠·:::::%Fæ╤╤:6Å⌠tSN│èëåD¿╢ÄÄÄÄÄÄÄÄÄÄÅO ^↔:::.ÄÄÄÄÄÄÄèHΦΦ■ï»ó⌐╙-↔→E┤tttttttt}▲î╤╤dì"Ü:::)ú$tm‼ º╤╓q╤╙·:.ñǰ"V├╡ ΦPa↨/úúúúúúúΦ╞îHΦ║*ÄèúóΦΦΦΦ»DΦΦ·tΘ○_Nïúkî►"DëÜ)#ú»→·:4Äïúúúúó¿║:( ·:ç↑PR"$RGH◄◘úúó¿ΦΦΦ┌&HΦΦ┌+⌠ WºGG ╤m→GF╘±"¿ΦñïúúúóΦò↨FæTtt╓ìú⌠ΦΦΦ⌠z:::=:::::≥E╤╤╤╤╤╤╤Tm↔↔▬Hªèi⌠ztz:::tt
どの文字が使用されているかを把握し、それぞれに 0 ~ 255 の値を割り当てたいと考えています。各値はその文字に固有のものになります。
したがって、╤ = 0; Φ=56; ú = 25 などなど
今、私はpythonとjavaのドキュメントを検索してきましたが、何を探しているのかよくわかりません。また、ASCII 文字、HEX、またはファイルの生のバイトについて心配する必要があるかどうかもわかりません。
正しい方向に向けてくれる人が必要なだけです。何か助けはありますか?