次のような単純な置換を行いたい:
line= line.replace ('ʃ',' sh ')
line= line.replace ('ɐ͂',' an ')
line= line.replace ('ẽ',' en ')
問題は、python がこれらの文字を受け入れないことです。
私も試してみました:
line= line.replace (u'\u0283',' sh ')
しかし、デコードエラーが発生するため、まだ何も開けません: UnicodeDecodeError: 'ascii' codec can't decode byte 0xcb in position 0: ordinal not in range(128)
コーデックをいじりましたが、適切なものが見つかりませんでした。間違った道を進んでいるのかもしれません。