FacebookビデオのURLを抽出するPythonスクリプトを書いています。しかし、ビデオ ページのソースでは、URL に \uxxxxxx の形式の文字がいくつか表示されます。
たとえば、URLはこの形式です
https\u00253A\u00255C\u00252F\u00255C\u00252Ffbcdn-video-a.akamaihd.net\u00255C\u00252Fhvideo-ak-prn2\u00255C\u00252Fv\u00255C\u00252F753002_318048581647953_53890_n.mp4\u00253Foh\u00253D64e3e8ecf7e88f1da335d88949b2dc1f\u002526oe\u00253D52226D10\u002526__gda__\u00253D1377987338_9e37fb163a1d37d4b06ab7cff668f7dc\u002522\u00252C\u002522
\u00253Aはコロン(:)なのですが、どうやって変換すればいいのでしょうか。
私が好きだったとき
>>> x.decode('unicode_escape').encode('ascii','ignore')
私は得る
'https%3A%5C%2F%5C%2Ffbcdn-video-a.akamaihd.net%5C%2Fhvideo-ak-prn2%5C%2Fv%5C%2F753002_318048581647953_53890_n.mp4%3Foh%3D64e3e8ecf7e88f1da335d88949b2dc1f%26oe%3D52226D10%26__gda__%3D1377987338_9e37fb163a1d37d4b06ab7cff668f7dc%22%2C%22
パーセンテージではなく正確なURLが必要です。
いろいろ検索しましたが、助けが見つかりませんでした。
前もって感謝します
編集
Facebookページのソース全体を渡してから、そのような複雑なUnicode文字をすべて単純なものに変換する方法はありますか.