文字セットとして UTF8 を使用して BLOB データを CLOB データに変換すると、Oracle (11gR2) はバイト 0xE2 0x80 0x82 を 0x20 に変換するようです。これは、私が疑うように、明らかに間違っていますか? もしかしてバグ?
元の文字 (すべて、特に EN スペース) を保持しながら、UTF8 でエンコードされたデータを含む clob を編集する必要があります。
参考までに: 0xE2 0x80 0x82 は「EN スペース」で、0x20 は「通常のスペース」です。
http://docs.oracle.com/cd/B19306_01/appdev.102/b14258/d_lob.htm#i1020356
http://en.wikipedia.org/wiki/Space_%28punctuation%29
http://www.utf8-chartable.de/unicode-utf8-table.pl?start=8192
declare
    v_clob                  clob;
    v_clob_content          varchar2(8);
    v_content_ok            varchar2(64);
    v_content_bad           varchar2(64);
    v_blob                  blob;
    v_raw                   raw(8);
    v_c_dst_offset          pls_integer := 1;
    v_c_src_offset          pls_integer := 1;
    v_c_ctx                 pls_integer := 0;
    v_c_warn                pls_integer;
begin
    -- Create temporary lobs and cache them
    dbms_lob.createtemporary(v_blob,true);
    dbms_lob.createtemporary(v_clob,true);
    -- Write 0xE2 0x80 0x82 to the BLOB
    v_raw := hextoraw('E2') || hextoraw('80') || hextoraw('82');
    dbms_lob.write(v_blob,utl_raw.length(v_raw),1,v_raw);
    -- Convert the BLOB to CLOB using AL32UTF8 as encoding
    dbms_lob.converttoclob(
       v_clob,
       v_blob,
       dbms_lob.getlength(v_blob),
       v_c_dst_offset,
       v_c_src_offset, 
       nls_charset_id('AL32UTF8'),
       v_c_ctx,
       v_c_warn);
    -- Put the CLOB contents into a varchar2
    v_clob_content := dbms_lob.substr(v_clob,dbms_lob.getlength(v_clob));   
    -- Output the HEX value of respectively the BLOB content and the CLOB content
    select rawtohex(v_clob_content) into v_content_bad from dual;
    select rawtohex(v_raw) into v_content_ok from dual;
    dbms_output.put_line('[' || v_content_bad || ']');
    dbms_output.put_line('[' || v_content_ok || ']');
    -- Release resources
    dbms_lob.freetemporary(v_clob);
    dbms_lob.freetemporary(v_blob);
end;
/
出力:
[20]
[E28082]
PL/SQL procedure successfully completed.