1

HIVE で regexp_replace 関数を使用すると、この文字列からマークアップを切り取ることができます。

Abc abc ","<a href="http://,557244.html" id=" ">abc abc abc .</a> 

取得したい: Abc abc abc abc abc 誰か知っていますか?

4

1 に答える 1

0

列に WTF が含まれていると仮定します。

Abc abc ","<a href="http://,557244.html" id=" ">abc abc abc .</a>

次に、regexp_replace(regexp_replace(WTF,'<[^>]*>',''), '[",.]','')すべての XML マークアップを削除し、次に句読点を削除して、戻ります

Abc abc abc abc abc

これは昔ながらの正規表現構文であり、Hive に固有のものではありません。

于 2015-11-20T17:21:22.377 に答える