SSIS と [SharePointListAdapters][1] [1]: http://sqlsrvintegrationsrv.codeplex.com/releases を使用して、SharePoint 2010 リストからデータをインポートし、SQL Server 2008 テーブルに配置しました。約 500 行のデータがあります。ここでの課題は、データを適切に解析することです。html タグで囲まれた列がいくつかあります。
たとえば、Column Project Desc には Project Desc のようなデータがあります。
<div class="ExternalClass914BB5DA5CB142EB854C739EAACEE3BB">
<div>Import Data from SharePoint list to Database.
</div>
</div>
グーグルで、以下の機能を見つけました。期待どおりに動作します。私の質問は、この関数を編集して Project Desc という列名をパラメーターとして取得し、その特定の列のすべてのデータで html タグが破棄されるようにする方法です。
create function dbo.StripHTML( @text varchar(max) ) returns varchar(max) as
begin
declare @textXML xml
declare @result varchar(max)
set @textXML = @text;
with doc(contents) as
(
select chunks.chunk.query('.') from @textXML.nodes('/') as chunks(chunk)
)
select @result = contents.value('.', 'varchar(max)') from doc
return @result
end
go
select dbo.StripHTML('<div class="ExternalClassB1D90504EAFF42BE8A8056E686F4E195"> <div>Import Data from SharePoint list to Database.</div></div>')