私の背景:
HTMLスクラブに関しては、私は初心者です。C# で html をコーディングするだけの仕事をしてから約 4 年が経ちました。しばらく前に C# を使用した他のコーディングは、フォームが SQL Server データベースのデータを操作するためのものでした。
HTML Agility Pack (HAP) を使い始めるために私が行ったこと:
HTML Agility Pack の使用を開始する方法について、さまざまなオンライン ソースから見つけた指示を理解するのに数日を費やしました。これまでに見つけたもののいくつかを以下に示します。
- www.4guysfromrolla.com/articles/011211-1.aspx
- olussier.net/2010/03/30/easy-parse-html-documents-in-csharp/
- stackoverflow.com/questions/846994/how-to-use-html-agility-pack
- shatalov.su/en/articles/web/parser_1.php
- 以下でさらに言及します...
これまでの私の結果:
私は、資料がかなり混乱していて、それぞれの情報源が私に何か違うことを教えているように見えることを発見しました. 私の試みはすべて行き詰まりました。
私の混乱を効率的に整理し、私の特定の状況に答えることができるように、私のプロジェクト、私の環境、私の質問の下の 3 つのセクションで説明します。
私のプロジェクト
私は、html ファイルからデータをスクラブするプロセスの作成を任されています。私はファイルをよく知っています。ファイルは、マシンのローカルのファイル システムに存在します。html ファイルは、私たちが所有していないプロセスによって別の場所に作成され、上記のローカル フォルダーに配置されます。(参考までに、私の質問の一部ではありませんが、スクラブタスクを実行するためにスケジュールに従って実行されるプロジェクトまたはアプリを作成し、収集したデータをデータベーステーブルに入力することを期待しています。)
私の環境
上記のように、処理される html ファイルはローカル マシンに存在します。このプロジェクトのコードを作成するために、このコンピューターに Visual Studio 2010 Professional を新しくインストールしました。HTML Agility Pack は、ファイル共有上のこのマシンにアクセスできるようになりました。
REGEIT の下: HKEY_LOCAL_MACHINE\SOFTWARE\Microsoft\NET Framework Setup\NDP には、このマシンにインストールされている .NET Framework のバージョンを示す次のリストが表示されます。
- CDF
- V2.0.50727
- V3.0
- V3.5
- V4
- V4.0
私の質問
1.) 一部のサイトから、HTML Agility Pack をダウンロードして「HtmlAgilityPack.dll」ファイルを使用するように言われましたが、zip ファイルには 9 つのフォルダーが含まれており、それぞれにこのファイルの異なるコピーがあります。どれが欲しいですか?
フォルダの名前は次のとおりです。
- ネット20
- Net40
- Net40 クライアント
- ネット45
- sl3-wp
- sl4
- sl4-windowsphone71
- sl5
- winrt45
2.) stackoverflow.com/questions/846994/how-to-use-html-agility-pack のフォーラムの質問「HTML Agility Pack の使用方法」への回答は、質問者に「HTML Agility をダウンロードしてビルドする」ように指示します。このサイトには、nuget.org/packages/HtmlAgilityPack へのリンクがあり、コマンド「PM> Install-Package HtmlAgilityPack」を実行して HTMLAgilityPack を「インストール」するように指示されています。 「パッケージ マネージャー コンソール」</p>
これはどういう意味ですか?他のサイトでは、bin フォルダー内の dll を参照するように言われています。それは私に何をするように言っているのですか?私が始めるために、より詳細に説明してください。
3.) C# を使用している場合、どのようなプロジェクトを作成すればよいですか?
4.) 私のプロジェクトに適用できると思われるその他のリソースがあれば教えてください。