LinkedIn で特定の会社の正確な従業員数を取得しようとしています。私が見つけたところによると、このデータには API や公開サイトからアクセスすることはできません。そのため、残っている唯一のオプションは、プログラムで認証し、ログイン ユーザーの会社のページをスクレイピングすることです。誰か他のアイデアを持っているか、それを行う方法を知っていますか?
事前に助けてくれてありがとう!
サイトをスクレイピングして正確な数を取得することに固執している場合、それを行う最も簡単な方法はPythonでBeautifulSoupを使用することです。簡単に言えば、Web アドレスを指定すると、すべてのデータが簡単にトラバース可能なオブジェクトの形で返されます。
従業員数については、個人の会社情報が表示されている場所に応じて、チェックしたいすべての従業員を指定するのと同じくらい簡単な場合があります。
All_Companies[body.companyDiv.companyName]++
これがお役に立てば幸いです。
LinkedInApiClientFactory mfactory = LinkedInApiClientFactory.newInstance(Constants.consumerKey, Constants.consumerSecret);
CompaniesApiClient clientcompany = mfactory.createCompaniesApiClient(Constants.token, Constants.tokenSecret);
Company company = clientcompany.getCompanyById("YOUR PAGE ID", EnumSet.allOf(CompanyField.class));
if (company.getEmployeeCountRange().getCode().equalsIgnoreCase("A")) {
System.out.println("-->Emplyee count--"+"1");
}else if (company.getEmployeeCountRange().getCode().equalsIgnoreCase("B")) {
System.out.println("-->Emplyee count--"+"2-10");
}
else if (company.getEmployeeCountRange().getCode().equalsIgnoreCase("C")) {
System.out.println("-->Emplyee count--"+"11-50");
}
else if (company.getEmployeeCountRange().getCode().equalsIgnoreCase("D")) {
System.out.println("-->Emplyee count--"+"51-200");
}
else if (company.getEmployeeCountRange().getCode().equalsIgnoreCase("E")) {
System.out.println("-->Emplyee count--"+"201-500");
}
else if (company.getEmployeeCountRange().getCode().equalsIgnoreCase("F")) {
System.out.println("-->Emplyee count--"+"501-1000");
}
else if (company.getEmployeeCountRange().getCode().equalsIgnoreCase("G")) {
System.out.println("-->Emplyee count--"+"1001-5000");
}
else if (company.getEmployeeCountRange().getCode().equalsIgnoreCase("H")) {
System.out.println("-->Emplyee count--"+"50001-10000");
}
else if (company.getEmployeeCountRange().getCode().equalsIgnoreCase("H")) {
System.out.println("-->Emplyee count--"+"10000 and above");
}
LinkedIn から得られる最善の方法は、 Company API<employee-count-range>
の要素を介することです。その値の凡例は次のとおりです。
A = 1
B = 2-10
C = 11-50
D = 51-200
E = 201-500
F = 501-1000
G = 1001-5000
H = 5001-10000
I = 10001+