Socket.io は、websockets とまったく同じではありません。彼らがsocket.ioを使用していることを知っているので、私はそれに焦点を当てています。このソケットをスクレイピングする最も簡単な方法は、socket.io クライアントを使用することです。
これをあなたのページに入れます:
<script src="https://github.com/LearnBoost/socket.io-client/blob/0.9/dist/socket.io.js"></script>
<script src="scraper.js"></script>
ファイル Scraper.js を作成します。
var keywords = /foo|bar/ig;
var socket = io.connect('http://host-to-scrape:portnumber/path');
socket.on('<socket.io-eventname>', function (data) {
// The scraped data is in 'data', do whatever you want with it
console.log(data);
// Assuming data.body contains a string containing keywords:
if(keywords.test(data.body)) callOtherFunction(data.body);
// Talk back:
// socket.emit('eventname', { my: 'data' });
});
2014 年 6 月 1 日更新
これをサーバーで実行する代わりに、以下で参照した StackOverflow の質問を見ると、ブラウザ ウィンドウでこれを実行しようとしているように見えます。そのため、NodeJS は必要ないため、NodeJS に関するすべてを削除しました。