久久久久久久av_日韩在线中文_看一级毛片视频_日本精品二区_成人深夜福利视频_武道仙尊动漫在线观看

Java中偽造referer來爬取數據

很多網站的防采集的辦法,就是判斷瀏覽器來源referer和cookie以及userAgent,道高一尺魔高一丈. 最近發現維護的一個爬蟲應用,爬不到數據了,看了一下日志發現被爬網站做了防采集策略,
 
很多網站的防采集的辦法,就是判斷瀏覽器來源referer和cookie以及userAgent,道高一尺魔高一丈.
最近發現維護的一個爬蟲應用,爬不到數據了,看了一下日志發現被爬網站做了防采集策略,經過定位后,發現被爬網站是針對referer做了驗證,以下是解決方法:
在Java中獲取一個網站的HTML內容可以通過HttpURLConnection來獲取.我們在HttpURLConnection中可以設置referer來偽造referer,輕松繞過這類防采集的網站:
HttpURLConnection connection = null;
URL url = new URL(urlStr);
if (useProxy) {
Proxy proxy = ProxyServerUtil.getProxy();
connection = (HttpURLConnection) url.openConnection(proxy);
} else {
connection = (HttpURLConnection) url.openConnection();
}
connection.setRequestMethod( "POST");
connection.setRequestProperty("referer", "http://xxxx.xxx.com");
connection.addRequestProperty("User-Agent", ProxyServerUtil.getUserAgent());
connection.setConnectTimeout(10000);
connection.setReadTimeout(10000);

 
 
【網站聲明】本站部分內容來源于互聯網,旨在幫助大家更快的解決問題,如果有圖片或者內容侵犯了您的權益,請聯系我們刪除處理,感謝您的支持!

相關文檔推薦

主站蜘蛛池模板: 亚洲精品久久嫩草网站秘色 | 欧美国产视频一区二区 | 黄网站涩免费蜜桃网站 | 亚洲精品免费在线观看 | 国产欧美精品一区二区色综合朱莉 | 在线一级片 | 欧美日韩精品一区 | 亚洲 中文 欧美 | 亚洲精品成人在线 | 欧美综合一区二区 | 91网站在线看 | 亚洲成av| 中文字幕福利视频 | av黄在线观看 | 中文字幕成人av | 久久亚洲一区 | 久久久www成人免费精品 | 欧美理论片在线观看 | 久久99精品国产自在现线小黄鸭 | 色av一区 | 午夜精品一区二区三区三上悠亚 | 久久91精品国产一区二区三区 | 欧美日韩在线一区二区 | a级毛片免费高清视频 | 国产精品久久久久久妇女6080 | 黑人巨大精品欧美黑白配亚洲 | 91国内视频在线 | 成人影院在线观看 | 91亚洲精品在线观看 | www.成人久久| 亚洲一区二区在线 | 欧美激情视频一区二区三区在线播放 | 夜操| 精品久久国产 | 亚洲 欧美 综合 | 国产精品成人一区 | 色久五月 | 国产亚洲一区二区三区 | 亚洲精品国产第一综合99久久 | 欧美日韩在线观看一区 | 夜夜夜夜夜夜曰天天天 |