久久久久久久av_日韩在线中文_看一级毛片视频_日本精品二区_成人深夜福利视频_武道仙尊动漫在线观看

Java中偽造referer來爬取數(shù)據(jù)

很多網(wǎng)站的防采集的辦法,就是判斷瀏覽器來源referer和cookie以及userAgent,道高一尺魔高一丈. 最近發(fā)現(xiàn)維護的一個爬蟲應(yīng)用,爬不到數(shù)據(jù)了,看了一下日志發(fā)現(xiàn)被爬網(wǎng)站做了防采集策略,
 
很多網(wǎng)站的防采集的辦法,就是判斷瀏覽器來源referer和cookie以及userAgent,道高一尺魔高一丈.
最近發(fā)現(xiàn)維護的一個爬蟲應(yīng)用,爬不到數(shù)據(jù)了,看了一下日志發(fā)現(xiàn)被爬網(wǎng)站做了防采集策略,經(jīng)過定位后,發(fā)現(xiàn)被爬網(wǎng)站是針對referer做了驗證,以下是解決方法:
在Java中獲取一個網(wǎng)站的HTML內(nèi)容可以通過HttpURLConnection來獲取.我們在HttpURLConnection中可以設(shè)置referer來偽造referer,輕松繞過這類防采集的網(wǎng)站:
HttpURLConnection connection = null;
URL url = new URL(urlStr);
if (useProxy) {
Proxy proxy = ProxyServerUtil.getProxy();
connection = (HttpURLConnection) url.openConnection(proxy);
} else {
connection = (HttpURLConnection) url.openConnection();
}
connection.setRequestMethod( "POST");
connection.setRequestProperty("referer", "http://xxxx.xxx.com");
connection.addRequestProperty("User-Agent", ProxyServerUtil.getUserAgent());
connection.setConnectTimeout(10000);
connection.setReadTimeout(10000);

 
 
【網(wǎng)站聲明】本站部分內(nèi)容來源于互聯(lián)網(wǎng),旨在幫助大家更快的解決問題,如果有圖片或者內(nèi)容侵犯了您的權(quán)益,請聯(lián)系我們刪除處理,感謝您的支持!

相關(guān)文檔推薦

主站蜘蛛池模板: 99久久久久久99国产精品免 | 成人中文网 | 成人深夜福利 | 91一区二区三区 | 成人污污视频 | 拍真实国产伦偷精品 | 国产精品永久 | 久久亚洲国产 | 日韩高清国产一区在线 | 亚洲精品成人av久久 | 最新国产精品精品视频 | 久久久久精 | 超碰地址| 天天干免费视频 | 欧美日韩精品久久久免费观看 | 国产亚洲一区二区三区 | 亚洲成网| 国产精品久久久久久久久大全 | 久久久国产精品视频 | 美女激情av| 在线视频亚洲 | 91色站 | 欧美精品一区三区 | 一级片免费网站 | 81精品国产乱码久久久久久 | 欧州一区二区三区 | 日本黄色免费视频 | 久久国产精品久久国产精品 | 中文在线一区 | 中文字幕视频一区二区 | 九九精品在线 | 一级毛片免费 | 国产高清精品一区 | 波多野结衣中文视频 | 精品国产欧美一区二区 | 亚洲日韩欧美一区二区在线 | 91精品国产综合久久婷婷香蕉 | 国产精品久久久久久久久 | 狠狠狠干| 国产精品大全 | 日韩成人一区 |