久久久久久久av_日韩在线中文_看一级毛片视频_日本精品二区_成人深夜福利视频_武道仙尊动漫在线观看

Java中偽造referer來爬取數據

很多網站的防采集的辦法,就是判斷瀏覽器來源referer和cookie以及userAgent,道高一尺魔高一丈. 最近發現維護的一個爬蟲應用,爬不到數據了,看了一下日志發現被爬網站做了防采集策略,
 
很多網站的防采集的辦法,就是判斷瀏覽器來源referer和cookie以及userAgent,道高一尺魔高一丈.
最近發現維護的一個爬蟲應用,爬不到數據了,看了一下日志發現被爬網站做了防采集策略,經過定位后,發現被爬網站是針對referer做了驗證,以下是解決方法:
在Java中獲取一個網站的HTML內容可以通過HttpURLConnection來獲取.我們在HttpURLConnection中可以設置referer來偽造referer,輕松繞過這類防采集的網站:
HttpURLConnection connection = null;
URL url = new URL(urlStr);
if (useProxy) {
Proxy proxy = ProxyServerUtil.getProxy();
connection = (HttpURLConnection) url.openConnection(proxy);
} else {
connection = (HttpURLConnection) url.openConnection();
}
connection.setRequestMethod( "POST");
connection.setRequestProperty("referer", "http://xxxx.xxx.com");
connection.addRequestProperty("User-Agent", ProxyServerUtil.getUserAgent());
connection.setConnectTimeout(10000);
connection.setReadTimeout(10000);

 
 
【網站聲明】本站部分內容來源于互聯網,旨在幫助大家更快的解決問題,如果有圖片或者內容侵犯了您的權益,請聯系我們刪除處理,感謝您的支持!

相關文檔推薦

主站蜘蛛池模板: 国产在线观看一区二区 | 综合久久综合久久 | 羞羞在线观看视频 | 亚洲性视频 | 欧美日韩亚 | 亚洲va欧美va天堂v国产综合 | 久久亚洲欧美日韩精品专区 | 天天躁日日躁aaaa视频 | 亚洲成人在线免费 | 亚洲精品电影网在线观看 | av毛片| 免费国产黄 | 成人在线免费观看视频 | 蜜桃毛片 | 九九热精品在线 | 在线成人免费视频 | 国产精品视频免费观看 | 99亚洲精品 | 亚洲成人毛片 | 欧美三级在线 | av免费网站在线观看 | 亚洲高清在线观看 | 小h片免费观看久久久久 | 99精品在线观看 | 成人午夜视频在线观看 | 国产欧美精品在线观看 | 日韩电影一区 | 国产精品久久精品 | av色噜噜| 在线观看h视频 | 精品视频一区二区 | 一区二区在线免费播放 | 国产精品揄拍一区二区久久国内亚洲精 | 在线免费观看黄视频 | 中文在线a在线 | 看a级黄色毛片 | 一区二区三区四区在线视频 | 国产在线一区二 | 欧美一页| 中国av在线免费观看 | 久草视频观看 |