Run() 2 { { 5 StdSchedulerFactory factory = new StdSchedulerFactory(); 6 IScheduler scheduler = factory.GetScheduler(); 7 scheduler.Start(); , ).Build(); 9 ITrigger trigger = TriggerBuilder.Create() , ) 11 .StartNow() 12 .WithSimpleSchedule( 13 x => x .RepeatForever() 16 ).Build(); 17 scheduler.ScheduleJob(job, trigger); 18 19 } 20 catch (SchedulerException se) 21 { 22 Console.WriteLine(se); 23 } 24 }
最后采集具有反爬机制的html页面的时候,使用代理IP,这个相信大家都会,设置一下webRequest的Proxy参数即可。
webRequest.Proxy = new WebProxy(ip, port);
以上,就实现了一个基于redis的免费代理IP池。我们被封IP的爬虫服务又满血复活了,继续采集新数据去。
原创文章,代码都是从自己项目里贴出来的。转载请注明出处哦,亲~~~