需要一个针对GSA WC的激光定位URL列表

outafforloo1971

New member
大家好,我正在努力弄清楚如何使GSA WC中的网页爬虫更快,但我似乎无法使它使用超过1%的CPU。所以我想,这里可能已经有人正确地解决了这个系统,可以提供帮助。我想建立一个来自电工到油漆匠、承包商等各大城市的服务公司的网站列表,来自5个主要地区(美国,英国,加拿大,澳大利亚,新西兰),总计约100万个网站。我不想放任何.gov网站或关于这些服务的博客,我特别想获得这些服务提供者的实际公司的网址列表。我的计划是使用联系表格营销,每天发送约8k到10k封邮件(大约每小时400封,每天24小时)以安排销售高票月度服务的约会。我知道会有很多失误,但这是我的目标。有人能帮我完成这一点吗?或者告诉我如何正确设置GSA中的爬虫?或者您建议使用不同的爬取工具?
 

klelisacdi1982

New member
GSA软件只支持32位,因此最多只能使用3GB的内存,在达到最大CPU使用率之前,你很可能会遇到这个障碍,它的使用率通常会低。通常,为了更快地抓取数据,你需要使用大量的代理,否则代理会很快被封禁,这意味着没有目标可以发布。你最好使用预抓取的列表,@loopline是这方面的专家。我相信你可以通过GSA WC软件购买他的列表。
 
顶部