如何爬取过时的网站?

大家好,有人能指导我如何爬取数千个过时的WordPress网站吗?我可以爬取黄页和Google地图,但如何找出这些网站是否过时?有什么办法可以做到这一点吗?
 

suginnimen1979

New member
过时对你意味着什么?该网站不是新网站并且具有旧的样式/技术?或者如果域名过期,并且仅在错误的目录中挂起。
 
指过时的是指该网站不是新的,并且具有旧的样式。你知道那些已经多年没有更新的并且看起来非常旧的网站。
 

tiospacduti1980

New member
那么计划是通过冷营销向他们销售网站。听起来很好,但不管2022-23年使用冷营销工具都不会奏效。不要浪费时间。
 
你可以使用像PublicWWW这样的工具来搜索旧网站构建者放在源代码中的字符串。像Microsoft Frontpage和Dreamweaver这样的应用程序以前会放置特定的注释标签和元作者/生成器标签——如果你能找到其中一些并且在PublicWWW上搜索,你会得到从石器时代就存在的网站。但要注意的是,许多这样的网站都是由网站所有者设计的,批评一个网站陈旧可能会让他们感到不高兴。
 
我查了一下PublicWWW。谢谢,这正是我需要的。我还计划从黄页上爬取没有网站的商家,并进行冷门销售。你觉得这样做是个好主意吗?
 

tetidithi1985

New member
为什么不行?为什么在2022-23年这么做会浪费我们的时间?你必须拥有可靠的事实/数据来支撑,能分享给我们吗?谢谢。
 
告诉我你最后一次从陌生人的电子邮件购买了什么。此外,大多数(这是罕见的)电子邮件的平均打开率会进入收件箱而非垃圾邮件,大约为20%,无针对性的冷门邮件的平均回复(而不是购买)率为1%。这意味着平均需要发送500封电子邮件才能得到1个答复。而对于我来说,例如谷歌广告的点击购买率可达到10-20%。
 

mawatdibu1978

New member
好的,你有道理。我很感激,但如果我说这不是那种“冷门邮件”呢?我甚至不会提及出售任何东西,我只是告诉他们一些建议,让他们的网站看起来更符合今天的最低要求、需求和趋势。当他们回复时,我才可以开始给他们一些想法或迫切行动(继续跟进),然后销售过程开始。
 
寻找旧版本或其他WordPress插件,这些插件在HTML源中留下指纹。甚至可以搜索旧版版权文本的简单内容:(c)2010年。
 
你有Shodan吗?搜索初学网站开发人员使用的页面构建器:“PHP/5” platform=wordpress“PHP/7.0” platform=wordpresshttp.component:"wpbakery"http.component:"divi""wp-content/themes/Avada/"“wp-content/themes/betheme/”等等。
 
顶部