现在你们是如何爬取Instagram的数据的?

sabritoploa1987

New member
由于Instagram API已经消失,网络抓取变得非常困难。我猜最好的方法是使用多个账户登录,并检查账户和获取所需内容。还有其他工作方法或我忽视的方法吗?
 
搜索引擎抓取缓慢,但您总是可以作为备选方案使用它,例如:“@gmail.com”“小众”站点:instagram.com。
 

fritaderer1971

New member
您可以使用此类型的链接获取有关帐户的信息:https://www.instagram.com/therock/?__a=1(从干净的IP中打开,无需在浏览器中存在现有IG会话)。您将需要大量代理和一些简单的抓取脚本。另一种选择是模拟移动rest API,然后使用您的帐户抓取其他帐户,这更加稳定,但需要进行一些严格的设置,因为如果您仅将您的帐户用于抓取,它们会很快被操作锁定。
 
“嗯,是的,那是我在 API 可用时使用的方法。你可以在它让你登录前加载大约3个简介,我猜从第三方网站爬取数据会更便宜。”
 
Instagram API(免费教程,SDK文档和定价)| RapidAPI在世界最大的API Hub上浏览最佳的高级和免费Instagram API。阅读最新的Instagram API文档、教程等。rapidapi.com谢谢,我会看看这些的。
 

iskebenlu1982

New member
我是关于这些SEO事情的新手,所以如果我问了一些愚蠢的问题,请原谅。我没有理解模拟移动REST API的概念,你能进一步解释一下吗?谢谢。
 

esskatrige1982

New member
这种方法已经有一段时间没有起作用了。(IG很奇怪,我见过他们打开和关闭那个?__a=1端点几次)这是一种当前有效的方法,不需要登录: import requests、import json、target="cats"、url="https://www.instagram.com/" target、params={'__a':1,'__d':'dis'}、s=requests.Session()、r=s.get(url,params=params,headers=None)、data=r.json()、print(json.dumps(data,indent=4))、print(data['graphql']['user']['id'])
 

wollnehynor1979

New member
爬取公开可用数据是合法的,但您需要小心,不要提取受版权保护或包含个人信息的内容。因此,在爬取Instagram之后,请仔细检查您的输出数据,以确保不违反GDPR、CCPA或可能被认为是知识产权的数据。
 
顶部