很大一部分卖家都是从速卖通aliexpress平台开始的跨境电商之路的。虽然速卖通的超低价竞争,加上高昂的广告投入让卖家们都很头疼,利润也越来越薄,但凭借alibaba先天的走量优势,速卖通aliexpress薄利多销,成为几乎大部分跨境电商大卖家的必争之地。

近年来,alibaba加大了全球化战略部署,速卖通的主要订单量来自俄罗斯、巴西、美国、西班牙、法国、乌克兰、以色列、白俄罗斯、加拿大、荷兰等国家。接着又直接掌控了东南亚lazada平台,直接接触到6个国家中约5.5亿的顾客;国内就更不用说了,淘宝天猫已经足够庞大了。近期alibaba又投资了印度电商平台等等。这一系列动作,alibaba掌控了全球人口数量最多的电商平台。也是目前唯一能和亚马逊对抗的家伙。如果有一天,跨境电商只剩两个平台了,我想一个是亚马逊,那另一个一定是阿里巴巴了。

跨境电商批量采集系列教程四(速卖通 aliexpress)教你如何批量采集速卖通Aliexpress平台上的产品 1

今天的话题是教大家如何批量采集速卖通上的产品。在众多不同平台中,速卖通在防采集方面下了不少功夫,做的工作也是最多的。所以,批量采集的要点并非分析内容抓取,而是想方设法如何对付防采集。按照之前的步骤,我们还是先一步一步来。

一、分析

我们仍然以类目为入口,通过类目进行翻页方式,得到所有要采集的产品内容页地址,然后在逐个爬取产品内容信心。

任何找一个类目,比如 墙贴  点击下方的翻页按钮,观察访问地址变化情况。

 跨境电商批量采集系列教程四(速卖通 aliexpress)教你如何批量采集速卖通Aliexpress平台上的产品 2

通过翻页操作,我们发现地址栏上除了.htm之前的数字变化了,其他没有出现变化。.htm后面的“?site=glo&g=y&needQuery=n&tag=”则是辅助信息,并不影响页面的访问。这样一来,我们就得到了需要的列表页信心。https://www.aliexpress.com/category/200002937/wall-stickers/【参数】.html

跨境电商批量采集系列教程四(速卖通 aliexpress)教你如何批量采集速卖通Aliexpress平台上的产品 3

接下来,是进入内容页, 找到需要采集的内容。这次,我们采集产品标题和主图进行演示。

速卖通的页面中并未通过json数据包方式加载内容,所以,可以直接通过反敲右键查看源代码方式找到需要的内容。

跨境电商批量采集系列教程四(速卖通 aliexpress)教你如何批量采集速卖通Aliexpress平台上的产品 4

前后截取方式,前面从<title>开始截取,以-in Wall Stickers from Home &amp; Garden on Aliexpress.com | Alibaba Group</title>结尾。即可获得标题内容;

跨境电商批量采集系列教程四(速卖通 aliexpress)教你如何批量采集速卖通Aliexpress平台上的产品 5

主图就更简单了,我们发现在head区域中的<meta property=”og:image” 里面,直接放置了主图路径地址。有了这些,接下就可以开始抓取了。

二、采集

打开火车采集器,新建一个任务,命名为aliexpress;

在采集地址页中输入刚才得到的列表页地址,翻页部分用变量参数替代,然后进行列表页测试。

问题来了,第一次测试可以正常获得需要的内容,第二次则什么信息都无法获得。这是原因?很简单,速卖通的防爬虫机制生效了。当重新打开速卖通时,页面会被跳转到登录页面,告诉你,你得登录才能访问。

解决办法倒是不难,获取cookie信息。

跨境电商批量采集系列教程四(速卖通 aliexpress)教你如何批量采集速卖通Aliexpress平台上的产品 6

设置采集列表页内容。

跨境电商批量采集系列教程四(速卖通 aliexpress)教你如何批量采集速卖通Aliexpress平台上的产品 7

设置内容网址获取规则

跨境电商批量采集系列教程四(速卖通 aliexpress)教你如何批量采集速卖通Aliexpress平台上的产品 8

需要登录才能继续访问页面,点击设置,登录网站

跨境电商批量采集系列教程四(速卖通 aliexpress)教你如何批量采集速卖通Aliexpress平台上的产品 9点击试用浏览器获取网页登陆信息,在内置浏览器中完成登录操作,系统会自动记录下获取到的cookie信息,保存。

在内容采集规则选项卡中,填入采集规则,用前后截取方式,将上面分析出来的内容填入进去,然后进行测试是否获取正常

跨境电商批量采集系列教程四(速卖通 aliexpress)教你如何批量采集速卖通Aliexpress平台上的产品 10

最后,开始采集,发布数据。

到这里,采集过程就基本结束了。当然,如果你无法顺利采集到信息,也别奇怪,上面也说了,速卖通在防范爬虫批量抓取上下了很大功夫。当你的爬取速度太快时,你的IP地址也会被屏蔽掉,要求你手工输入验证码才能继续访问。当然,解决方法也有很多,这方面话题不适合公开讨论,大家可以自己摸索试试。如果你是会员,别担心,我在录制的演示讲解视频中做了一些解决方法分享,可以帮助解决一部分被屏蔽问题,稍晚些时候,可登录 会员区 查看演示讲解视频。

5/5 - ( 1 vote )

晨飞,现居加拿大多伦多,是一位拥有丰富技术背景和实战经验的跨境创业者,也是一位文案作家。他不仅精通Wordpress网站开发和网络营销,还是内容营销的专家。通过撰写高质量的原创文章,他成功地帮助了北美的许多合作伙伴推广他们的产品和服务。

晨飞拥有加拿大教育背景,曾参与数字营销专业的研究生文凭课程学习,因此对北美的生活和商业环境有着深入的了解。他总是愿意尽自己所能,去理解和满足会员和读者的需求,不仅提供专业知识,还分享自己的个人经验。

跨境电商批量采集系列教程四(速卖通 aliexpress)教你如何批量采集速卖通Aliexpress平台上的产品 11

近期,晨飞将他在北美市场的实战经验和深入研究整理成了一本名为《北美跨境创业实战手册》的书。这本书不仅涵盖了理论知识,更加重要的是,它包括了一系列实战经验和案例分析。这是他对跨境创业领域的深入研究和实践的成果,旨在为那些渴望在跨境创业道路上有所作为的人提供实用的指导和启发。如果一切顺利,这本书将在不久的将来出版。

如果你愿意成为晨飞的付费会员,你将更有可能获得他的个性化帮助。无论你在跨境创业的过程中遇到什么问题或困难,晨飞都会尽全力为你提供解答和支持。会员区内还有更多他的专业知识和个人经验分享,你定会从中受益匪浅。

直接的对话和交流是解决问题的最快方式,也是他自己学习和进步的途径。他希望通过信息反馈和互动,帮助更多的用户避免走弯路,更快地在跨境创业道路上取得成功。晨飞热切期待你的加入,一同书写技术和创业成长的精彩篇章。