/简体中文 /
/简体中文 /
/简体中文 /
/简体中文 /
/简体中文 /
/简体中文 /
水淼软件出品的各大电商购物网站的评论采集工具。
整合6家最大购物网站(淘宝、天猫、京东、一号店、当当网、苏宁易购)的商品评论采集,更多购物网站后续考虑加入。
可以自由引用评论内容、评论用户名(匿名不能采)、评论时间、评论用户等级和ID等信息,还可以智能引用评论中的更多扩展属性。已经自动去除重复评论。
淘宝和天猫
能采集100页评论。
京东
能采集几百到几千条评论。
一号店
能采集8-35页左右(偶尔有验证码)。
当当网
可以采集全部评论。
苏宁易购
能采集50页左右。
登录
只一次,登录完了页面一般会空白,直接关闭窗口即可继续采集
验证码
每次输入验证码后需让软件自动等待一定时间比如15分钟,软件有倒计时,到时间会自动关闭窗口继续采集
即使保存模板没有引用#晒图#,只要打勾【采集时下载到本地】选项,晒图也会下载到保存目录下的子目录中。
而打勾【采集多张晒图】,就能返回某个评论的多张图片,否则只返回一张图片。
而保存模板里引用#晒图#时保存的是图片地址,多张图片地址一行一个。
csv是一种文本表格,能被Excel兼容显示为多列多行的数据。
只要在保存模板中设置为:"#评论#","#时间#","#昵称#",这种格式就是csv格式,使用引号围住每个项目,多个项目使用逗号隔开,然后保存扩展名填为csv即可
一行一个的商品地址。如果放的地址为本地文件路径,将读入该文件内容中的商品地址。支持拖放本地文件到地址列表。淘宝和天猫支持直接使用商品ID进行采集。
不弹出验证窗口
遇到需要登录或验证码时,软件默认会弹出浏览器窗口让用户手动处理;但是经过水淼测试,有时不必弹出窗口,由程序内部自动处理即可自动继续采集。如果内部自动处理采集不了,请取消打勾本选项改为用户手动处理。
保存模板
可以引用评论内容、评论的用户名等信息,自由组合。
每页延秒
如果大量高速采集可能会被限制,可根据情况设定每采集一页等待的秒数。通常情况可设置为0,就是不等待。
采集页数
设置为0自动采集全部页评论,否则仅采集指定页数的评论。
每文件几个评论
就是每几个评论保存为一个文件。设置为0则每个商品的全部评论保存为一个文件。
保存目录
右击“..”按钮可以在“我的电脑”里打开该目录。
开始采集
右击“开始采集”按钮可预览一页评论,左击则是正式采集并保存到文件。
1.0.0.0:首个版本发布于2014-11-06深夜3点半
1.0.0.1:最新2014年11月8日测试发现京东比较容易采集失败,本次更新特别加强尝试次数。
1.0.1.0:当使用过滤评论时相应提高采集空次数,避免采集页不足;其他更新。
1.0.2.0:修复淘宝店铺采集商品地址失效的问题;增加保存命名选项(商品标题、商品ID、内容随机改名)
1.0.3.0:修复部分特殊型号词无法采集采集淘宝商品地址的问题。
1.0.3.1:增加采集失败时调试显示相关信息。
1.0.4.0:根据最新淘宝变动修复相关项;试用版限制预览一页。
1.0.5.0:修正使用过滤设置后可能导致提前结束采集的问题;修改试用版提示文字。
1.0.5.1:尝试修复部分电脑取硬盘码失败的问题。
1.0.6.0:修复淘宝天猫改动导致采集店铺id失败的问题
1.0.7.0:修复部分店铺不能采集id的问题。
1.1.0.0:修复淘宝改动导致淘宝和天猫评论采集失败问题,并支持https链接。
1.1.1.0:修复淘宝改动导致采集评论失败问题。
1.1.2.0:修复淘宝改动导致采集评论失败问题(增加手动登录/输入验证码窗口)。
1.2.0.0:更换数据解析模式并修复京东数据部分情况解析不完全问题;补上晒图链接缺少的http:,并支持返回同一个评论的多条晒图。
1.2.0.1:修改登录窗口的说明名字,提示需要登录淘宝。
1.2.1.0:修复淘宝改动采集失败问题;修改多个晒图链接一行一个。
1.2.2.0:淘宝改动验证码输入无效必须等待10分钟再输入方才有效,故修改信息框提示;禁止浏览器本身可能弹出的提示框;修改读取网页的一些细节。
1.2.3.0:增加商品地址采集器的采集前登录。
1.2.5.0:修复商品地址采集器-关键词采集-京东失败问题。
1.3.0.0:新增 保存模板 的可引用项目3个,#店铺名#、#店铺地址#、#商品地址#。
1.3.5.0:新增淘宝登录或验证码的10分钟自动等待继续,并测试发现最近(2016年2月17日)淘宝已经放松了(连续采集几百页、一千页甚至更多都不会弹出验证码);商品地址采集器也新增支持登录或验证的自动弹出,并新增支持品牌词采集;鉴于淘宝对采集速度没什么限制,故将每页延时秒的默认值设置为0以提高速度。
1.3.6.0:商品地址采集器的店铺采集新增支持与淘宝挂钩的淘宝之外域名的店铺采集;补充检测天猫验证的部分代码;上一个版本你发现的淘宝放松,现在又严格了。
1.3.9.0:新增晒图可选返回多张图片或单张图片选项,并增加晒图的下载选项(自动下载到保存目录下的以商品ID命名的目录里面)
1.3.10.0:修复京东关键词采集商品地址失败问题
1.5.0.0:新增一号店、当当网、苏宁易购的评论采集;追加评论改为使用空格隔开而不是||隔开;商品地址采集器同步更新;其他更新。
1.5.1.0:修复因淘宝限制无法在XP系统上采集淘宝的问题(也就是现在可以xp采集了);2016年8月11日发现的新办法可以让天猫不用登录和输验证码也能自动继续采集;加强当当采集逻辑;改善京东无数据时采集速度;其他更新
1.5.2.0:升级淘宝与天猫数据同源(原本只有天猫可以绕过验证码,现在这样淘宝也能绕过验证码问题了,当然未来还可能会变);新增淘宝天猫的在线打码设置
1.5.3.0:修复苏宁采集失败问题
1.5.3.5:保存模板新增 #商品地址# 引用;新增命名方式:商品标题@#@#商品id
1.5.5.0:修复最新天猫改动导致采集有时不完整的问题;修复个别天猫地址获取id错误导致采集失败的问题
1.5.6.0:修复京东改动导致关键词采集和店铺采集京东地址失败的问题
1.5.7.0:修复淘宝改动导致无法采集地址的问题(但也无法采集全部了)
1.5.8.0:修复淘宝天猫改动导致无法采集评论的问题(基于1.5.5.0)
1.5.9.0:修复淘宝天猫改动导致无法采集评论的问题
1.5.10.0:修复京东晒图有水印的问题
1.6.0.0:淘宝评论增加了谷歌内核浏览器来完成滑块验证的功能(所以软件体积增大),测试一般验证通过一次能采集很久了;修复京东地址采集
1.6.1.0:修复淘宝天猫验证不过的问题(可能只是暂时的)
1.6.1.3:尝试修复淘宝天猫验证问题(每页延迟秒最好10以上)
1.6.2.0:尝试修复淘宝天猫验证问题(测试发现改变窗口尺寸通过率大,不用每页延迟秒10了)
1.6.3.0:修复京东评论无法采集的问题;针对淘宝天猫新情况进行优化(出现验证后务必要改变窗口大小再滑动才更容易通过)
1.6.5.0:修复京东评论采集