本方案是2014年9月份最新的思绪。在6月份方案根本上做了重大改良,大大进步的收集的效力。
综合了下面两种思绪:
1)折线图偏移算法;一次查询可以获得N天的数据(6月份的方案一次查询只能获得一天的数据),削减被封(账户/IP)的几率。
2)Webkit摹拟鼠标移动,OCR切确提取;当偏移算法误差较大时主动进行校订。
在加速速度的同时也包管了切确度。
该方案一次查询最多可以收集6个月(N=180天)的数据。
算法1)的切确度跟查询的距离时候(距离时候=终止日期-肇端日期)有关,误差值跟距离天数成正比。
具体的有一些数字供参考:
* 距离时候1天误差: 0.1%
* 距离时候10天误差: 0.2% 建议采取该距离!
* 距离时候30天误差:1%