百度搜索风云榜更新时间揭秘
按照百度搜索风云榜的说明——每天发布的关键词风云榜,系根据前1天0:00--24:00的搜索量统计自动计算生成,每天早上自动更新。 ”如果百度搜索风云榜是自动更新的话,应该是固定时间的,可以准确到分钟,可是实际上百度搜索风云榜的更新时间是不固定的,而且差别还蛮大的。
一开始的时候我观察到是每天9点抓取数据,但是偶尔也只会得到昨天的数据。然后再延迟半小时,9点半去看,大部分情况下都更新了,但是有时9点半时都还是昨天的数据,更严重的是有一天这个榜单完全没更新过,那天我每隔几小时查看一次,结果一天都没变。
这么怪异的更新时间让我觉得这是人工更新的,而不是完全由程序生成。其实并不是人工生成,而是人工审核,估计这些关键字都需要经过人工审核,把可能有问题的关键字先除去才能出街。毕竟上升最快关键字是反映整个网络瞬间热点的一个非常好的工具,同时经常能够反映一些突发事件,那么对于一些意外事件,或者说某些“未经批准的多人参与的活动”(大家知道是什么了吧),也有可能反映到这个榜单上面,所以这个榜单需要人工审核,以免“泄漏天机”。
而且更新时间是在早上,而不是凌晨0时,或凌晨1时,因为那个时间没人上班,白天才有人上班。本来上升最快关键字是对比昨天和前天的搜索量的,这个由程序来做的话超过当天凌晨零时便可以立即更新了。一般的工作时间是早上9点开始,所以百度的榜单也是9点多的时候更新,有时早,有时晚,但是都是在那个时间附近,说明了这个工作人员每天上班第一件事就是审核榜单数据并发表。
收藏到网摘:


