在本地测试了一下采集器,目前的逻辑是
采集后直接添加到了数据库,这样采集的内容都会占用了ID,数据发布不一定按最新的发布。
这时候会导致,发布时间跟采集的内容产生一个矛盾。
如:2021年1月31日 采集了100篇文章。 选择性发布了2篇
ID99的文章发布时间 2021年1月31日 00:46:52
ID10的文章发布时间 2021年2月1日 14:47:16
ID 大的,发布时间排序反而是昨天。
建议采集到的数据,不要直接入库,先建立一个临时数据库,需要的时候在导入到数据库中,这样还可以做到真正意义的定时发布。