目前历史追踪功能是这样做的。
历史数据只存储 10 天,每天大概 1500 万数据,所以最多限制存了 1.5 亿条数据。然后数据是通过 parquet 形式落地到磁盘的,查询用的 duckdb ,数据之间的相似性通过汉明距离来判断(有可能误判),没有通过 ai 去做,是因为 ai 的消耗太大了。
额,上面有点嘴碎了。功能大概就是,点击某一条热点旁边的趋势按钮,弹框里显示最近类似的所有热点。朋友们可以帮忙测测提提意见。
热榜站地址:tgmeng.com