2021
07-17
07-17
详解PHP优化巨量关键词的匹配
目录问题由来原始-grep设计代码进化-正则设计正则小坑代码觉醒-拆词设计代码结果终级-Trie树trie树设计代码结果他径-多进程设计结果总结问题由来前些天工作中遇到一个问题:有60万条短消息记录日志,每条约50字,5万关键词,长度2-8字,绝大部分为中文。要求将这60万条记录中包含的关键词全部提取出来并统计各关键词的命中次数。原始-grep设计一开始接到任务的时候,我的小心思立刻转了起来,日志+关键词+...
继续阅读 >