2021
09-04
09-04
pandas数据处理清洗实现中文地址拆分案例
目录一、案例场景二、初步方案三、优化方案一、案例场景字段login_place,一共267725行记录,随机15条记录如下: 后续数据分析工作需要用到地理维度进行分析,所以需要把login_place字段进行拆分成:国家、省份、地区。二、初步方案 第三方中文分词库:jieba,可以对文本进行拆分。使用参考资料:jieba库的使用。初步方案:用jieba.cut()将文本拆分为单词列表list_word;分支判断list_word长度,...
继续阅读 >