2021
05-20
05-20
python通过Seq2Seq实现闲聊机器人
一、准备训练数据主要的数据有两个:1.小黄鸡的聊天语料:噪声很大2.微博的标题和评论:质量相对较高二、数据的处理和保存由于数据中存到大量的噪声,可以对其进行基础的处理,然后分别把input和target使用两个文件保存,即input中的第N行尾问,target的第N行为答后续可能会把单个字作为特征(存放在input_word.txt),也可能会把词语作为特征(input.txt)2.1小黄鸡的语料的处理defformat_xiaohuangji_corpus(word=False):"""...
继续阅读 >