2021
09-22
09-22
Python实现生活常识解答机器人
一、问答平台这个「生活常识解答」机器人采用的是:阿里达摩院发布的语言模型PLUG(最近刚发布的,目前是测试阶段),地址链接如下:https://nlp.aliyun.com/portal#/BigText_chinese该模型参数规模达270亿,采用1TB以上高质量中文文本训练数据,包括了新闻、小说、诗歌、常识问答等类型。先来看一下原页面效果这里是需要登录阿里云账号,登录之后可以在网页进行测试问答!因此我们下面将通过抓包方式获取这个问答的请求链接,然后...
继续阅读 >
前提搭建钉钉应答机器人,需要先准备或拥有以下权限:钉钉企业的管理员或子管理员(如果不是企业管理员,可以自己创建一个企业,很方便的)有公网通信地址(内网穿透也可以);钉钉群机器人开发文档:https://developers.dingtalk.com/document/app/overview-of-group-robots创建「机器人」应用登录「钉钉开发者后台」,选择「应用开发」——「企业内部开发」——「机器人」输入好机器人的基本信息之后,就会生成创建一个...
一、前言今天教大家如何用Python爬虫去搭建一个「生活常识解答」机器人。思路:这个机器人主要是依托于“阿里达摩院发布的语言模型PLUG”,通过爬虫的方式,发送post请求(提问),然后返回json数据(回答)二、问答平台这个「生活常识解答」机器人采用的是:阿里达摩院发布的语言模型PLUG(最近刚发布的,目前是测试阶段) 该模型参数规模达270亿,采用1TB以上高质量中文文本训练数据,包括了新闻、小说、诗歌、常识问答等类...
一、准备训练数据主要的数据有两个:1.小黄鸡的聊天语料:噪声很大2.微博的标题和评论:质量相对较高二、数据的处理和保存由于数据中存到大量的噪声,可以对其进行基础的处理,然后分别把input和target使用两个文件保存,即input中的第N行尾问,target的第N行为答后续可能会把单个字作为特征(存放在input_word.txt),也可能会把词语作为特征(input.txt)2.1小黄鸡的语料的处理defformat_xiaohuangji_corpus(word=False):"""...