202109-07 分析机器学习之决策树Python实现 目录一、环境准备二、决策树是什么三、快速入门分类树四、详细分析入门案例五、分类树参数解释5.1、criterion5.2、random_state&splitter5.3、剪枝参数5.4、目标权重参数:class_weight&min_weight_fraction_leaf一、环境准备在开始学习前,需要准备好相应的环境配置。这里我选择了anaconda,创建了一个专门的虚拟环境来学习机器学习。这里关于anaconda的安装等就不赘述了,没有难度。二、决策树是什么通俗的说,有督促学习方... 继续阅读 >
202107-16 python基于机器学习预测股票交易信号 目录引言数据获取与指标构建数据获取构建目标变量(targetvariable)技术指标特征构建计算技术指标模型预测与评估加入技术指标特征特征的优化结语引言近年来,随着技术的发展,机器学习和深度学习在金融资产量化研究上的应用越来越广泛和深入。目前,大量数据科学家在Kaggle网站上发布了使用机器学习/深度学习模型对股票、期货、比特币等金融资产做预测和分析的文章。从金融投资的角度看,这些文章可能缺乏一定的理论基础支撑(或... 继续阅读 >
202105-02 python 机器学习的标准化、归一化、正则化、离散化和白化 机器学习的本质是从数据集中发现数据内在的特征,而数据的内在特征往往被样本的规格、分布范围等外在特征所掩盖。数据预处理正是为了最大限度地帮助机器学习模型或算法找到数据内在特征所做的一系列操作,这些操作主要包括标准化、归一化、正则化、离散化和白化等。1标准化 假定样本集是二维平面上的若干个点,横坐标x分布于区间[0,100]... 继续阅读 >
202105-02 吴恩达机器学习练习:SVM支持向量机 1SupportVectorMachines1.1ExampleDataset1%matplotlibinlineimportnumpyasnpimportpandasaspdimportmatplotlib.pyplotaspltimportseabornassbfromscipy.ioimportloadmatfromsklearnimportsvm大多数SVM的库会自动帮你添加额外的特征X₀已经θ₀,所以无需手动添加mat=loadmat('./data/ex6data1.mat')print(mat.keys())#dict_keys(['__header__','__version__','__globals__','X','y'])X... 继续阅读 >
202104-27 深度学习详解之初试机器学习 机器学习可应用在各个方面,本篇将在系统性进入机器学习方向前,初步认识机器学习,利用线性回归预测波士顿房价;原理简介利用线性回归最简单的形式预测房价,只需要把它当做是一次线性函数y=kx+b即可。我要做的就是利用已有数据,去学习得到这条直线,有了这条直线,则对于某个特征x(比如住宅平均房间数)的任意取值,都可以找到直线上对应的房价y,也就是模型的预测值。从上面的问题看出,这应该是一个有监督学习中的回归问题,... 继续阅读 >
202101-29 Python机器学习工具scikit-learn的使用笔记 scikit-learn是基于Python语言的机器学习工具简单高效的数据挖掘和数据分析工具可供大家在各种环境中重复使用建立在NumPy,SciPy和matplotlib上开源,可商业使用-BSD许可证sklearn中文文档:http://www.scikitlearn.com.cn/官方文档:http://scikit-learn.org/stable/sklearn官方文档的类容和结构如下:sklearn是基于numpy和scipy的一个机器学习算法库,设计的非常优雅,它让我们能够使用同样的接口来实现所... 继续阅读 >
202010-10 python实现AdaBoost算法的示例 代码'''数据集:Mnist训练集数量:60000(实际使用:10000)测试集数量:10000(实际使用:1000)层数:40------------------------------运行结果:正确率:97%运行时长:65m'''importtimeimportnumpyasnpdefloadData(fileName):'''加载文件:paramfileName:要加载的文件路径:return:数据集和标签集'''#存放数据及标记dataArr=[]labelArr=[]#读取文件fr=open(fileName)#遍历文件中的每一行... 继续阅读 >
202010-10 python 实现朴素贝叶斯算法的示例 特点这是分类算法贝叶斯算法的较为简单的一种,整个贝叶斯分类算法的核心就是在求解贝叶斯方程P(y|x)=[P(x|y)P(y)]/P(x)而朴素贝叶斯算法就是在牺牲一定准确率的情况下强制特征x满足独立条件,求解P(x|y)就更为方便了但基本上现实生活中,没有任何关系的两个特征几乎是不存在的,故朴素贝叶斯不适合那些关系密切的特征fromcollectionsimportdefaultdictimportnumpyasnpfromsklearn.datase... 继续阅读 >
201806-14 11 个 AI 和机器学习模型的开源框架 过去十年中人工智能的飞速增长刺激了当今就业市场对AI和ML技能的巨大需求。从金融到医疗保健,现在几乎所有行业都在使用基于ML的技术。本文将介绍一系列可用于构建机器学习模型的最佳框架和库。1.TensorFlowTensorFlow是Google开发的一款开源软件库,专为深度学习或人工神经网络而设计。TensorFlow允许你可以使用流程图创建神经网络和计算模型。它是可用于深度学习的最好维护和最为流行的开源库之一。TensorFlow框... 继续阅读 >
201805-14 想入门设计卷积神经网络?这是一份综合设计指南 这篇文章可以作为一个设计指南,为特定分类任务的CNN设计提供指导。作者围绕准确率、速度、内存消耗三个指标的权衡,从网络类型、架构设计、数据处理和迁移学习等方面介绍了CNN设计过程中使用的方法。你想开始做图像分类,但是无从着手。应该使用哪个预训练网络?如何修改网络以使其满足需求?你的网络应该包含20层还是100层?哪些是最快的、最准确的?这些是你为图像分类选择最好的CNN时会遇到的众多问题。... 继续阅读 >
201805-07 从零开始,了解元学习 元学习是目前机器学习领域一个令人振奋的研究趋势,它解决的是学习如何学习的问题。传统的机器学习研究模式是:获取特定任务的大型数据集,然后用这个数据集从头开始训练模型。很明显,这和人类利用以往经验,仅仅通过少量样本就迅速完成学习的情况相差甚远。因为人类学习了「如何学习」。在这篇文章中,我将从一个非常直观的元学习简介入手,从它最早的起源一直谈到如今的元学习研究现状。然后,我会从头开始... 继续阅读 >
201803-08 国际象棋版AlphaZero出来了诶,还开源了Keras实现ヽ( `0´)ノ 只用了不到4小时。AlphaZero在去年底通过自我对弈,就完爆上一代围棋冠军程序AlphaGo,且没有采用任何的人类经验作训练数据(至少DeepMind坚持这么认为,嗯)。昨天,GitHub有位大神@Zeta36用Keras造出来了国际象棋版本的AlphaZero,具体操作指南如下。项目介绍该项目用到的资源主要有:去年10月19号DeepMind发表的论文《不靠人类经验知识,也能学会围棋游戏》基于DeepMind的想法,GitHub用户@mokemokechi... 继续阅读 >
201801-19 人工智能在视频应用领域的探索 人工智能热度很高,但泡沫也很大。人工智能在视频领域的应用已经走入寻常人的生活,人脸识别,视频自动抠像技术已经比较成熟。除此之外,人工智能还能为视频应用带来哪些变化呢?鲍金龙撰文,描述了人工智能在视频应用中的实践探索,涉及编解码器、超分辨率等。文/鲍金龙序:人工智能来生今世人工智能是一个非常广泛的领域,当前人工智能涵盖很多大的学科,大致归纳为六个:计算机视觉(暂且把模式... 继续阅读 >
201801-10 机器学习算法 Python 实现 机器学习算法Python实现目录机器学习算法Python实现逻辑回归_手写数字识别_OneVsAll六、PCA主成分分析(降维)3、主成分分析PCA与线性回归的区别6、主成分个数的选择(即要降的维度)9、使用scikit-learn库中的PCA实现降维七、异常检测AnomalyDetection1、高斯分布(正态分布)3、评价的好坏,以及的选取... 继续阅读 >
201712-04 (译)TensorFlow 广度和深度学习的教程 TensorFlow在训练深度神经网络方面效果也很好,那么你可能会考虑该如何取舍它的功能了–可是,为什么不选择两者兼得呢?那么,是否可以将两者的优势结合在一个模型中呢?在这篇文章中,我们将会介绍如何使用TF.LearnAPI同时训练一个广度线性模型和一个深度前馈神经网络。这种方法结合了记忆和泛化的优势。它在一般的大规模回归和具有稀疏输入特性的分类问题(例如,分类特征存在一个很大的可能值域)上很有效。如果你... 继续阅读 >
201709-18 初学者指南:神经网络在自然语言处理中的应用 深度学习正在给自然语言处理带来巨大的变革。但是,作为一个初学者,要从哪里起步才好呢?深度学习和自然语言处理都是很宽泛的领域。哪些方面才是最重要的,还有,深度学习又是从哪个层面深刻影响了 NLP 呢?看完这篇文章之后,你将会知道:给自然语言处理领域带来最深刻影响的神经网络结构;深度学习可以对自然语言处理的各个层面制定学习任务;密集词汇表示的重要性和学习表示的方法。... 继续阅读 >