202110-13 Python 数据科学 Matplotlib图库详解 Matplotlib是Python的二维绘图库,用于生成符合出版质量或跨平台交互环境的各类图形。图形解析与工作流图形解析 工作流Matplotlib绘图的基本步骤:1 准备数据2 创建图形3绘图4自定义设置5保存图形6显示图形importmatplotlib.pyplotaspltx=[1,2,3,4]#step1y=[10,20,25,30]fig=plt.figure()#step2ax=fig.add_subplot(111)#step3ax.plot(x,y,color='lightblue',linewidth=3)#step3\4a... 继续阅读 >
201807-31 2018年,20大Python数据科学库都做了哪些更新? 2018年,Python仍然是数据科学领域解决重大任务和挑战的佼佼者。去年,我们发了一篇博文,列举了一些被证明是最有用的Python库。今年,我们扩充了原来的清单,并重新审视之前讨论过的库,重点关注在过去一年内出现的更新。我们对它们进行了分组,排序不分先后,因为真的说不清它们哪个更好。核心库与统计1.NumPy(提交:17911,贡献者:641)一般我们会将科学领域的库作为清单打头,NumPy是该领域的主要软件库之一... 继续阅读 >
201804-22 数据科学初学者必知的NumPy基础知识 本文介绍了一些NumPy基础知识,适合数据科学初学者学习掌握。NumPy(NumericalPython)是Python中的一个线性代数库。对每一个数据科学或机器学习Python包而言,这都是一个非常重要的库,SciPy(ScientificPython)、Mat-plotlib(plottinglibrary)、Scikit-learn等都在一定程度上依赖NumPy。对数组执行数学运算和逻辑运算时,NumPy是非常有用的。在用Python对n维数组和矩阵进行运算时,NumPy提供了大... 继续阅读 >
201603-02 数据科学能回答什么样的问题? 机器学习是数据科学的发动机。每种机器学习方法(也称为算法)获取数据,反复咀嚼,输出结果。机器学习算法负责数据科学里最难以解释又最有趣的部分。数学的魔法在此发生。机器学习算法可以根据它们所回答的问题分成几组。这种分组能够在你提炼问题时帮助思考。A类还是B类?这组算法被称为二类分类(two-classclassification)。适用于任何有两个可能选项的问题:是或否、开或关、吸烟或不吸烟、买或... 继续阅读 >