
导读:本文主要是对《Python 3智能数据分析快速入门》一书的内容进行解读和补充,重点介绍使用Python中的Numpy库进行数据分析的过程。本文将分为多个部分,分别介绍ndarray的创建与索引、ndarray的基础操作、ufunc、matrix与线性代数、Numpy文件读写等内容。
01 ndarray创建与索引
一、数组维数概念
在计算机科学中,数组数据结构是由相同类型的元素的集合所组成,分配一块连续的内存来存储。按数组维数分类可分为:一维数组、二维数组、N维数组。
二、Numpy库介绍
Numpy是Python中最重要的科学计算库之一,提供了两种基本对象:ndarray和ufunc。ndarray是Numpy的核心,是一个数组对象,具有内存高效、支持数算等优点。
三、ndarray创建方法
书中介绍了多种创建ndarray的方法,包括使用array函数、arange函数等。还可以从Python中的列表、元组等类型创建ndarray数组,使用Numpy中的函数如full、ones_like、zeros_like等创建ndarray数组,从字节流或文件中读取特定格式创建ndarray数组等。
四、随机数生成
介绍了choice和poisson等函数生成随机数的方法。
五、ndarray的索引和切片
详细讲解了ndarray的索引和切片方法,包括一维ndarray的索引、ndarray的索引、花式索引等。并介绍了如何使用布尔型进行索引。
02 ndarray的基础操作
一、设置ndarray形状
二、展平ndarray
讲解了使用ravel和flatten方法展平ndarray。
三、组合和分割ndarray
介绍了使用hstack、vstack函数实现ndarray的横向和纵向组合,使用concatenate函数组合ndarray,使用hsplit、vsplit函数实现ndarray的横向和纵向分割,以及split函数分割ndarray等。
四、排序与搜索
讲解了使用sort、argsort、argmax和argmin函数进行排序和搜索,以及where和extract函数的搜索方法。
五、字符串操作
Numpy的char模块提供的字符串操作函数可以运用向量化运算来处理整个ndarray的字符串操作,包括连接、切片、删除、替换、字母大小写转换和编码调用等功能。
03 ufunc
ufunc是Numpy中的通用函数,可以对ndarray中所有元素进行操作。这部分介绍了ufunc的广播机制,以及常用的ufunc运算,如算数运算、三角函数、集合运算、比较运算、逻辑运算和统计计算等。
04 matrix与线性代数
Numpy的matrix是继承自Numpy的二维ndarray对象,除了拥有二维ndarray的属性、方法与函数外,还有诸多特有的属性与方法。这部分介绍了matrix与线性代数中的矩阵概念的关系,以及相关的矩阵操作。
05 Numpy文件读写
读写文件是利用Numpy进行数据处理的基础,这部分介绍了Numpy中二进制文件和文本格式的数据的读写方法,包括使用load、save、loadtxt、savetxt等函数进行读写,以及a.tofile()和np.fromfile()的使用。此外还介绍了通过元数据文件来存储额外信息的方法。
06 小结与推荐阅读
