Skip to content

Commit ed49ed9

Browse files
committed
更新了数据分析部分的文档
1 parent aa64dfc commit ed49ed9

File tree

2 files changed

+39
-12
lines changed

2 files changed

+39
-12
lines changed

Day66-70/67.NumPy的应用.md

Lines changed: 35 additions & 12 deletions
Original file line numberDiff line numberDiff line change
@@ -1,8 +1,24 @@
11
## NumPy的应用
22

3-
Numpy是一个开源的Python科学计算库,**用于快速处理任意维度的数组**。Numpy**支持常见的数组和矩阵操作**,对于同样的数值计算任务,使用NumPy比直接使用Python不仅代码要简洁的多,而且NumPy在性能上远远优于原生Python,基本是1到2个数量级的差距,数据量越大,NumPy的优势就越明显。
3+
Numpy是一个开源的Python科学计算库,**用于快速处理任意维度的数组**。Numpy**支持常见的数组和矩阵操作**,对于同样的数值计算任务,使用NumPy不仅代码要简洁的多,而且NumPy的性能远远优于原生Python,基本是1个到2个数量级的差距,而且数据量越大,NumPy的优势就越明显。
44

5-
Numpy最为核心的数据类型是`ndarray`,使用`ndarray`可以处理一维、二维和多维数组,该对象相当于是一个快速而灵活的大数据容器。NumPy底层代码使用C语言编写,解决了GIL的限制,`ndarray`在存储数据的时候,数据与数据的地址都是连续的,这样就给使得批量操作数组元素时速度很快,远远优于Python中的`list`;另一方面`ndarray`对象提供了更多的方法来处理数据,尤其是和统计相关的方法,这些方法也是原生的`list`没有的。
5+
Numpy最为核心的数据类型是`ndarray`,使用`ndarray`可以处理一维、二维和多维数组,该对象相当于是一个快速而灵活的大数据容器。NumPy底层代码使用C语言编写,解决了GIL的限制,`ndarray`在存储数据的时候,数据与数据的地址都是连续的,这样就给使得批量操作速度很快,远远优于Python中的`list`;另一方面`ndarray`对象提供了更多的方法来处理数据,尤其是和统计相关的方法,这些方法也是Python原生的`list`没有的。
6+
7+
### 安装和导入NumPy
8+
9+
1. 安装
10+
11+
```Bash
12+
pip install numpy
13+
```
14+
15+
2. 导入
16+
17+
```Python
18+
import numpy as np
19+
```
20+
21+
> **说明**:如果已经启动了Notebook但尚未安装NumPy,可以在单元格中输入`!pip install numpy `并运行该单元格来安装NumPy,安装成功后记得重启Notebook内核来使新安装的库生效。
622

723
### 创建数组对象
824

@@ -19,25 +35,32 @@ Numpy最为核心的数据类型是`ndarray`,使用`ndarray`可以处理一维
1935
- 方法五:通过numpy.random模块的函数生成随机数创建数组对象
2036
3. 多维数组:跟上面的情况相似,可以通过下面的例子进行了解。
2137

22-
### 数组对象基本属性
38+
### 数组对象的属性
2339

24-
1. size属性:元素个数
25-
2. shape属性:数组的形状
26-
3. dtype属性:元素的数据类型
27-
4. ndim属性:数组的维度
40+
1. size属性:数组元素个数
41+
2. itemsize属性:数组单个元素占用内存空间的字节数
42+
3. shape属性:数组的形状
43+
4. dtype属性:数组元素的数据类型
44+
5. ndim属性:数组的维度
45+
6. flat属性:数组(一维化之后)元素的迭代器
46+
7. nbytes属性:数组所有元素占用内存空间的字节数
47+
8. base属性:数组的基对象(如果数组共享了其他数组的内存空间)
2848

29-
### 数组对象常用方法
49+
### 数组对象的方法
3050

51+
#### 常用方法
3152

53+
#### 统计方法
3254

33-
### 数组的运算
55+
####其他方法
3456

35-
1. 标量运算
36-
2. 矢量运算
57+
### 数组的运算
3758

38-
### 数组的其他操作
59+
#### 标量运算
3960

61+
#### 矢量运算
4062

63+
#### 广播机制
4164

4265
### 矩阵运算
4366

Day66-70/68.Pandas的应用.md

Lines changed: 4 additions & 0 deletions
Original file line numberDiff line numberDiff line change
@@ -14,6 +14,10 @@ Pandas核心的数据类型是`Series`、`DataFrame`,分别用于处理一维
1414

1515

1616

17+
#### 绘制图表
18+
19+
20+
1721
#### Index的使用
1822

1923

0 commit comments

Comments
 (0)