numpy 数据合并|极客教程

numpy 数据合并

在数据处理和分析中，经常会遇到需要合并多个数据集的情况。numpy 是一个Python库，可以用来进行高性能的数值计算，同时也提供了丰富的功能来处理数组数据。在本文中，我们将介绍如何使用 numpy 来合并数据。

1. 水平合并（`np.hstack` 和 `np.concatenate`）

水平合并是指将两个数组沿着水平方向拼接在一起。我们可以使用 np.hstack 函数来实现水平合并，也可以使用 np.concatenate 函数指定 axis=1 参数来实现相同的效果。

import numpy as np

# 创建两个示例数组
arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[5, 6], [7, 8]])

# 使用 np.hstack 函数水平合并
arr_hstack = np.hstack((arr1, arr2))
print("水平合并结果（np.hstack）：\n", arr_hstack)

# 使用 np.concatenate 函数水平合并
arr_concatenate = np.concatenate((arr1, arr2), axis=1)
print("水平合并结果（np.concatenate）：\n", arr_concatenate)

运行结果：

水平合并结果（np.hstack）：
 [[1 2 5 6]
  [3 4 7 8]]
水平合并结果（np.concatenate）：
 [[1 2 5 6]
  [3 4 7 8]]

可以看到，两种方法得到的结果是一样的，arr1 和 arr2 沿着水平方向被合并为一个新的数组。

2. 垂直合并（`np.vstack` 和 `np.concatenate`）

垂直合并是指将两个数组沿着垂直方向拼接在一起。我们可以使用 np.vstack 函数来实现垂直合并，也可以使用 np.concatenate 函数指定 axis=0 参数来实现相同的效果。

import numpy as np

# 创建两个示例数组
arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[5, 6], [7, 8]])

# 使用 np.vstack 函数垂直合并
arr_vstack = np.vstack((arr1, arr2))
print("垂直合并结果（np.vstack）：\n", arr_vstack)

# 使用 np.concatenate 函数垂直合并
arr_concatenate = np.concatenate((arr1, arr2), axis=0)
print("垂直合并结果（np.concatenate）：\n", arr_concatenate)

运行结果：

垂直合并结果（np.vstack）：
 [[1 2]
  [3 4]
  [5 6]
  [7 8]]
垂直合并结果（np.concatenate）：
 [[1 2]
  [3 4]
  [5 6]
  [7 8]]

同样可以看到，两种方法得到的结果是一样的，arr1 和 arr2 沿着垂直方向被合并为一个新的数组。

3. 深度合并（`np.dstack`）

深度合并是指将两个数组沿着深度方向（即第三个维度）拼接在一起。我们可以使用 np.dstack 函数来实现深度合并。

import numpy as np

# 创建两个示例数组
arr1 = np.array([[1, 2], [3, 4]])
arr2 = np.array([[5, 6], [7, 8]])

# 使用 np.dstack 函数深度合并
arr_dstack = np.dstack((arr1, arr2))
print("深度合并结果（np.dstack）：\n", arr_dstack)

运行结果：

深度合并结果（np.dstack）：
 [[[1 5]
   [2 6]]

  [[3 7]
   [4 8]]]

可以看到，arr1 和 arr2 沿着深度方向被合并为一个新的数组，arr_dstack 的维度为 (2, 2, 2)。

4. 列合并（`np.column_stack` 和 `np.c_`）

列合并是指将两个一维数组按列的方式合并成一个二维数组。我们可以使用 np.column_stack 函数或 np.c_ 对象来实现列合并。

import numpy as np

# 创建两个示例数组
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])

# 使用 np.column_stack 函数列合并
arr_column_stack = np.column_stack((arr1, arr2))
print("列合并结果（np.column_stack）：\n", arr_column_stack)

# 使用 np.c_ 对象列合并
arr_c_ = np.c_[arr1, arr2]
print("列合并结果（np.c_）：\n", arr_c_)

运行结果：

列合并结果（np.column_stack）：
 [[1 4]
  [2 5]
  [3 6]]
列合并结果（np.c_）：
 [[1 4]
  [2 5]
  [3 6]]

可以看到，arr1 和 arr2 按列方向被合并为一个新的二维数组。

5. 行合并（`np.row_stack` 和 `np.r_`）

行合并是指将两个一维数组按行的方式合并成一个二维数组。我们可以使用 np.row_stack 函数或 np.r_ 对象来实现行合并。

import numpy as np

# 创建两个示例数组
arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])

# 使用 np.row_stack 函数行合并
arr_row_stack = np.row_stack((arr1, arr2))
print("行合并结果（np.row_stack）：\n", arr_row_stack)

# 使用 np.r_ 对象行合并
arr_r_ = np.r_[arr1, arr2]
print("行合并结果（np.r_）：\n", arr_r_)

运行结果：

行合并结果（np.row_stack）：
 [[1 2 3]
  [4 5 6]]
行合并结果（np.r_）：
 [[1 2 3]
  [4 5 6]]

可以看到，arr1 和 arr2 按行方向被合并为一个新的二维数组。

结语

本文介绍了 numpy 中用于数据合并的多种方法，包括水平合并、垂直合并、深度合并、列合并和行合并。这些方法在处理和分析数据时非常有用，可以帮助我们快速简便地合并不同的数据集。

numpy 数据合并