详细介绍：《算法导论》第 2 章 - 算法基础 - wzzkaifa

大家好，今天我们来一起学习《算法导论》的第 2 章 —— 算法基础。这一章是算法学习的入门内容，主要介绍了两种经典排序算法（插入排序和归并排序）以及算法分析的基本方法，非常适合初学者打好基础。本文会结合实例代码和图解，帮助大家更好地理解和掌握这些知识点。

2.1 插入排序

插入排序是一种简单直观的排序算法，它的工作原理类似于我们整理手中的扑克牌。

基本思想

插入排序的基本思想是：将待排序的元素逐个插入到已经排好序的部分数组中，直到所有元素都插入完毕。

具体步骤如下：

从第一个元素开始，该元素可以认为已经被排序
取出下一个元素，在已经排序的元素序列中从后向前扫描
如果该元素（已排序）大于新元素，将该元素移到下一位置
重复步骤 3，直到找到已排序的元素小于或等于新元素的位置
将新元素插入到该位置后
重复步骤 2~5

插入排序代码实现（C++）

下面是插入排序的完整 C++ 代码，包含详细注释：

这段代码可以直接编译运行，它实现了对整数数组的插入排序。我们使用了 vector 容器来存储数组元素，使得代码更加灵活。

插入排序综合案例：学生成绩排序

下面我们来看一个更实际的应用案例：对学生成绩进行排序。我们将创建一个 Student 类，包含学生姓名和成绩，然后使用插入排序按照成绩从高到低进行排序。

这个案例展示了插入排序在实际应用中的用法。我们通过重载>运算符，使得插入排序算法可以直接用于 Student 对象的比较，体现了面向对象编程的灵活性。

\n2.2 分析算法

分析算法的目的是预测算法的资源消耗，以便比较不同算法的性能。在大多数情况下，我们最关心的是算法的运行时间。

分析框架

我们通常从以下几个方面分析算法：

最坏情况分析：确定算法在输入规模为 n 时的最大运行时间
最好情况分析：确定算法在输入规模为 n 时的最小运行时间
平均情况分析：确定算法在所有可能输入上的平均运行时间

在实际应用中，我们通常更关注最坏情况分析，因为：

它给出了算法运行时间的上界，保证了算法不会比这更差
对于某些算法，最坏情况经常出现
平均情况分析往往比较复杂

大 O 记号

在算法分析中，我们使用大 O 记号来描述算法的时间复杂度。大 O 记号表示的是算法运行时间的增长率上限。

例如，插入排序的最坏情况时间复杂度是 O (n²)，表示当输入规模 n 足够大时，插入排序的运行时间不会超过 n² 的某个常数倍。

常见的时间复杂度按增长率从小到大排列：

O (1)：常数时间
O (log n)：对数时间
O (n)：线性时间
O (n log n)：线性对数时间
O (n²)：平方时间
O (n³)：立方时间
O (2ⁿ)：指数时间

插入排序的时间复杂度分析

我们来分析一下插入排序的时间复杂度：

最好情况：当输入数组已经排好序时，内层循环不需要执行元素移动操作。时间复杂度：O (n)
时间复杂度：O (n)
最坏情况：当输入数组逆序排列时，每个元素都需要与前面所有已排序的元素进行比较和移动。时间复杂度：O (n²)
时间复杂度：O (n²)
平均情况：考虑所有可能的输入排列，平均情况下的时间复杂度也是 O (n²) 最好情况：当输入数组已经排好序时，内层循环不需要执行元素移动操作。

时间复杂度：O (n) 最坏情况：当输入数组逆序排列时，每个元素都需要与前面所有已排序的元素进行比较和移动。
时间复杂度：O (n²) 平均情况：考虑所有可能的输入排列，平均情况下的时间复杂度也是 O (n²)

算法分析案例：比较不同规模数据的排序时间

下面的代码演示了插入排序在不同规模数据上的运行时间，帮助我们直观感受算法复杂度的含义：

运行这段代码，你会发现当数组规模翻倍时，最坏情况和随机情况下的运行时间大约会增加到原来的 4 倍（符合 O (n²) 的特征），而最好情况下的运行时间大约会增加到原来的 2 倍（符合 O (n) 的特征）。

2.3 设计算法

算法设计是指从问题出发，构造出求解问题的有效算法的过程。常用的算法设计方法有：分治法、动态规划、贪心算法、回溯法等。本章重点介绍分治法。

2.3.1 分治法

分治法（Divide and Conquer）是一种非常重要的算法设计思想，其基本思想是：

分解（Divide）：将原问题分解为若干个规模较小、结构与原问题相似的子问题
解决（Conquer）：递归地解决这些子问题。如果子问题的规模足够小，则直接求解
合并（Combine）：将子问题的解合并为原问题的解分治法的典型应用是归并排序（Merge Sort）。

归并排序的基本思想

归并排序正是基于分治法的思想实现的：

分解：将 n 个元素分成两个各含 n/2 个元素的子序列
解决：递归地对两个子序列进行归并排序
合并：合并两个已排序的子序列，得到最终的排序结果归并排序的关键在于合并步骤：如何高效地合并两个已排序的子序列。

归并排序流程图

归并排序代码实现（C++）

这段代码实现了归并排序的完整功能。mergeSort 函数负责分解问题和递归求解，merge 函数负责合并两个已排序的子数组。

归并排序综合案例：外部排序

归并排序的一个重要应用是外部排序，即当数据量太大无法全部装入内存时的排序方法。下面是一个简单的外部排序模拟实现：

这个案例模拟了外部排序的过程，它将大文件分成多个可装入内存的块，分别排序后再逐步归并，最终得到整个文件的有序版本。这展示了归并排序在处理大规模数据时的优势。

2.3.2 分析分治算法

分治算法的时间复杂度分析通常需要求解递归式。递归式是一个用较小输入的函数值来描述函数的等式或不等式。

递归式的求解方法

求解递归式的常用方法有：

代入法：猜测一个解，然后用数学归纳法证明其正确性
递归树法：将递归式转换为一棵树，其节点表示不同层次的递归调用产生的代价
主方法：用于求解形如 T (n) = aT (n/b) + f (n) 的递归式

主方法

主方法给出了如下递归式的解：\n T (n) = aT (n/b) + f (n)

其中：

a ≥ 1，b > 1 是常数
f (n) 是一个渐近正函数
n/b 可以是 floor (n/b) 或 ceil (n/b)

主方法有三种情况：

若 f (n) = O (n^log_b (a-ε)) 对某个常数 ε > 0 成立，则 T (n) = Θ(n^log_b a)
若 f (n) = Θ(n^log_b a)，则 T (n) = Θ(n^log_b a * log n)
若 f (n) = Ω(n^log_b (a+ε)) 对某个常数 ε > 0 成立，且对某个常数 c < 1 和所有足够大的 n 有 af (n/b) ≤ cf (n)，则 T (n) = Θ(f (n))

归并排序的时间复杂度分析

归并排序的递归式为：\n T (n) = 2T (n/2) + Θ(n)

应用主方法：

a = 2，b = 2，所以 log_b a = log2 2 = 1
f (n) = Θ(n) = Θ(n^1)，符合主方法的第二种情况因此，归并排序的时间复杂度为 T (n) = Θ(n log n)，这在三种情况（最好、最坏、平均）下都是成立的。

分治算法分析案例

下面我们通过一个案例来具体分析分治算法的时间复杂度：

这个案例分析了用分治法求数组最大值的时间复杂度。递归式为 T (n) = 2T (n/2) + Θ(1)，根据主方法的第一种情况，我们得出其时间复杂度为 Θ(n)。

思考题

比较插入排序和归并排序：什么情况下插入排序比归并排序更高效？如何优化插入排序使其在实际应用中表现更好？
什么情况下插入排序比归并排序更高效？
如何优化插入排序使其在实际应用中表现更好？
算法设计：设计一个基于分治法的算法，求一个数组中元素的和。分析该算法的时间复杂度。
设计一个基于分治法的算法，求一个数组中元素的和。
分析该算法的时间复杂度。
算法分析：求解递归式 T (n) = 3T (n/2) + n^2 求解递归式 T (n) = T (2n/3) + 1
求解递归式 T (n) = 3T (n/2) + n
求解递归式 T (n) = T (2n/3) + 1
实践题：实现一个版本的归并排序，当子数组的规模小于某个阈值时，改用插入排序。尝试不同的阈值，观察算法性能的变化。
实现一个版本的归并排序，当子数组的规模小于某个阈值时，改用插入排序。
尝试不同的阈值，观察算法性能的变化。比较插入排序和归并排序：

什么情况下插入排序比归并排序更高效？
如何优化插入排序使其在实际应用中表现更好？算法设计：
设计一个基于分治法的算法，求一个数组中元素的和。
分析该算法的时间复杂度。算法分析：
求解递归式 T (n) = 3T (n/2) + n
求解递归式 T (n) = T (2n/3) + 1 实践题：
实现一个版本的归并排序，当子数组的规模小于某个阈值时，改用插入排序。
尝试不同的阈值，观察算法性能的变化。

参考答案提示：

当数组规模很小或数组已经基本有序时，插入排序可能更高效，因为它的常数因子较小。可以通过二分查找来优化插入排序中寻找插入位置的步骤。
分治法求数组和可以将数组分成两半，分别求和后相加。时间复杂度为 Θ(n)。
第一个递归式用主方法第三种情况，解为 Θ(n²)；第二个用主方法第一种情况，解为 Θ(log n)。
这种混合排序算法结合了两种排序的优点，通常能获得更好的实际性能。最佳阈值通常在 10-20 之间，但也可能因具体实现和数据特征而变化。

本章注记

本章介绍了算法分析的基本框架和两种重要的排序算法：插入排序和归并排序。插入排序的时间复杂度为 O (n²)，但实现简单，常数因子小，适合小规模数据或接近有序的数据。归并排序采用分治策略，时间复杂度为 Θ(n log n)，适合大规模数据排序。

算法分析是计算机科学的基础技能，大 O 记号和递归式分析是评估算法效率的重要工具。分治法是一种强大的算法设计范式，不仅用于排序，还广泛应用于其他领域，如查找、矩阵乘法、快速傅里叶变换等。

通过本章的学习，我们应该掌握：

分析算法时间复杂度的基本方法
插入排序和归并排序的原理及实现
分治法的基本思想和应用
递归式的求解方法，特别是主方法

在实际应用中，选择合适的算法需要考虑问题规模、数据特征和实际运行环境等多种因素。理解不同算法的优缺点和适用场景，是成为一名优秀程序员的重要一步。

希望这篇学习笔记能帮助你更好地理解《算法导论》第 2 章的内容。如果有任何疑问或建议，欢迎在评论区留言讨论！

以上就是《算法导论》第 2 章的全部学习内容。通过理论学习和代码实践相结合的方式，相信大家已经对算法基础有了更深入的理解。算法学习是一个循序渐进的过程，建议大家多动手实现，多思考分析，不断提升自己的算法能力。

~/bGZo/notes

Table of Contents