BFS、DFS、UCS、A*：常用的搜索算法简介 🔎

正文前的碎碎念：DeepSeek 和 CUDA 两篇博客有点过于硬核了，更新速度一直缓慢，整个 2 月份居然没有开新博客！！今天开一个小一点的话题，讲一下深搜、广搜、UCS 和 A*。

搜索算法简介：BFS、DFS、UCS、A* 🔎

在人工智能中，搜索算法是解决复杂问题的核心工具。无论是迷宫求解、拼图问题还是路径规划，搜索算法都能帮助我们找到从初始状态到目标状态的最佳路径。本文将简要介绍四种常见的搜索算法：广度优先搜索（BFS）、深度优先搜索（DFS）、一致代价搜索（UCS）和 A* 搜索。

搜索问题表述和图搜索形式

在应用搜索算法之前，我们需要明确搜索问题 (search algorithm) 的五个关键要素：

初始状态 (initial state)：问题的起点。
动作 (actions)：从当前状态可以采取的操作。
转换模型 (transition model)：描述动作如何改变状态。
目标测试 (goal test)：判断当前状态是否为目标状态。
路径成本 (path cost)：评估路径的代价。

示例：迷宫求解

初始状态：机器人在迷宫的起点。

动作：向上、下、左、右移动。

转换模型：根据移动方向更新机器人位置。

目标测试：检查是否到达迷宫出口。

路径成本：移动次数或路径长度。

针对搜索问题，通用的解法是将其转换为 图搜索 的形式。图搜索核心逻辑是：

将初始状态加入边界集合 frontier
从边界集合 frontier 中取出节点
若是终点，表明找到路径，将解返回，跳过以下步骤
否则，检查的状态，若标记为已探索，则将其丢弃，并跳至步骤 2
若为未探索，将其标记为已探索，并进行如下步骤
扩展，将全部子节点加入边界集合 frontier，随后调至步骤 2
如果没能在步骤 3 返回解，但边界集合 frontier 已空，证明该问题无解

def graphSearch():
    frontier = [ initState ]
    while frontier:
        N = frontier.pop()
        if N.isGoalState(): return solution
        if N.isExplored(): continue
        N.hasBeenExplored()
        frontier.add(expand(state))
    return None
PYTHON

在一般图搜索的基础上，演变出了 BFS、DFS、UCS 和 A* 等算法。它们的不同之处主要在于对边界集合的处理方式上，具体表现为 边界集合的数据结构和入队、出队策略有所不同。接下来进行详细介绍。

广度优先搜索 (BFS)

BFS 从起始节点开始，逐层扩展，直到找到目标节点。
它使用队列来实现，确保先访问的节点先被扩展。
仅能保证动作数最少，无法保证搜索结果的路径代价最小。

from collection import deque

def bfs(initState, getActions, transModel, goalTest):
    frontier = deque([(initState, list())])
    explored = set()

    while frontier:
        curState, lstActions = frontier.popleft()
        if goalTest(curState):
            return lstActions
        if curState not in explored:
            explored.add(curState)
            for action in getActions(curState):
                nextState = transModel(curState, action)
                frontier.append((nextState, lstActions + [action]))
    return None
PYTHON

深度优先搜索 (DFS)

DFS 从起始节点开始，沿着一条路径深入，直到无法继续为止，然后回溯并尝试其他路径。
它使用栈来实现，确保每次仅访问当前层深度的一个节点。
同样无法保证搜索结果的路径代价最小。

def dfs(initState, getActions, transModel, goalTest):
    frontier = [(initState, list())]
    explored = set()

    while frontier:
        curState, lstActions = frontier.pop()
        if goalTest(curState):
            return lstActions
        if curState not in explored:
            explored.add(curState)
            for action in getActions(curState):
                nextState = transModel(curState, action)
                frontier.append((nextState, lstActions + [action]))
    return None
PYTHON

一致代价搜索 (UCS)

UCS 在扩展节点时考虑路径的成本，优先扩展成本最低的节点。
它使用优先队列来实现。
能够保证搜索结果的路径代价最小。

import heapq

def ucs(initState, getActions, transModel, goalTest, pathCost):
    frontier = []
    heapq.heappush(frontier, (0, initState, list()))
    explored = set()

    while frontier:
        curCost, curState, lstActions = heapq.heappop(frontier)
        if goalTest(curState):
            return lstActions
        if curState not in explored:
            explored.add(curState)
            for action in getActions(curState):
                nextState = transModel(curState, action)
                newCost = curCost + pathCost(curState, action)
                heapq.heappush(frontier, (newCost, nextState, lstActions + [action]))
    return None
PYTHON

证明：UCS 能保证最优性

假设在搜索树中存在最优终点和次优终点（下标为代价，）
若已在队列中，则无论入队与否，总是先出队，从而返回最优路径
若不在队列中，而在队列中。我们总是能在队列中找到节点，它是的前序
对任何这样的，恒有（其中表示到达该节点的代价）
那么及其所有的前序节点总是比先出队。也即，除非出队，否则滞留
该推理证明 UCS 总能保证最优。该推理过程还能推广到其他所有的中间节点（如和）

A-Star 搜索 (A*)

A* 算法结合了 UCS 和启发式搜索，使用启发式函数来估计从当前节点到目标节点的成本。
它同样使用优先队列，但排序依据是 f(n) = g(n) + h(n)。
g(n) 是从起始节点到当前节点的实际成本。
h(n) 是启发式估计，它估量从当前节点到终点的成本。
当启发式估计可接受时，能够保证搜索结果的路径代价最小。

import heapq

def aStar(initState, getActions, transModel, goalTest, pathCost, heuristic):
    frontier = []
    heapq.heappush(frontier, (heuristic(initState), 0, initState, list()))
    explored = set()

    while frontier:
        _, gCost, curState, lstActions = heapq.heappop(frontier)
        if goalTest(curState):
            return lstActions
        if curState not in explored:
            explored.add(curState)
            for action in getActions(curState):
                nextState = transModel(curState, action)
                g = gCost + pathCost(curState, action)
                h = heursitic(nextState)
                heapq.heappush(frontier, (g + h, g, nextState, lstActions + [action]))
PYTHON

A* 与可接受的启发

A* 能保证最优，当且仅当给定的启发是可接受的 (addmissible)
所谓“可接受”，是指：对于搜索树中的所有节点，恒成立
其中，为从节点到终点的真实代价，也即
可以证明：当可接受时，A* 能够保证搜索到的结果最优，思路与证明 UCS 时一致：
- 同样考虑 , 和节点，已知是可接受的
- 我们总是有：
- 因此除非及其所有前序都出队，否则滞留，故 A* 能够保证最优
相较于 UCS，A* 引入启发来估计节点到终点的距离，好的启发应当是接近真实距离的
启发越接近真实值，A* 的搜索效率就越高，就能越快找到最优路径

总结与反思

算法	数据结构	最优性
BFS	队列	动作数最少
DFS	栈	非最优
UCS	优先队列	保证最优
A*	优先队列	启发可接受时最优

注：为分支因子，为最优解深度，为最大深度，为最优解成本，为最小单步成本。

实际应用中需根据问题特性选择算法：当需要最短路径且状态空间较小时选择 BFS；当内存受限时考虑 DFS；需要最优成本路径时用 UCS；若存在高质量启发式函数则优先选择 A*。

💻 技术干货 > 数据结构与算法

#人工智能 #数据结构与算法 #搜索算法

BFS、DFS、UCS、A*：常用的搜索算法简介 🔎

http://example.com/2025/03/15/search-algorithm/

Author

LazyPool

Posted on

March 15, 2025

Licensed under

Kafka 技术在 B 站 📺 的探索与实现 Previous

从零入门 cuda 编程？🦴 看这篇就够了！ Next