关于三个简单的图论算法

prim，dijkstra和kruskal三个图论的算法，初学者容易将他们搞混，所以放在一起了。

prim和kruskal是最小生成树（MST）的算法，dijkstra是单源最短路径的算法。

prim

最小生成树prim算法采用了贪心策略：把点分成两个集合，A为已被处理（已经在最小生成树中）的顶点，B为待处理的顶点，(A,B)也就是一个割。若边(u,v)满足u∈A，v∈B，那么(u,v)就是通过割(A,B)的一条边。

很自然的，会有一定数量的边会通过该割，其中权重最小的边就是轻边。

什么是轻边？

左边集合和右边集合就组成一个割，其中边(a,b)是跨越两个集合最小的边（途中标记为红色），它就是要找的轻边。

每次操作都是选择min{w(u,v)|u∈A,v∈B}，从而将v加入到A中，即将v标记为已处理顶点，直到将所有点都处理完为止。

上述过程可以产生最小生成树，即证明：A，B通过轻边（权重最小的边）(u,v)连接，现假设不选择(u,v)，而选择(u’,v’)得到了更优的最小生成树，注意w(u,v)<w(u’,v’)。证明推翻这个假设即可。

把(u’,v’)去掉，补上(u,v)，这不影响A，B的连通，这样就得到了比上述假设更优的最小生成树，从而推翻假设，同时也证明了这个算法具有最优子结构。

prim的伪代码：

for i=[0,n)	dist[i] = tab[0][i]visit[0] = truefor i=[1,n)	min = MAX_VALUE	for j=[0,n)		if !visit[j] && min>dist[j]			min = dist[j]	for k=[0,n)		if !visit[k] && dist[j]>tab[i][j]			dist[j] = tab[i][j]

kruskal

最小生成树kruskal算法也具有贪心策略：将所有点边按权值大小从小到大排列，每次都从中选取最小权值的边(u,v)，并把它添加到正在生长的森林中。所以开始的时候图中n个顶点构成森林中的n棵树（通俗的讲就是n个集合），而且这些树（集合）只有一个顶点。

重复上述过程，就可以将森林中的树不断的合并（通俗的讲就是合并两个不相交集合），直到将所有点同属于一棵树为止（通俗的讲就是只剩下一个集合）。

如上图，有了四个独立的集合，先不管上面的边上从这个集合中哪个点连到那个集合的哪个点，我们只要找到最小权值的边（对于上面的图中是11），合并集合即可。因此上面的例子进行合并后：

kruskal证明过程可以参照prim算法的证明过程。

kruskal实现过程涉及了不相交子集的合并，可以开辟一个简单的数组，然后通过标记每个点的父节点来简化合并过程。举例：图中有10个顶点

一开始：

i	0	1	2	3	4	5	6	7	8	9
parent	0	1	2	3	4	5	6	7	8	9

假设一段时间后：0 1 2 0 0 0 6 7 1 1

i	0	1	2	3	4	5	6	7	8	9
parent	0	1	2	0	0	0	6	7	1	1

从上面的表可以判断顶点1，顶点8和顶点9同属于同一个集合；顶点0，顶点3，顶点4和顶点5同属于一个集合；凡是parent[i]=i都是单个点的集合，比如顶点2等。

所以程序中设计了两个函数，find和makeset，find用于找到一个集合的root，比如find(9)=1，find(5)=0；而makeset用于合并两个不相交的子集，它的作用就是修改其中一个集合的root就可以了。需要注意的是，kruskal算法要防止出现环，所以，当发现最小的边(u,v)同属于一棵树的时候，不能将其makeset。

kruskal的伪代码：

for i=[0,n)	parent[i] = i//	根据权值升序排序sortwhile set_count>1	if find(u)!=find(v)		minprice+=w(u,v)		makeset(u,v)	//	update u and v;

prim和kruskal的实现区别

一个非常明显的区别就是prim在任何时刻都只有两个集合，一个是已处理顶点集合，一个是待处理集合；而kruskal则有多个集合，所以kruskal涉及不相交子集合并的比较复杂的操作问题。

简单的MST应用：

某省调查乡村交通状况，得到的统计表中列出了任意两村庄间的距离。省政府“畅通工程”的目标是使全省任何两个村庄间都可以实现公路交通（但不一定有直接的公路相连，只要能间接通过公路可达即可），并要求铺设的公路总长度为最小。请计算最小的公路总长度。

或者

省政府“畅通工程”的目标是使全省任何两个村庄间都可以实现公路交通（但不一定有直接的公路相连，只要能间接通过公路可达即可）。经过调查评估，得到的统计表中列出了有可能建设公路的若干条道路的成本。现请你编写程序，计算出全省畅通需要的最低成本。

dijkstra

dijkstra要求所有点边的权值都是非负的，主要是如果出现负权边，可能会出现负权环，dijkstra就无法应付了。

关于dijkstra的小故事

这个人名真不好记，所以我一直把它读作disco，对不住迪科斯彻爹爹。

dijkstra算法中设置了一个顶点集合S，从源点到集合中的顶点的最终最短路径的权值均已经确定。dijkstra过程反复从V-S（V即图的顶点集）中选择一个顶点v，使得d(s,v)为最短，并将v加入到集合S中，接着对v的所有边进行松弛。

什么是松弛？

就是可能会出现这样的情况，假设源点为s，tab(u,v)为顶点u到顶点v的权值，dist(u)为迄今为止找到的s到u最短路径。在松弛(u,v)的过程中，要测试是否可以通过u，对迄今为止找到的v的最短路径进行改进。也就是可能会出现dist(v)>dist(u)+tab(u,v)的情况。

上面的图因为dist(v)>dist(u)+tab(u,v)即6>2+3，故要对边(u,v)进行松弛的时候会将dist(v)从6更正为5。但对于下面的情况，在松弛过后，dist(v)没有改变因为dist(v)<=dist(u)+tab(u,v)即4<=2+3。

松弛技术在Bellman-Ford负权回路探测算法中也有应用。不禁想起还小的一个作为题：两点之间曲线更短...

dijkstra的过程

初始将顶点s加入到S中，并更新s到其他顶点的路径权值。

选择最短路径dist(s,t)，并将t加入到S中。

在第一步中得到t，对于u∈V-S，松弛边(t,v)。

重复上述过程，直到所有的顶点都被加入到集合S中为止。

可以给出伪代码：

//	初始化for i=[0,n)	dist[i] = tab[0][i]visit[0] = true;for i=[1,n)	//	寻找最短路径(s,t)，同时把t加入S集合	min = MAX_VALUE	for j=[0,n)		if !visit[j] && dist[j]
           
            dist[j]+tab[j][k]			dist[k] = dist[j]+tab[j][k]