矩阵快速幂

 矩阵的快速幂是用来高效地计算矩阵的高次方的。将朴素的o(n)的时间复杂度,降到log(n)。

 这里先对原理(主要运用了矩阵乘法的结合律)做下简单形象的介绍:

 一般一个矩阵的n次方,我们会通过连乘n-1次来得到它的n次幂。

但做下简单的改进就能减少连乘的次数,方法如下:

把n个矩阵进行两两分组,比如:A*A*A*A*A*A => (AA)(AA)(A*A)

 这样变的好处是,你只需要计算一次A*A,然后将结果(A*A)连乘自己两次就能得到A^6,即(A*A)^3=A^6。算一下发现这次一共乘了3次,少于原来的5次。

 其实大家还可以取A^3作为一个基本单位。原理都一样:利用矩阵乘法的结合律,来减少重复计算的次数。

 以上都是取一个具体的数来作为最小单位的长度,这样做虽然能够改进效率,但缺陷也是很明显的,取个极限的例子(可能有点不恰当,但基本能说明问题),当n无穷大的时候,你现在所取的长度其实和1没什么区别。所以就需要我们找到一种与n增长速度”相适应“的”单位长度“,那这个长度到底怎么去取呢???这点是我们要思考的问题。

有了以上的知识,我们现在再来看看,到底怎么迅速地求得矩阵的N次幂。

 既然要减少重复计算,那么就要充分利用现有的计算结果咯!~怎么充分利用计算结果呢???这里考虑二分的思想。。

 大家首先要认识到这一点:任何一个整数N,都能用二进制来表示。。这点大家都应该知道,但其中的内涵真的很深很深(这点笔者感触很深,在文章的最后,我将谈谈我对的感想)!!

 计算机处理的是离散的信息,都是以0,1来作为信号的处理的。可想而知二进制在计算机上起着举足轻重的地位。它能将模拟信号转化成数字信号,将原来连续的实际模型,用一个离散的算法模型来解决。 好了,扯得有点多了,不过相信这写对下面的讲解还是有用的。

 回头看看矩阵的快速幂问题,我们是不是也能把它离散化呢?比如A^19 => (A^16)*(A^2)(A^1),显然采取这样的方式计算时因子数将是log(n)级别的(原来的因子数是n),不仅这样,因子间也是存在某种联系的,比如A^4能通过(A^2)(A^2)得到,A^8又能通过(A^4)*(A^4)得到,这点也充分利用了现有的结果作为有利条件。下面举个例子进行说明:

现在要求A^156,而156(10)=10011100(2)

 也就有A^156=>(A^4)(A^8)(A^16)*(A^128) 考虑到因子间的联系,我们从二进制10011100中的最右端开始计算到最左端

注意这里写的是形状相同的矩阵相乘,若遇到两个形状不同的矩阵相乘,只需要改一下传参的大小即可,网上大部分都是一行一列的往下走,本文矩阵相乘是按照结果的位置来走

#include<iostream> 
#define max 10 
using namespace std;
//使用结构体定义矩阵 ,比较方便 
struct MAT{
		long long mat[max][max];
	};

//两个矩阵相乘 
MAT mul(MAT a,MAT b,int n){
		MAT c;
//		先将矩阵初始化为0,必须初始化 
		for(int i=0;i<n;i++)
		for(int j=0;j<n;j++)
			c.mat[i][j] = 0;
		for(int i=0;i<n;i++)
		for(int k=0;k<n;k++)
		for(int j=0;j<n;j++)
			if(a.mat[i][j]&&b.mat[j][k]) // 优化,有一个为0即为0 
				c.mat[i][k] += a.mat[i][j] * b.mat[j][k];  //对应行和列相乘,得到对应位置上的值 
		return c;
	}

//矩阵的乘方运算,采用快速幂 
MAT par(MAT p,int k,int n){
		MAT res;
		//结果矩阵初始化为单位矩阵,以便后边相乘 
		for(int i=0;i<n;i++)
		for(int j=0;j<n;j++)
			res.mat[i][j] = (i==j);
		while(k){
			if(k&1){
				res = mul(res,p,n); 
			}
			k>>=1;
			p = mul(p,p,n);
		}
		return res;
	}
//打印矩阵 
void print(MAT t,int n){
	for(int i=0;i<n;i++)
	{
	for(int j=0;j<n;j++)
		cout << t.mat[i][j]<<" ";
	cout<<endl;
	}
}
int main(){
	cout<<"输入矩阵的大小"<<endl;
	int n;
	MAT a,b;
	cin>>n;
	cout<<"输入矩阵1"<<endl;
	for(int i=0;i<n;i++)
	for(int j=0;j<n;j++)
		cin>>a.mat[i][j];
	print(a,2);
	cout<<"输入矩阵2"<<endl;
	for(int i=0;i<n;i++)
	for(int j=0;j<n;j++)
		cin>>b.mat[i][j];
	print(b,2);	
	print(mul(a,b,n),n);
//	print(par(a,3,n),n);
	return 0;

}

参考文章链接 https://www.cnblogs.com/luyingfeng/p/3674425.html