什么是数据结构
程序设计=数据结构+算法
数据结构就是关系,数据元素相互之间存在的一种或多种特定关系的集合
逻辑结构和物理结构
逻辑结构:逻辑结构是指数据对象中数据元素之间的相互关系
物理结构:物理结构是指数据的逻辑结构在计算机中存储形式
逻辑结构
- 集合结构:集合结构中的数据元素除了同属于一个集合外,他们之间没有其他不三不四的关系
- 线性结构:线性结构中的数据元素之间是一对一的关系
- 树形结构:树形结构中的数据元素之间存在一种一对多的层次关系
- 图形结构:图形结构的数据元素是多对多的关系
物理结构
- 主要研究如何把数据元素存储到计算机的存储器中
- 存储器主要是针对内存,而硬盘软盘,光盘等外部存储器的数据组织通常用文件结构来描述
- 数据元素的存储结构形式有两种:顺序存储和链式存储
- 顺序存储结构:把数据元素存放在地址连续的存储单元里,其数据间的逻辑关系和物理关系是一致的。
- 链式存储结构:相当于医院领号,当领到号,号到了才去,未到所领号,可以在任意地方
- 链式存储结构:是把数据元素存放在任意存储单元里,这组存储单元可以是连续的,也可以是不连续的
- 链式存储相比顺序存储结构就灵活多了
算法
- 算法是解决特定问题求解步骤的描述,在计算机中表现为指令的有限序列,并且每条指令表示一个或多个操作
- 通俗的将,算法就是泡妞的技巧和方式
算法的特点
- 算法的五个特征:输入、输出、有穷性、确定性和可行性
- 输入: 算法具有零个或多个输入
- 输出 算法至少有一个或多个输出 算法是一定要输出的,输出的形式可以是打印形式输出,也可以是返回一个值或多个值
- 有穷性 指算法在执行有限的步骤之后,自动结束而不会出现无限循环,并且每一个步骤在可接受的时间内完成
- 确定性 算法的每一个步骤都具有确定的含义,不会出现二义性 算法在一定条件下,只有一跳执行路径,想通的输入只能有唯一的输出结果
- 可行性 算法的每一步都必须是可行的,也就是说,每一步都能够通过执行有限次数完成
算法的设计要求
算法的正确性是指算法至少应该具有输入、输出和加工处理无歧义性,能正确反应问题的需求,能够得到问题的正确答案
大体分为四个层次:
- 算法程序没有语法错误
- 算法程序对于合法输入能够产生满足要求的输出
- 算法程序对于非法输入能够产生满足规格的说明
- 算法程序对于故意刁难的测试输入都有满足要求的输出结果
可读性 算法设计为了方便阅读,理解和交流,以及为了让计算机执行
健壮性 当输入不合法时,算法也能做出相关处理,而不是产生异常、崩溃或莫名其妙的结果
时间效率高和存储量低
判断一个算法的效率时,函数中的常数和其他次要项常常可以忽略,而更应该关注主项(最高项)的阶数
判断一个算法好不好,我们只通过少量的数据是不能做出准确判断的,很容易以偏概全
算法时间复杂度
- 定义:在进行算法分析时,语句总的执行次数T(n)是关于问题规模n的函数,进而分析T(n)是关于问题规模n的函数,进而分析T(n)随n变化情况并确定T(n)的数量级 算法的时间复杂度,也就是算法的时间量度记作:T(n)=O(f(n)),表示岁问题规模n的增大,算法执行时间的增长率和F(n)的增长率想通,称作算法的渐近时间复杂度,简称为时间复杂度,其中f(n)是问题规模n的某个函数
- 这样用大写O()来体现1算法时间复杂度的记法,称之为大O记法
- 如何分析一个算法的时间复杂度,即如何推导大O阶,
- 用常数1取代运行时间中的所有加法常数
- 在修改后的运行次数函数中,只保留最高阶项
- 如果最高阶项存在且不是1,则去除与这个项相乘的常数
- 得到的最后结果就是大O阶
- 常数阶:所有的加法常数都是O(1),如下图的时间复杂度为O(1)
- 线性阶:就是随着问题规模n的扩大,对应计算次数呈直线增长,如下图循环n次,O阶为O(n)
- 平方阶:循环的时间复杂度,等于循环体的复杂度乘以该循环运行的次数下图中的O阶为O(n^2)
- 对数阶:由于每次i*2之后,就离n更近一步,假设有x个2相乘后大于或等于n,则退出循环 于是,2^x=n得到x=log(2)n,log以2为底的n,所以这个循环的时间复杂度为O(logn)
- 常见的时间复杂度
算法的空间复杂度
- 算法的空间复杂度通过计算算法所需的存储空间实现,算法空间复杂度的计算算公式记作:s(n)=O(f(n)),其中问题的规模,f(n)为语句关于n所占存储空间的函数
- 通常:时间复杂度来指运行时间,空间复杂度指空间需求
- 让我们求复杂度,通常指时间复杂度