Dawnzhang 阅读(14) 评论(0)

前言

数组看似简单,但掌握精髓的却没有多少;他既是编程语言中的数据类型,又是最基础的数据结构;

一个小问题:

 为什么数据要从0开始编号,而不是 从1开始呢?

正文

带着问题进入学习

如何实现随机访问?

什么是数组?

数组(array)是一种线性表数据结构,它用一组连续的内存空间来储存一组具有相同类型的数据。

我们从定义来分析:

 

线性表:

是数据排成像一条线一样的结构。每个线性表上的数据最多有前后两个方向。诸如数组,链表,队列,栈等都是线性表结构。

 

连续的内存空间和相同类型的数据:

这个特性是数组“随机访问”速度飞快的缘由,这也导致了从数组中删除、插入数据,为了保证连续性,需要大量的工作量

 

计算机会给每个内存单元分配一个地址,计算机通过地址来访问内存中的数据。

当计算机随机访问数组中的某个元素时,它会首先通过下面的寻址公式,计算出该元素的内存地址:

a[i]_address = base_address + i * data_type_size

data_type_siza表示数组中的每一个元素的大小。如果是int类型的数据,data_type_size为4个字节;

数组和链表的区别

链表适合插入、删除,时间复杂度为O(1),数组适合查找,但是这里要注意一下,时间复杂度并不是O(1),即便是排好序的数组,你用二分法查找,时间复杂度也是O(logn),

正确的描述为:数组支持随机访问,根据下标随机访问的时间复杂度为O(1)

 

低效的“插入”“删除”

插入操作

假设数组的长度为 n,现在,如果我们需要将一个数据插入到数组中的第 k 个位置,为了把第 k 个位置腾出来,给新来的数据,我们需要将第 k~n 这部分的元素都顺序地往后挪一位,下面我们分析一下时间复杂度

如果在数组的末尾插入元素,那就不需要移动数据了,这时的时间复杂度为 O(1),但如果在数组的开头插入元素,那所有的数据都需要依次往后移动一位,所以最坏时间复杂度是 O(n),因为我们在每个位置插入元素的概率是一样的,所以平均情况时间复杂度为 (1+2+…n)/n=O(n)

如果数组中的数据是有序的,我们在某个位置插入一个新的元素时,就必须按照刚才的方法搬移 k 之后的数据,如果数组中存储的数据并没有任何规律,数组只是被当作一个存储数据的集合。在这种情况下,如果要将某个数组插入到第 k 个位置

为了避免大规模的数据搬移,我们还有一个简单的办法就是

直接将第 k 位的数据搬移到数组元素的最后,把新的元素直接放入第 k 个位置。

 

删除操作

和插入类似,

如果删除数组末尾的数据,最好情况时间复杂度为 O(1);

如果删除开头的数据,则最坏情况时间复杂度为 O(n);

平均情况时间复杂度也为 O(n)

 

提高效率:

将多次删除操作中集中在一起执行,可以先记录已经删除的数据,但是不进行数据迁移,而仅仅是记录,当发现没有更多空间存储时,再执行真正的删除操作。这也是 JVM 标记清除垃圾回收算法的核心思想。

 

数组访问越界问题

C语言中的数据越界是一种未决行为,一般比较难发现的逻辑错误。相比之下,Java会有越界检查。

 

用数组还是容器?

数组先指定了空间大小,容器如ArrayList可以动态扩容。

1.希望存储基本类型数据,可以用数组

2.事先知道数据大小,并且操作简单,可以用数组
3.直观表示多维,可以用数组
4.业务开发,使用容器足够,开发框架,追求性能,首先数组。

 

为什么数组要从 0 开始编号?

由于数组是通过寻址公式,计算出该元素存储的内存地址:
a[i]_address = base_address + i * data_type_size
如果数组是从 1 开始计数,那么就会变成:
a[i]_address = base_address + (i-1)* data_type_size

 

以上内容为个人的学习笔记,仅作为学习交流之用。