C++_迭代器&范围for的本质
迭代器(iterator)
什么是迭代器
迭代器与容器的关系,相当于指针与数组的关系
因为容器是封装起来的,不知道内部是如何实现的,所以通过在内存中的地址的原理访问和遍历容器,一般来说是不实际的
要访问容器(顺序容器、关联容器)中的元素,就需要通过迭代器进行;就如同访问数组中的元素需要通过指针进行一样
用迭代器访问元素的操作也和用指针访问数组的操作很像
迭代器按照定义方式分成以下四种
正向迭代器,定义方法如下:
cpp
1 容器类名::iterator 迭代器名;常量正向迭代器,定义方法如下:
cpp
1 容器类名::const_iterator 迭代器名;反向迭代器,定义方法如下:
cpp
1 容器类名::reverse_iterator 迭代器名;常量反向迭代器,定义方法如下:
cpp
1 容器类名::const_reverse_iterator 迭代器名;
迭代器用法示例
通过迭代器可以读取它指向的元素,*迭代器名
就表示迭代器指向的元素。通过非常量迭代器还能修改其指向的元素。
迭代器都可以进行++
操作。反向迭代器和正向迭代器的区别在于:
- 对正向迭代器进行
++
操作时,迭代器会指向容器中的后一个元素; - 而对反向迭代器进行
++
操作时,迭代器会指向容器中的前一个元素。
下面的程序演示了如何通过迭代器遍历一个 vector 容器中的所有元素
1 |
|
程序的输出结果是:
0 1 2 3 4
8 6 4 2 0第 6 行,vector 容器有多个构造函数,如果用无参构造函数初始化,则容器一开始是空的。
第 10 行,begin 成员函数返回指向容器中第一个元素的迭代器。++i 使得 i 指向容器中的下一个元素。end 成员函数返回的不是指向最后一个元素的迭代器,而是指向最后一个元素后面的位置的迭代器,因此循环的终止条件是
i != v.end()
。第 16 行定义了反向迭代器用以遍历容器。反向迭代器进行
++
操作后,会指向容器中的上一个元素。rbegin 成员函数返回指向容器中最后一个元素的迭代器,rend 成员函数返回指向容器中第一个元素前面的位置的迭代器,因此本循环实际上是从后往前遍历整个数组。如果迭代器指向了容器中最后一个元素的后面或第一个元素的前面,再通过该迭代器访问元素,就有可能导致程序崩溃,这和访问 NULL 或未初始化的指针指向的地方类似。
第 10 行和第 16 行,写
++i
、++j
相比于写i++
、j++
,程序的执行速度更快。回顾
++
被重载成前置和后置运算符的例子如下:cpp
1
2
3
4
5
6
7
8
9
10
11 CDemo CDemo::operator++ ()
{ //前置++
++n;
return *this;
}
CDemo CDemo::operator ++(int k)
{ //后置++
CDemo tmp(*this); //记录修改前的对象
n++;
return tmp; //返回修改前的对象
}后置
++
要多生成一个局部对象 tmp,因此执行速度比前置的慢。同理,迭代器是一个对象,STL 在重载迭代器的++
运算符时,后置形式也比前置形式慢。在次数很多的循环中,++i
和i++
可能就会造成运行时间上可观的差别了。因此,本教程在前面特别提到,对循环控制变量i,要养成写++i
、不写i++
的习惯。
注意,容器适配器 stack、queue 和 priority_queue 没有迭代器。容器适配器有一些成员函数,可以用来对元素进行访问。
迭代器的功能分类
不同容器的迭代器,其功能强弱有所不同。容器的迭代器的功能强弱,决定了该容器是否支持 STL 中的某种算法。例如,排序算法需要通过随机访问迭代器来访问容器中的元素,因此有的容器就不支持排序算法。
常用的迭代器按功能强弱分为输入、输出、正向、双向、随机访问五种,这里只介绍常用的三种。
正向迭代器。假设 p 是一个正向迭代器,则 p 支持以下操作:++p,p++,*p。此外,两个正向迭代器可以互相赋值,还可以用
==
和!=
运算符进行比较。双向迭代器。双向迭代器具有正向迭代器的全部功能。除此之外,若 p 是一个双向迭代器,则
--p
和p--
都是有定义的。--p
使得 p 朝和++p
相反的方向移动。随机访问迭代器。随机访问迭代器具有双向迭代器的全部功能。若 p 是一个随机访问迭代器,i 是一个整型变量或常量,则 p 还支持以下操作:
- p+=i:使得 p 往后移动 i 个元素。
- p-=i:使得 p 往前移动 i 个元素。
- p+i:返回 p 后面第 i 个元素的迭代器。
- p-i:返回 p 前面第 i 个元素的迭代器。
- p[i]:返回 p 后面第 i 个元素的引用。
此外,两个随机访问迭代器 p1、p2 还可以用 <、>、<=、>= 运算符进行比较。
p1<p2
的含义是:p1 经过若干次(至少一次)++
操作后,就会等于 p2。其他比较方式的含义与此类似。==对于两个随机访问迭代器 p1、p2,表达式
p2-p1
也是有定义的,其返回值是 p2 所指向元素和 p1 所指向元素的序号(下标)之差(也可以说是 p2 和 p1 之间的元素个数减一)。==例如在vector中返回某个元素的下标
cpp
1
2
3
4
5
6
7
8
9
10
11
12
using namespace std;
int main()
{
vector<int> temp = { 1, 3, 2, 4, 5, 0 };
vector<int>::iterator it = temp.begin();
it += 2;//p+=i
//此时it对应的元素下标为
int index = it - temp.begin();//p2-p1
cout << index;
}输出2
不同容器的迭代器的功能:
容器 | 迭代器功能 |
---|---|
vector | 随机访问 |
deque | 随机访问 |
list | 双向 |
set / multiset | 双向 |
map / multimap | 双向 |
stack | 不支持迭代器 |
queue | 不支持迭代器 |
priority_queue | 不支持迭代器 |
vector 的迭代器是随机迭代器,因此遍历 vector 容器有以下几种做法。下面的程序中,每个循环演示了一种做法。
cpp
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
using namespace std;
int main()
{
vector<int> v(100); //v被初始化成有100个元素
for(int i = 0;i < v.size() ; ++i) //size返回元素个数
cout << v[i]; //像普通数组一样使用vector容器
vector<int>::iterator i;
for(i = v.begin(); i != v.end (); ++i) //用 != 比较两个迭代器
cout << * i;
for(i = v.begin(); i < v.end ();++i) //用 < 比较两个迭代器
cout << * i;
i = v.begin();
while(i < v.end()) { //间隔一个输出
cout << * i;
i += 2; // 随机访问迭代器支持 "+= 整数" 的操作
}
}
list 容器的迭代器是双向迭代器。
假设 v 和 i 的定义如下:
cpp
1
2 list<int> v;
list<int>::const_iterator i;则以下代码是合法的:
cpp
1
2 for(i=v.begin(); i!=v.end(); ++i)
cout << *i;以下代码则不合法:
cpp
1
2 for(i=v.begin(); i<v.end(); ++i)
cout << *i;因为双向迭代器不支持用 “<” 进行比较。以下代码也不合法:
cpp
1
2 for(int i=0; i<v.size(); ++i)
cout << v[i];因为 list 不支持随机访问迭代器的容器,也不支持用下标随机访问其元素。
==在 C++ 中,数组也是容器。数组的迭代器就是指针,而且是随机访问迭代器。例如,对于数组 int a[10],int * 类型的指针就是其迭代器。则 a、a+1、a+2 都是 a 的迭代器。==
迭代器的辅助函数(好用)
STL 中有用于操作迭代器的三个函数模板
cpp
1 advance(p, n)使迭代器 p 向前或向后移动 n 个元素。
cpp
1 distance(p, q)计算两个迭代器之间的距离,即迭代器 p 经过多少次 + + 操作后和迭代器 q 相等。如果调用时 p 已经指向 q 的后面,则这个函数会陷入死循环。
cpp
1 iter_swap(p, q)用于交换两个迭代器 p、q 指向的值
要使用上述模板,需要包含头文件 algorithm。下面的程序演示了这三个函数模板的 用法。
1 |
|
程序的输出结果是:
\1) 3
\2) 2
\3) 3
\4) 1 5 3 4 2
返回 随机访问迭代器中某个元素的 位置(序号)(下标)
方法1⃣️用循环,从第1个元素开始找,直到找到对应的元素,返回下标
方法2⃣️利用find函数,找到对应元素的迭代器,利用“两个随机访问迭代器相减,返回值是两个迭代器对应的元素的序号(下标)之差”,用该元素的迭代器减去容器首元素迭代器,返回值就是该元素的下标
1 | //例如: |
find函数是algorithm的库函数
find() 函数本质上是一个模板函数,用于在指定范围内查找和目标元素值相等的第一个元素。
如下为 find() 函数的语法格式:
1 | InputIterator find (InputIterator first, InputIterator last, const T& value); |
其中,first 和 last 为输入迭代器,[first, last) 用于指定该函数的查找范围;value 为要查找的目标元素。
正因为 first 和 last 的类型为输入迭代器,因此该函数适用于所有的序列式容器。
该函数会返回一个输入迭代器,当 find() 函数查找成功时,其指向的是在 [first, last) 区域内查找到的第一个目标元素;如果查找失败,则该迭代器的指向和 last 相同。
例如查找vector的元素时,first是vector.begin(),end是vector.end()
vector.end()是指向容器的最后一个元素之后的/0
值得一提的是,find() 函数的底层实现,其实就是用==
运算符将 val 和 [first, last) 区域内的元素逐个进行比对。这也就意味着,[first, last) 区域内的元素必须支持==
运算符。
举个例子:
1 |
|
程序执行结果为:
1 | c.biancheng.net/stl/ |
可以看到,find() 函数除了可以作用于序列式容器,还可以作用于普通数组(因为在C++中普通数组也是容器)
补充:find() 函数的底层实现,C++ 标准库中给出了参数代码:
cpp
1
2
3
4
5
6
7
8
9
10 template<class InputIterator, class T>
InputIterator find(InputIterator first, InputIterator last, const T& val)
{
while (first != last)
{
if (*first == val) return first;
++first;
}
return last;
}
迭代器的好处
迭代器可以使用auto,更简便
1 | string s("hello world"); |
C++11范围for本质上就是替代了范围for
从汇编上就可以看出来