文章目录
函数重载1. 例子引入(现象)1.1 什么是函数重载(what)?1.2 为什么需要函数重载(why)?
2. 编译器如何解决命名冲突的?3. 重载函数的调用匹配4. 编译器是如何让解析重载函数调用的?4.1 根据函数名确定候选函数集4.2 确定可用函数4.3 确定最佳匹配函数
5. 总结附录:一种C++函数重载机制
函数重载
——每个现象后面都隐藏一个本质,关键在于我们是否去挖掘
[前言] 函数重载的重要性不言而明,但是你知道 C++ 函数重载是如何实现的吗?这个可以分为下面两个问题
声明/定义重载函数时,是如何解决命名冲突的?(抛开函数重载不谈,using 就是一种解决命名冲突的方法,解决命名冲突还有很多其它方法)当我们调用一个重载的函数时,又是如何去解析的?(即怎么知道调用的是哪个函数呢)
这两个问题是任何支持函数重载的语言都必须解决的问题!带着这两个问题,开始讨论函数重载吧!
1. 例子引入(现象)
1.1 什么是函数重载(what)?
函数重载是指在同一作用域内,可以有一组相同函数名,不同参数列表的函数,这组函数被称为函数重载。重载函数通常用来命名一组功能相似的函数,这样做减少了函数名的数量,避免了命名空间的污染,对于程序的可读性有很大的好处。
When two or more different declarations are specified for a single name in the same scope, that name is said to overloaded. By extension, two declarations in the same scope that declare the same name but with different types are called overloaded declarations. Only function declarations can be overloaded; object and type declarations cannot be overloaded. ——摘自《ANSI C++ Standard. P290》
下面看一个例子,体会一下函数重载:实现一个相加函数,既可以进行整数相加,也可以实现浮点数和长整型相加。在C++中,我们可以这样做:
#include
using namespace std;
void print(int i)
{
cout<<"print a integer :"<
}
void print(string str)
{
cout<<"print a string :"< } int main() { print(12); print("hello world!"); return 0; } 通过上面代码的实现,可以根据具体的print()的参数去调用print(int)还是print(string)。上面print(12)会去调用print(int),print(“hello world”)会去调用print(string),如下面的结果:(先用g++ test.c编译,然后执行) 1.2 为什么需要函数重载(why)? 试想一下。如果没有函数重载,如在 C 中,你必须要这样去做:为这个 print 函数取不同的名字,如 print_int、print_string。这还只是两种情况,如果是很多个的话,就需要为实现同一个功能的函数取很多个名字,如加入打印 long 型、char*、各种类型的数字等等。这样做很不友好!类的构造函数跟类名相同,也就是说:构造函数都同名。如果没有函数重载机制,要想实现实例化不同的对象,那是相当的麻烦!操作符重载,本质上就是函数重载,它大大丰富了已有操作符的含义,方便使用,如 + 可用于连接字符串等! 通过上面的介绍我们对函数重载,应该唤醒了我们对函数重载的大概记忆。下面我们就来分析,C++是如何实现函数重载机制的。 2. 编译器如何解决命名冲突的? 为了了解编译器是如何处理这些重载函数的,我们反编译下上面我们生成的执行文件,看下汇编代码(全文都是在Linux下面做的实验,Windows类似,你也可以参考《一道简单的题目引发的思考》一文,那里既用到Linux下面的反汇编和Windows下面的反汇编,并注明了Linux和Windows汇编语言的区别)。我们执行命令objdump -d a.out >log.txt反汇编并将结果重定向到log.txt 文件中,然后分析 log.txt 文件。 发现函数void print(int i)编译之后为:(注意它的函数签名变为——_Z5printi) 发现函数void print(string str)编译之后为:(注意它的函数签名变为——_Z5printNSt7__cxx1112basic_stringIcSt11char_traitsIcESaIcEEE),其实 basic_string 是一个模板类,string 是模版形参为 char 的 basci_string 模版类的类型定义 我们可以发现编译之后,重载函数的名字变了不再都是 print!这样不存在命名冲突的问题了,但是又有一个新的问题——变名机制是怎样的,即如何将一个重载函数的签名映射到一个新的标识?我的第一反应是:函数名 + 参数列表,因为重载函数取决于参数的类型,个数,而与返回值无关。但看下面的映射关系 void print(int i) – > _Z5printi void print(string str) – > _Z5printNSt7__cxx1112basic_stringIcSt11char_traitsIcESaIcEEE进一步猜想,前面的 Z5 表示返回值类型,print 为函数名,i 表示整型,basic_string 表示字符串,即映射为 返回类型 + 函数名 + 参数列表。最后在 main 函数中就是通过 这两个名称来调用对应的函数的。 我们发现好像 string 有点特殊,我们再写几个重载函数验证一下猜想,如: void print(double l) --> _Z5printd void print(char c) --> _Z5printc 可以发现大概是int->i,double->d,char->c….基本上都是用首字母代表,现在我们来现在一个函数的返回值类型是否真的对函数变名有影响,如: #include using namespace std; int max(int a,int b) { return a>=b?a:b; } double max(double a,double b) { return a>=b?a:b; } int main() { cout<<"max int is: "< cout<<"max double is: "< return 0; } 【运行结果】 int max(int a,int b) 映射为_Z3maxii、double max(double a,double b) 映射为_Z3maxdd,这证实了我的猜想,Z后面的数字代表的是函数名的字符个数。更加详细的对应关系,如那个数字对应那个返回类型,哪个字符代表哪重参数类型,就不去具体研究了,因为这个东西跟编译器有关,上面的研究都是基于g++编译器,如果用的是vs编译器的话,对应关系跟这个肯定不一样。但是规则是一样的:“函数名长度+函数名+参数列表”。 既然返回类型也考虑到映射机制中,这样不同的返回类型映射之后的函数名肯定不一样了,但为什么不将函数返回类型考虑到函数重载中呢?——这是为了保持解析操作符或函数调用时,独立于上下文(不依赖于上下文),看下面的例子 float sqrt(float); double sqrt(double); void f(double da, float fla) { float fl=sqrt(da);//调用sqrt(double) double d=sqrt(da);//调用sqrt(double) fl=sqrt(fla);//调用sqrt(float) d=sqrt(fla);//调用sqrt(float) } 如果返回类型考虑到函数重载中,这样将不可能再独立于上下文决定调用哪个函数。 至此似乎已经完全分析清楚了,但我们还漏了函数重载的重要限定——作用域。上面我们介绍的函数重载都是全局函数,下面我们来看一下一个类中的函数重载,用类的对象调用print函数,并根据实参调用不同的函数: #include using namespace std; class test{ public: void print(int i) { cout<<"int"< } void print(char c) { cout<<"char"< } }; int main() { test t; t.print(1); t.print('a'); return 0; } 我们现在再来看一下这时print函数映射之后的函数名: 注意前面的 N4test,我们可以很容易猜到应该表示作用域。N4可能为命名空间、test类名等等。这说明最准确的映射机制为:作用域 + 函数名长度+ 函数名 + 参数列表 还有一点,关于函数重载,一个被大多数遗忘或者疏漏的地方,这种形参类型、形参个数完全相同的函数也是可以重载的,只要它的 const/volatiles 属性不同即可,下面看一个例子: #include using namespace std; struct foo{ int bar() const {return 2;} ; //第一个重载函数 int bar() {return 1;}; //第二个重载函数 }; int main() { const foo a; a.bar(); foo b; b.bar(); } 我们查看一下反编译代码:可以看出这两个 bar 函数的命名并不相同 我们再查看一下main函数的调用情况 我通过单步跟踪,发现 a.bar() 调用的是第一个重载函数,b.bar() 调用的是第二个重载函数 看到这里,我想你应该弄明白了C++是怎么对重载函数进行命名的,那么你有没有想过一个问题,为什么 C++支持函数重载,而 C 语言不支持呢? 我们还是拿第一个例子:打印不同类型的函数,在 C 语言下,代码如下: #include void print_int(int i) { printf("%d\n", i); } void print_char(char c) { printf("%c\n", c); } } int main() { print(1); print('a'); return 0; } 我们现在再来看一下这时print函数映射之后的函数名: 可以很容易观察到,在 C 语言下,映射机制就是直接使用函数名来进行映射的,跟函数的返回值,参数列表无关,所以注定 C 语言不能实现函数重载。 3. 重载函数的调用匹配 现在已经解决了重载函数命名冲突的问题,在定义完重载函数之后,用函数名调用的时候是如何去解析的?为了顾及哪个重载函数最适合,需要依次按照下列规则来判断: 精准匹配:参数匹配不做转换,或者只是做微不足道的转换,如数组名到指针、函数名到指向函数的指针、T到 const T提升匹配:即整数提升(如 bool 到 int、char 到 int、short 到 int),float 到 double使用标准转换匹配:如 int 到 double、double 到 int、double 到 long double、Derived* 到 Base*、int 到 unsigned int使用用户自定义类型匹配使用省略号匹配:类似 printf 中省略号参数 如果在最高层有多个匹配函数找到,调用将被拒绝(有歧义)。看下面的例子: void print(int); void print(const char*); void print(double); void print(long); void print(char); void h(char c,int i,short s, float f) { print(c);//精确匹配,调用print(char) print(i);//精确匹配,调用print(int) print(s);//整数提升,调用print(int) print(f);//float到double的提升,调用print(double) print('a');//精确匹配,调用print(char) print(49);//精确匹配,调用print(int) print(0);//精确匹配,调用print(int) print("a");//精确匹配,调用print(const char*) } 定义太少或太多的重载函数,都有可能导致模凌两可,看下面的一个例子: void f1(char); void f1(long); void f2(char*); void f2(int*); void k(int i) { f1(i);//调用f1(char)? f1(long)? f2(0);//调用f2(char*)?f2(int*)? } 这时候编译器就会报错,将错误抛给用户自己处理:通过显示类型转换来调用等等(如 f2(static_cast int pow(int ,int); double pow(double,double); void g() { double d=pow(2.0,2)//调用pow(int(2.0),2)? pow(2.0,double(2))? } 4. 编译器是如何让解析重载函数调用的? 编译器实现调用重载函数机制的时候,肯定是首先找出同名的一些候选函数,然后从候选函数中找出最符合的,如果找不到就报错。下面介绍一种重载函数解析的方法:编译器在对重载函数调用进行处理时,由语法分析、C++瓦讷费、符号表、抽象语法树交互出来(这里涉及到编译原理的知识),交互图大致如下: 这四个步骤所做的事情大致如下 由匹配文法中的函数调用,获取函数名;获取函数各参数表达式类型语法分析器查找重载函数,符号表内部经过重载函数解析返回最佳的函数语法分析器创建抽象语法树,将符号表中存储的最佳函数绑定到抽象语法树上 下面我们重点解释一下重载解析,重载解析要满足前面《3、重载函数的调用匹配》中介绍的匹配顺序和规则。重载函数解析大致可以分为三步: 根据函数名确定候选函数集从候选函数集中选择可用函数集合从可用函数集中确定最佳函数,或由于歧义返回错误 4.1 根据函数名确定候选函数集 根据函数在同一作用域所有同名函数,并且要求是可见的(像 private、protected、public、friend之类)。“同一作用域” 也是函数重载的定义中的一个限定,如果不在一个作用域,不能算是函数重载,如下面的代码: void f(int); void g() { void f(double); f(1); //这里调用的是f(double),而不是f(int) } 即内层作用域的函数会隐藏外层的同名函数!同样的派生类的成员函数会隐藏基类的同名函数。 为了查找候选函数集,一般采用深度优选搜索算法: step1:从函数调用点开始查找,逐层作用域向外查找查找可见的候选函数step2:如果上一步收集的不在用户自定义命名空间,则用到了 using 机制引入的命名空间中的候选函数,否则结束 在收集候选函数时,如果调用函数的实参类型为非结构体类型,候选函数仅包含调用点可见的函数;如果调用函数的实参类型包括类类型对象、类类型指针、类类型引用或指向类成员的指针,候选函数为下面集合的并: (1) 在调用点上可见的函数(2) 在定义该类类型的命名空间或定义该类的基类的命名空间中声明的函数(3) 该类或其基类的友元函数 下面看一个例子更直观: void f(); void f(int); void f(double, double = 314); namespace N { void f(char3 ,char3); } class A{ A(){} }; int main ( ) { using namespace N; //使用N整个命名空间 A a; f(a); return 0; } 根据上述方法,由于实参是类类型的对象,候选函数的收集分为3步: (1) 从函数调用的 main 函数作用域内开始查找函数的声明,结果未找到。到 main 函数作用域的外层作用域查找,此时在全局作用域中找到3个函数的声明,将它们放入候选集中(2) 到using指示符所指向的命名空间 N中收集f ( char3 , char3 )(3) 该类没有友元函数 最终候选集合为上述所列的4个函数 f 4.2 确定可用函数 可用函数是指:函数参数个数匹配并且每一个参数都有隐式转换序列 (1) 如果实参有 m 个参数,所有候选函数中,有且只有 m 个参数(2) 所有候选函数中,参数个数不足 m 个,当且仅当参数列表中有省略号(3) 所有候选函数中,参数个数超过 m 个,当且仅当第 m+1 个参数以后都有缺省值。如果可用集合为空,函数调用失败 4.3 确定最佳匹配函数 确定可用函数之后,对可用函数集中的每一个函数,如果调用函数的实参要调用它计算优先级,最后选出优先级最高的。如对《3、重载函数的调用匹配》中介绍的匹配规则中按顺序分配权重,然后计算总的优先级,最后选出最优的函数。 5. 总结 本文介绍了什么是函数重载、为什么需要函数重载、编译器如何解决函数重名问题、编译器如何解析重载函数的调用。通过本文,我想大家对C++中的重载应该算是比较清楚了。说明:在介绍函数名映射机制是基于g++编译器,不同的编译器映射有些差别;编译器解析重载函数的调用,也只是所有编译器中的一种。如果你对某个编译器感兴趣,请自己深入去研究。 最后我抛给大家两个问题: 在 C++ 中加号,即可用于两个 int 型之间的相加、也可用于浮点数之间的相加、字符串之间的连接,那 + 算不算是操作符重载呢?换个场景C语言中加号+,即可用于两个int型之间的相加、也可以用于浮点数数之间的相加,那算不算操作符重载呢?模板(template)的重载是怎样的?模板函数和普通函构成的重载,调用时又是如何匹配的呢? 对于上面的问题一,我们举个超级简单的例子: 1 #include 2 3 using namespace std; 4 5 int main() 6 { 7 int a = 2 , b = 3; 8 float c = 2.1f , d = 1.2f;