lyyyuna 的小花园

动静中之动, by

RSS

c++ 虚函数是如何实现的

发表于 2016-12

前言

探索 c++ 对象内部的实现是一件非常有趣的事情。c++ 分为编译时多态和运行时多态。运行时多态依赖于虚函数,大部分人或许听说过虚函数是由虚函数表+虚函数指针实现的,但,真的是这样吗?虽然 c++ 规范有着复杂的语言细节,但底层实现机制却任由编译器厂商想象。(没准某种特殊的处理器电路结构原生支持虚函数,没准这个处理器压根不是冯纽曼型,或者将来厂商发明了比虚函数表更有效率的数据结构。)

本篇文章就来实际检验一下 Visual Studio 2013 编译器在无优化条件下,虚函数的实现。

虚函数表

封装把实例的数据和操作结合在了一起,但实例本身只有数据,没有函数,同一个类的函数是共享的。我们通过一个例子来间接证明这一点

class Base1
{
public:
	int a;
	void func() { cout << "heel" << endl; }
};

Base1 b1;
cout << sizeof(b1) << endl;

打印

4

如果类中有虚函数,则会在对象中加入一个虚函数指针,该指针指向一个虚函数表,表中是各个虚函数的地址。

+--+       ++
| pvtbl  |>| vfunc1  |
+--+       ++
| data1  |       | vfunc2  |
+--+       ++
| ...    |       | ...     |

当子类继承父类时,会依次覆盖虚函数表中的各个项,如果子类没有重写某项,那该项就保留。当实例化对象后,虚函数指针就作为一个隐藏数据存在于实例中。如果通过父类指针调用普通成员函数,由于普通函数和类型绑定在一起,所以仍会调用父类成员函数;如果通过父类指针调用虚函数,则会通过对象的虚指针找到虚函数表(即子类的虚函数表),定位虚函数项,实现多态。

原理是不是很简单?c++ 就是通过这种看似原始的方式实现高级抽象。以上是编译器的通用做法,我手上的 Visual Studio 2013 编译器就是这么做的,为了提高性能,VS 保证虚函数指针存在于对象实例中最前面位置(历史上也有编译器不这么做,好像是 Borland 的?)。

Visual Studio 2013 中的实现

来一个例子(能这么写是因为我已知了 Visual Studio 2013 编译后对象的内存布局)

#include <iostream>
using namespace std;

class Base 
{
public:
	typedef void (*func)();
	virtual void func1() { cout << "Base::func1" << endl; }
	virtual void func2() { cout << "Base::func2" << endl; }
	virtual void func3() { cout << "Base::func3" << endl; }
};

class Derived: public Base
{
public:
	virtual void func1() { cout << "Derived::func1" << endl; }
	virtual void func3() { cout << "Derived::func3" << endl; }
};

int main()
{
	Base b, b1;
	int** pvirtualtable1 = (int**)&b;
	cout << "Base object vtbl address: " << pvirtualtable1[0] << endl;
	int** pvirtualtable11 = (int**)&b1;
	cout << "another Base object vtbl address: " << pvirtualtable11[0] << endl;
	cout << "function in virtual table" << endl;
	for (int i = 0; (Base::func)pvirtualtable1[0][i] != NULL; ++i)
	{
		auto p = (Base::func)pvirtualtable1[0][i];
		p();
	}
	cout << endl;

	Derived d;
	int** pvirtualtable2 = (int**)&d;
	cout << "Derived object vtbl address: " << pvirtualtable2[0] << endl;
	cout << "function in virtual table" << endl;
	for (int i = 0; (Base::func)pvirtualtable2[0][i] != NULL; ++i)
	{
		auto p = (Base::func)pvirtualtable2[0][i];
		p();
	}
	cout << endl;
}

打印

Base object pvtbl address: 0029DA58
another Base object pvtbl address: 0029DA58
function address in virtual table
Base::func1
Base::func2
Base::func3

Derived object pvtbl address: 0029DB20
function address in virtual table
Derived::func1
Base::func2
Derived::func3

可以看到,同一类型不同实例的虚函数表是相同的,继承之后,子类有了自己的虚函数表,表也有相应的更新(Derived::func1, Derived::func3),表中未重写的项还保留为原值(Base::func2)。