这是一个小问题, 孔乙己一把, 全当自娱.
这是一个小问题, 孔乙己一把, 全当自娱. 今天在线上被问到一个问题, 描述如下:
#include <iostream>
using namespace std;
class MyClass
{
public:
MyClass(){};
~MyClass(){};
void print()
{
cout << "hello!" << endl;
}
};
int main()
{
MyClass * pMyClass;
pMyClass = new MyClass;
pMyClass->print(); // 1: 正确调用
pMyClass[0].print(); // 2: 正确调用
pMyClass[1].print(); // 3: 错误调用, 但结果正确
pMyClass[10000000].print(); // 4: 错误调用, 但结果正确
return 0;
}
这位兄弟有疑问的是: 为什么3和4两种方法, 下标不正确, 而其结果却完全正常? 显示的结果是:
hello!
hello!
hello!
hello!
我把程序改了改, 将类MyClass调整成以下结构:
class MyClass
{
public:
MyClass(){ data1 =1; data2=2;};
~MyClass(){};
int data1,data2;
void print()
{
cout << "hello! data1: " << data1 << " data2: " << data2 << endl;
}
};
再次编译(编译环境是gcc 4.2), 执行, 结果如下:
hello! data1: 1 data2: 2
hello! data1: 1 data2: 2
hello! data1: 0 data2: 135153
段错误
这其实又是一个老生常谈的问题. 要搞清这个问题, 就得先弄明白类函数是如何被编译以及如何被执行的? 关于这点, "C++对象模型"上有甚为详细的讲解, 在此一笔带过:
对于类成员函数而言, 并不是一个对象对应一个单独的成员函数体, 而是此类的所有对象共用这个成员函数体, 当程序被编译之后, 此成员函数地址即已确定. 我们常说, 调用类成员函数时, 会将当前对象的this指针传给成员函数. 没错, 一个类, 它的成员函数体只有一份, 而成员函数之所以能把属于此类的各个对象的数据区别开, 就在于每次执行类成员函数时, 都会把当前对象的this指针(也即对象首地址)传入成员函数, 函数体内所有对类数据成员的访问, 都会被转化为this->数据成员的方式.
说到这里, 问题也就清楚了. 当print函数里, 只有"cout << "hello" << endl;"这条语句时, 由于print函数并没有访问对象的任何数据成员, 那么此时传进来的对象this指针实际上是没有任何用处的, 这样的函数, 其特征与全局函数并没有太大区别. 但当后来把类MyClass结构作了调整后, 由于print函数要访问类的数据成员data1和data2, 而类的数据成员, 是伴随着对象声明而产生的, 但是, 我们只new了一个MyClass, 显然, 下标"1"和下标"10000000"的MyClass对象根本不存在, 那们对它们的数据成员访问也显然是非法的.
但是, 还有另一个问题, 当把类MyClass再作一次调整, 成这样:
class MyClass
{
public:
MyClass(){ data1 =1;};
~MyClass(){};
int data1;
void print()
{
cout << "hello! data1: " << data1 << endl;
}
};
也就是只含有一个int类型的数据成员时, pMyClass[1].print()的访问结果有时却是正确的(不同的机子上会有不同的结果). 我想, 这个只能解释为地址对齐所造成的了(暂时存疑, 查证中, 欲知后事, 下回分解).