7

C++ 模板技法

C++模板的学习,一来就是Trick太多,二来是规则太复杂而且资料少。我希望在这里总结一下,方便学习。这些C++特性可能只能在比较新的编译器上才能正确编译。下面的代码也都只是Demo,万不能在生产环境中使用。应用在生产环境中时,你还要考虑到const的增减、右值引用以优化性能、访问控制以增强封装等等。

此文不定期更新。若这些代码在你的编译器上无法编译成功,请及时告知。

一、type_traits

用一个空类Helper,如下面的integral_trait,将所有所需类型的相关内容包装起来(你可能想问我为什么要用enum,答案是只是想少写点字而已,尤其在你有几个整数要填充进Helper里的时候。当然你也可以写static const bool is_integral = false;,不过这实在是太长了):

template<typename T> struct integral_trait
    { enum { is_integral = false, }; };
template<> struct integral_trait<char>
    { enum { is_integral = true, }; };
template<> struct integral_trait<unsigned char>
    { enum { is_integral = true, }; };
template<> struct integral_trait<int>
    { enum { is_integral = true, }; };
template<> struct integral_trait<unsigned int>
    { enum { is_integral = true, }; };

template<typename T, typename Trait = integral_trait<T>>
bool is_integral_number(T) {
    return Trait::is_integral;
}

////////////////////////////////////////////////////////////
// My classes
struct big_integer {
    big_integer(const string&) { }
};

template<> struct integral_trait<big_integer>
    { enum { is_integral = true, }; };


int main()
{
    cout << is_integral_number(123) << endl; // 1
    cout << is_integral_number(123.) << endl; // 0
    cout << is_integral_number(big_integer("123")) << endl; // 1
    cout << is_integral_number("123") << endl; // 0
}

这样有什么好处呢?当你有一个自己的新类(如big_integer),你想让它能够适配is_integral_number,让这个函数认为它是个整数,你只需要为你的类添加一个integral_trait就好了。

Trait Helper在充当适配器的功能下几乎无所不能。你能为了能让数组和模板容器用上统一的迭代接口,用一个trait去把两者的区别磨平。

template<typename T>
struct iterator_trait {
    typedef typename T::iterator iterator;
    static iterator begin(T& c) { return c.begin(); }
    static iterator end(T& c) { return c.end(); }
};

template<typename T, size_t N>
struct iterator_trait<T[N]> {
    typedef T* iterator;
    static iterator begin(T arr[N]) { return arr; }
    static iterator end(T arr[N]) { return arr + N; }
};

template<typename T, typename Trait = iterator_trait<T>>
// use reference to keep array from decaying to pointer
void print_each(T& container) {
    for(typename Trait::iterator i = Trait::begin(container);
            i != Trait::end(container); ++i)
        cout << *i << ' ';
    cout << endl;
}

int main() {
    int arr_i[] = { 1, 2 };
    string arr_s[] = { "3", "4" };
    vector<float> vec_f = { 5.f, 6.f };
    list<double> lst_d = { 7., 8. };

    print_each(arr_i); // 1 2
    print_each(arr_s); // 3 4
    print_each(vec_f); // 5 6
    print_each(lst_d); // 7 8
}

Trait技法在STL里面已经用到烂了。

二、 SFINAE: enable_if

Substitution failure is not an error (SFINAE),替代失败不是错误,是一项C++98开始有的特性,意思是编译器在模板推导的时候,将所有可能可用的声明组合列出来,找到可用的一组(有且仅有一组,留意到如果可用的不止一个,编译器会报歧义错误),其余不可用的组合不会报错。最经典的应用是enable_if,它的实现是这样的:

template<bool B, class T = void>
struct enable_if {};
 
template<class T>
struct enable_if<true, T> { typedef T type; };

我们先解释下用法。比如在调用what_am_i(123);时,编译器把几个可能的推导列出来。除了第一个函数以外,其它所有都在..., int>::type的时候出错了,因为当B != true的时候,enable_if无法被偏特化,所以也就是没有enable_if::type了。

template<typename T,
    typename enable_if<is_integral<T>::value, int>::type n = 0>
void what_am_i(T) {
    cout << "Integral number." << endl;
}

template<typename T,
    typename enable_if<is_floating_point<T>::value, int>::type n = 0>
void what_am_i(T) {
    cout << "Floating point number." << endl;
}

template<typename T,
    typename enable_if<is_pointer<T>::value, int>::type n = 0>
void what_am_i(T) {
    cout << "Pointer." << endl;
}

int main()
{
    what_am_i(123);
    what_am_i(123.0);
    what_am_i("123");
}

天哪太丑了!你不禁叫了出来,心情跟你看到重载后置operator++的时候要加多一个参数(并且它毫无作用的时候)一样。为什么非要在后面加一个毫无作用的模板参数啊!enable_if最麻烦的问题就是,typename enable_if<is_???<T>::value, ???>::type该怎么放以及放哪儿。我来列出几个可能的地点,然后逐一排除:

  • 首先,我先明确我们的目的:诱导在函数里产生类型推导的失败,让具有SFINAE特性的编译器把它排除。只要出现失败就行了,有无意义什么的……我们不关心。

  • 函数体里面:说出这种话的人是白痴吗,编译器在推导类型的时候才不会关心函数体里面是怎样的呢。如果将失败置放在函数体里面,那就不是匹配失败了,而是真正的编译器错误。

  • 作为函数参数类型:

    template<typename T>
    void what_am_i(typename enable_if<is_pointer<T>::value, T>::type)
    { /* ... */ }

    不可以。what_am_i(123)是在告诉编译器你想通过一系列关于T的的表达式得到一个int,然后让编译器把T像解方程一样解出来 —— 编译器可不是MATLAB。除非你这样写:what_am_i<int>(123),编译器才有这个能力把匹配做对。

  • 返回值:

    template<typename T>
    typename enable_if<is_pointer<T>::value, void>::type what_am_i(T)
    { /* ... */ }

    是的你可以这样做,而且这样做很漂亮。这也是正确写法之一。

  • 作为模板参数的默认值:

    template<typename T, typename t =
        typename enable_if<is_floating_point<T>::value, T>::type>
    void what_am_i(T) { /* ... */ }

    如果你只有一个what_am_i的话,这是可行的。然而当我们有多个,就会引起歧义了。模板参数像函数参数一样,有一个签名,如果你所有的what_am_i都是这样做的,这样每个函数的函数签名都是是template<typename T, typename> what_am_i(T),根本没办法引起重载。类比一下,试想你声明两个函数int add(int a, int b = 0)int add(int a, int b = 1),编译器可不会认为这两个函数相互重载了,只是默认值相同的话。

  • 作为模板参数:

    template<typename T, typename enable_if<is_floating_point<T>::value, T>::type = 0>
    void what_am_i(T) { /* ... */ }

    我们快要接近正确答案了。但是这个仍然不行。关键出在T上:用int是别有用意的。能作为非类型模板(Non-type Template)的类型几乎只有整数类型,浮点不行,类/结构不行,部分指针是可以的。原因是这些浮点啊、类啊它们的“相等”概念非常含糊(比如浮点陷阱),编译器无法作出匹配。所以,明智的办法是用整数吧。

所以enable_if是精心设计的出来的。作者虽只用了短短几行,,背后却几乎涵盖了整个C++模板推导的机制。

在C++11里面增添了一个decltype关键字,用在函数声明有这样的写法:

template<typename T>
auto func(T t1, T t2) -> decltype(t1+t2);

你现在可以令decltype里的表达式发生错误以跳过这个匹配(例如T是一个指针,指针不能相加,表达式t1+t2是ill-form expression),但是在编写程序的时候尽量避免,因为Visual Studio到现在仍未完整支持decltype里的SFINAE(又叫Expression SFINAE),完美传承了Visual Studio习惯性落后于标准的思想。

三、 CRTP: 线性代数类实作

CRTP(Curiously recurring template pattern),奇异递归模板模式,是一个很有用的自我扩充的方法。在STL里面,有一个很经典的应用就是 enable_shared_from_this,不过动态内存管理的内容这里不详谈。

所谓CRTP,就是诸如template<class T> class A : B<T> { ... };这种形式。在类的定义还未完全出来之前,就继承自以自己为模板的另外一个类。编译器对这种情况采用类似与模板特化的惰性推演:在未将所有的模板参数实参化之前,它还不是一个真真正正的类型;而当填充了实参之后,这个类的定义也就早就出来了,所以也就没有类似于"incomplete type"的错误 —— 真是很聪明的设计,有一种超越时间空间的存在的感觉(笑

事情是这样的,一个程序员在实现线性代数库的时候都快要疯掉了。他要实现三种类型:复数、向量、矩阵,他们的操作几乎一模一样。然而你没办法让它们从某个基类继承过来,因为一来从数学上说不通,二来方式也是有所区别的。它们都有加法运算,简直一模一样的加法运算。它们都有乘法运算,天差地别的乘法运算。而且只要满足一些规定(比如列向量的行数等于左矩阵的列数),这些类型两者之间也可以互相相乘。更麻烦的是,你还要在实现完 operator+, operator* 之后,实现operator+=operator*=,还有满足交换律的两者对调。

这些功能都可以通过CRPT来整合到当前的类里面,并且通过Specialization来为不同的类型实现相同的接口。下面我们来看看这些线性代数类是怎样实现的。首先,我希望我们这些结构都可以有加法,可以格式化打印出来:

template<typename T>
struct add_impl {
    static T add(T l, const T& r) {
        typedef decltype(*r.begin()) val;
        transform(r.begin(), r.end(), l.begin(), l.begin(),
            [](const val& vl, const val& rl) { return vl + rl; });
        return l;
    }
};

template<typename Base, template<typename> class Impl>
struct add_ops {
    Base& self;
    add_ops(Base& s) : self(s) { }

    template<typename T1>
    auto operator+(const T1& other) const ->
            decltype(Impl<Base>::add(self, other)) {
        return Impl<Base>::add(self, other);
    }

    template<typename T1>
    auto operator+=(const T1& other) -> decltype(self) {
        return (self = operator+(other));
    }
}; 

在这里,将作为(见下文的三个主要的类)父类的add_ops没有实现加法操作,而是把它转发给一个模板Impl。这个Impl可能是add_impl或者任何一个拥有一个模板参数,并且实现了add语义的类。这里用到了一种技法叫做Template template parameter,模板模板参数,用来约束模板参数Impl也必须拥有一个模板参数。如果不用TTP,在生成add_ops的时候就不能用add_ops<Base, add_impl>而必须用add_ops<Base, add_impl<Base>>

矩阵的格式化打印跟向量的格式化打印是类似的,都是[ ... ],但是复数我们希望能够显示成a+bi的形式。所以我通过模板特化来为复数增加特性:

template<typename T>
struct fmt_impl {
    static void fmt(ostream& os, const T& t) {
        typedef decltype(*t.begin()) val;
        os << "[ ";
        for_each(t.begin(), t.end(), [&](const val& v) {
            os << v << ' ';
        });
        os << "]";
    }
};

template<typename T> class cmplx;
template<typename T>
struct fmt_impl<cmplx<T>> {
    static void fmt(ostream& os, const cmplx<T>& c) {
        os << c[0] << "+" << c[1] << "i";
    }
};

template<typename Base, template<typename> class Impl>
struct fmt_ops {
    Base& self;
    fmt_ops(Base& s) : self(s) { }
};
template<typename Base, template<typename> class Impl>
inline ostream& operator<<(ostream& os, const fmt_ops<Base, Impl> ops) {
    Impl<Base>::fmt(os, ops.self);
    return os;
}

说了这么久主人公还没现身。在实现了上面几个模板类之后,我们所需的复数、向量、矩阵三个类就轻松了,除了基本的构造函数和operator=需要自行实现外,只需要用CRPT技法继承自???_ops来纳入新的方法就好。为了省事我决定把三个类都继承自std::array来获取诸如迭代器、下标操作等功能,当然我也可以用类似的方法用CRPT实现它,不过限于篇幅就不这么做了:

template<typename T>
struct cmplx : public array<T, 2>,
        public add_ops<cmplx<T>, add_impl>,
        public fmt_ops<cmplx<T>, fmt_impl>
{

    typedef array<T, 2> array_t;
    typedef add_ops<cmplx<T>, add_impl> add_ops_t;
    typedef fmt_ops<cmplx<T>, fmt_impl> fmt_ops_t;

    cmplx() : add_ops_t(*this), fmt_ops_t(*this) { }
    cmplx(const cmplx& c) : array_t(c), add_ops_t(*this), fmt_ops_t(*this) { }
    cmplx(initializer_list<T> l) : add_ops_t(*this), fmt_ops_t(*this) 
        { copy_n(l.begin(), 2, this->begin()); }
    cmplx& operator=(const cmplx& c)
        { array_t::operator=(c); return *this; }
};

template<typename T, size_t N>
struct vec : public array<T, N>,
        public add_ops<vec<T, N>, add_impl>,
        public fmt_ops<vec<T, N>, fmt_impl>
{

    typedef array<T, N> array_t;
    typedef add_ops<vec<T, N>, add_impl> add_ops_t;
    typedef fmt_ops<vec<T, N>, fmt_impl> fmt_ops_t;

    vec() : add_ops_t(*this), fmt_ops_t(*this) { }
    vec(const vec& v) : array_t(v), add_ops_t(*this), fmt_ops_t(*this) { }
    vec(initializer_list<T> l) : add_ops_t(*this), fmt_ops_t(*this)
        { copy_n(l.begin(), N, this->begin()); }
    vec& operator=(const vec& v)
        { array_t::operator=(v); return *this; }
};

template<typename T, size_t N, size_t M>
struct mat : public array<vec<T, N>, M>,
        public add_ops<mat<T, N, M>, add_impl>,
        public fmt_ops<mat<T, N, M>, fmt_impl>
{

    typedef array<vec<T, N>, M> array_t;
    typedef add_ops<mat<T, N, M>, add_impl> add_ops_t;
    typedef fmt_ops<mat<T, N, M>, fmt_impl> fmt_ops_t;

    mat() : add_ops_t(*this), fmt_ops_t(*this) { }
    mat(const mat& m) : array_t(m), add_ops_t(*this), fmt_ops_t(*this) { }
    mat(initializer_list<vec<T, N>> l) : add_ops_t(*this), fmt_ops_t(*this)
        { copy_n(l.begin(), M, this->begin()); }
    mat& operator=(const mat& m)
        { array_t::operator=(m); return *this; }
};

typedef cmplx<double> c;
typedef vec<double, 3> vec3;
typedef vec<c, 3> vec3c;
typedef mat<double, 3, 2> mat32;

代码变得非常简短。三个类都仅用了十多行代码就含有了我们所需的功能:加法、格式化输出。想要加入乘法等功能也可以采用类似的手段。我们测试一下这些代码以保证它是可行的:

int main()
{
    vec3 v1{1, 2, 3};
    vec3 v2{4, 5, 6};
    vec3 v3 = v1 + v2;
    cout << v3 << endl; // [ 5 7 9 ]

    vec3c vc1{c{0, 1}, c{1, 2}, c{2, 3}};
    vec3c vc2{c{4, 5}, c{5, 6}, c{6, 7}};
    vec3c vc3 = vc1 + vc2;
    cout << vc3 << endl; // [ 4+6i 6+8i 8+10i ]
    vc3 += vc1;
    cout << vc3 << endl; // [ 4+7i 7+10i 10+13i ]

    mat32 m1{
        vec3{1, 2, 3},
        vec3{4, 5, 6},
    };
    mat32 m2{
        vec3{4, 5, 6},
        vec3{7, 8, 9},
    };
    mat32 m3 = m2 + m1;
    cout << m3 << endl; // [ [ 5 7 9 ] [ 11 13 15 ] ]
}

Shihira
1.1k 声望43 粉丝

桜の花が舞う あの日のように