1. ホーム
  2. c++

[解決済み] より効率的な方法は何ですか?二乗するためにpowを使うか、それとも単に自分自身と掛け合わせるか?

2022-05-24 23:32:25

質問

この2つの方法のうち、C言語ではどちらがより効率的でしょうか?また、どうでしょうか。

pow(x,3)

vs.

x*x*x // etc?

どのように解決するのですか?

アップデイト 2021

ベンチマークコードを以下のように修正しました。

  • タイミング測定に boost の代わりに std::chrono を使用するようにしました。
  • C++11 <random> の代わりに使用される rand()
  • ホイストアウトされるような繰り返しの操作を避けることができます。ベースパラメータは刻々と変化する。

GCC 10 -O2で以下のような結果が得られます(秒単位)。

exp     c++ pow     c pow       x*x*x...
2       0.204243    1.39962     0.0902527   
3       1.36162     1.38291     0.107679    
4       1.37717     1.38197     0.106103    
5       1.3815      1.39139     0.117097

GCC 10 -O3 は GCC 10 -O2 とほとんど同じです。

GCC 10 -O2 -ffast-mathと。

exp     c++ pow     c pow       x*x*x...
2       0.203625    1.4056      0.0913414   
3       0.11094     1.39938     0.108027    
4       0.201593    1.38618     0.101585    
5       0.102141    1.38212     0.10662

GCC 10 -O3 -ffast-mathを使用しています。

exp     c++ pow     c pow       x*x*x...
2       0.0451995   1.175       0.0450497   
3       0.0470842   1.20226     0.051399    
4       0.0475239   1.18033     0.0473844   
5       0.0522424   1.16817     0.0522291

Clang 12 -O2 で。

exp     c++ pow     c pow       x*x*x...
2       0.106242    0.105435    0.105533    
3       1.45909     1.4425      0.102235    
4       1.45629     1.44262     0.108861    
5       1.45837     1.44483     0.1116

Clang 12 -O3 は Clang 12 -O2 とほとんど同じです。

Clang 12 -O2 -ffast-mathと。

exp     c++ pow     c pow       x*x*x...
2       0.0233731   0.0232457   0.0231076   
3       0.0271074   0.0266663   0.0278415   
4       0.026897    0.0270698   0.0268115   
5       0.0312481   0.0296402   0.029811    

Clang 12 -O3 -ffast-mathはClang 12 -O2 -ffast-mathとほぼ同じです。

マシンは Intel Core i7-7700K で、Linux 5.4.0-73-generic x86_64 を使用しています。

結論

  • GCC 10 (-ffast-math なし) を使用した場合。 x*x*x... 常に より速い
  • GCC 10 -O2 -ffast-math を使用しています。 std::pow と同じ速さです。 x*x*x... に対して 奇数 指数関数
  • GCC 10 -O3 -ffast-math で。 std::pow と同じ速さです。 x*x*x... と同等であり、-O2 の約 2 倍の速さです。
  • GCC 10 では、C の pow(double, double) は常にかなり遅くなります。
  • Clang 12 (-ffast-math なし) を使用した場合。 x*x*x... は2より大きい指数に対してより高速です。
  • Clang 12 -ffast-mathでは、すべてのメソッドが同様の結果を生成します。
  • Clang 12で pow(double, double) と同じ速さです。 std::pow と同じです。
  • コンパイラに出し抜かれないようにベンチマークを書くのは ハード .

いずれは私のマシンにもっと新しいバージョンの GCC をインストールすることになるでしょうし、そうしたら私の結果を更新します。

更新されたベンチマーク コードはこちらです。

#include <cmath>
#include <chrono>
#include <iostream>
#include <random>

using Moment = std::chrono::high_resolution_clock::time_point;
using FloatSecs = std::chrono::duration<double>;

inline Moment now()
{
    return std::chrono::high_resolution_clock::now();
}

#define TEST(num, expression) \
double test##num(double b, long loops) \
{ \
    double x = 0.0; \
\
    auto startTime = now(); \
    for (long i=0; i<loops; ++i) \
    { \
        x += expression; \
        b += 1.0; \
    } \
    auto elapsed = now() - startTime; \
    auto seconds = std::chrono::duration_cast<FloatSecs>(elapsed); \
    std::cout << seconds.count() << "\t"; \
    return x; \
}

TEST(2, b*b)
TEST(3, b*b*b)
TEST(4, b*b*b*b)
TEST(5, b*b*b*b*b)

template <int exponent>
double testCppPow(double base, long loops)
{
    double x = 0.0;

    auto startTime = now();
    for (long i=0; i<loops; ++i)
    {
        x += std::pow(base, exponent);
        base += 1.0;
    }
    auto elapsed = now() - startTime;

    auto seconds = std::chrono::duration_cast<FloatSecs>(elapsed); \
    std::cout << seconds.count() << "\t"; \

    return x;
}

double testCPow(double base, double exponent, long loops)
{
    double x = 0.0;

    auto startTime = now();
    for (long i=0; i<loops; ++i)
    {
        x += ::pow(base, exponent);
        base += 1.0;
    }
    auto elapsed = now() - startTime;

    auto seconds = std::chrono::duration_cast<FloatSecs>(elapsed); \
    std::cout << seconds.count() << "\t"; \

    return x;
}

int main()
{
    using std::cout;
    long loops = 100000000l;
    double x = 0;
    std::random_device rd;
    std::default_random_engine re(rd());
    std::uniform_real_distribution<double> dist(1.1, 1.2);
    cout << "exp\tc++ pow\tc pow\tx*x*x...";

    cout << "\n2\t";
    double b = dist(re);
    x += testCppPow<2>(b, loops);
    x += testCPow(b, 2.0, loops);
    x += test2(b, loops);

    cout << "\n3\t";
    b = dist(re);
    x += testCppPow<3>(b, loops);
    x += testCPow(b, 3.0, loops);
    x += test3(b, loops);

    cout << "\n4\t";
    b = dist(re);
    x += testCppPow<4>(b, loops);
    x += testCPow(b, 4.0, loops);
    x += test4(b, loops);

    cout << "\n5\t";
    b = dist(re);
    x += testCppPow<5>(b, loops);
    x += testCPow(b, 5.0, loops);
    x += test5(b, loops);

    std::cout << "\n" << x << "\n";
}


2010年の古い回答

私は x*x*...pow(x,i) 小さい i を使用します。

#include <cstdlib>
#include <cmath>
#include <boost/date_time/posix_time/posix_time.hpp>

inline boost::posix_time::ptime now()
{
    return boost::posix_time::microsec_clock::local_time();
}

#define TEST(num, expression) \
double test##num(double b, long loops) \
{ \
    double x = 0.0; \
\
    boost::posix_time::ptime startTime = now(); \
    for (long i=0; i<loops; ++i) \
    { \
        x += expression; \
        x += expression; \
        x += expression; \
        x += expression; \
        x += expression; \
        x += expression; \
        x += expression; \
        x += expression; \
        x += expression; \
        x += expression; \
    } \
    boost::posix_time::time_duration elapsed = now() - startTime; \
\
    std::cout << elapsed << " "; \
\
    return x; \
}

TEST(1, b)
TEST(2, b*b)
TEST(3, b*b*b)
TEST(4, b*b*b*b)
TEST(5, b*b*b*b*b)

template <int exponent>
double testpow(double base, long loops)
{
    double x = 0.0;

    boost::posix_time::ptime startTime = now();
    for (long i=0; i<loops; ++i)
    {
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
    }
    boost::posix_time::time_duration elapsed = now() - startTime;

    std::cout << elapsed << " ";

    return x;
}

int main()
{
    using std::cout;
    long loops = 100000000l;
    double x = 0.0;
    cout << "1 ";
    x += testpow<1>(rand(), loops);
    x += test1(rand(), loops);

    cout << "\n2 ";
    x += testpow<2>(rand(), loops);
    x += test2(rand(), loops);

    cout << "\n3 ";
    x += testpow<3>(rand(), loops);
    x += test3(rand(), loops);

    cout << "\n4 ";
    x += testpow<4>(rand(), loops);
    x += test4(rand(), loops);

    cout << "\n5 ";
    x += testpow<5>(rand(), loops);
    x += test5(rand(), loops);
    cout << "\n" << x << "\n";
}

結果は

1 00:00:01.126008 00:00:01.128338 
2 00:00:01.125832 00:00:01.127227 
3 00:00:01.125563 00:00:01.126590 
4 00:00:01.126289 00:00:01.126086 
5 00:00:01.126570 00:00:01.125930 
2.45829e+54

コンパイラが最適化しないように、すべてのpow計算の結果を蓄積していることに注意してください。

もし私が std::pow(double, double) のバージョンと loops = 1000000l , を得ることができます。

1 00:00:00.011339 00:00:00.011262 
2 00:00:00.011259 00:00:00.011254 
3 00:00:00.975658 00:00:00.011254 
4 00:00:00.976427 00:00:00.011254 
5 00:00:00.973029 00:00:00.011254 
2.45829e+52

Ubuntu 9.10 64bit が動作する Intel Core Duo 上での話です。gcc 4.4.1 で -o2 最適化でコンパイルしました。

ということは、C言語では、そう x*x*x よりも高速になります。 pow(x, 3) がないため pow(double, int) のオーバーロードがないからです。C++では、ほぼ同じになります。(私のテストにおける方法論が正しいと仮定して)。


An Markm さんのコメントに対するものです。

たとえ using namespace std ディレクティブが発行されたとしても、もし powint であれば、その std::pow(double, int) からのオーバーロードは <cmath> のオーバーロードが呼び出され、代わりに ::pow(double, double) から <math.h> .

このテストコードでは、その動作を確認しています。

#include <iostream>

namespace foo
{

    double bar(double x, int i)
    {
        std::cout << "foo::bar\n";
        return x*i;
    }


}

double bar(double x, double y)
{
    std::cout << "::bar\n";
    return x*y;
}

using namespace foo;

int main()
{
    double a = bar(1.2, 3); // Prints "foo::bar"
    std::cout << a << "\n";
    return 0;
}