[解決済み] より効率的な方法は何ですか？二乗するためにpowを使うか、それとも単に自分自身と掛け合わせるか？

2022-05-24 23:32:25

質問

この2つの方法のうち、C言語ではどちらがより効率的でしょうか？また、どうでしょうか。

pow(x,3)

vs.

x*x*x // etc?

どのように解決するのですか？

アップデイト 2021

ベンチマークコードを以下のように修正しました。

タイミング測定に boost の代わりに std::chrono を使用するようにしました。
C++11 <random> の代わりに使用される rand()
ホイストアウトされるような繰り返しの操作を避けることができます。ベースパラメータは刻々と変化する。

GCC 10 -O2で以下のような結果が得られます（秒単位）。

exp     c++ pow     c pow       x*x*x...
2       0.204243    1.39962     0.0902527   
3       1.36162     1.38291     0.107679    
4       1.37717     1.38197     0.106103    
5       1.3815      1.39139     0.117097

GCC 10 -O3 は GCC 10 -O2 とほとんど同じです。

GCC 10 -O2 -ffast-mathと。

exp     c++ pow     c pow       x*x*x...
2       0.203625    1.4056      0.0913414   
3       0.11094     1.39938     0.108027    
4       0.201593    1.38618     0.101585    
5       0.102141    1.38212     0.10662

GCC 10 -O3 -ffast-mathを使用しています。

exp     c++ pow     c pow       x*x*x...
2       0.0451995   1.175       0.0450497   
3       0.0470842   1.20226     0.051399    
4       0.0475239   1.18033     0.0473844   
5       0.0522424   1.16817     0.0522291

Clang 12 -O2 で。

exp     c++ pow     c pow       x*x*x...
2       0.106242    0.105435    0.105533    
3       1.45909     1.4425      0.102235    
4       1.45629     1.44262     0.108861    
5       1.45837     1.44483     0.1116

Clang 12 -O3 は Clang 12 -O2 とほとんど同じです。

Clang 12 -O2 -ffast-mathと。

exp     c++ pow     c pow       x*x*x...
2       0.0233731   0.0232457   0.0231076   
3       0.0271074   0.0266663   0.0278415   
4       0.026897    0.0270698   0.0268115   
5       0.0312481   0.0296402   0.029811

Clang 12 -O3 -ffast-mathはClang 12 -O2 -ffast-mathとほぼ同じです。

マシンは Intel Core i7-7700K で、Linux 5.4.0-73-generic x86_64 を使用しています。

結論

GCC 10 (-ffast-math なし) を使用した場合。 x*x*x... は常により速い
GCC 10 -O2 -ffast-math を使用しています。 std::pow と同じ速さです。 x*x*x... に対して奇数指数関数
GCC 10 -O3 -ffast-math で。 std::pow と同じ速さです。 x*x*x... と同等であり、-O2 の約 2 倍の速さです。
GCC 10 では、C の pow(double, double) は常にかなり遅くなります。
Clang 12 (-ffast-math なし) を使用した場合。 x*x*x... は2より大きい指数に対してより高速です。
Clang 12 -ffast-mathでは、すべてのメソッドが同様の結果を生成します。
Clang 12で pow(double, double) と同じ速さです。 std::pow と同じです。
コンパイラに出し抜かれないようにベンチマークを書くのは ハード .

いずれは私のマシンにもっと新しいバージョンの GCC をインストールすることになるでしょうし、そうしたら私の結果を更新します。

更新されたベンチマークコードはこちらです。

#include <cmath>
#include <chrono>
#include <iostream>
#include <random>

using Moment = std::chrono::high_resolution_clock::time_point;
using FloatSecs = std::chrono::duration<double>;

inline Moment now()
{
    return std::chrono::high_resolution_clock::now();
}

#define TEST(num, expression) \
double test##num(double b, long loops) \
{ \
    double x = 0.0; \
\
    auto startTime = now(); \
    for (long i=0; i<loops; ++i) \
    { \
        x += expression; \
        b += 1.0; \
    } \
    auto elapsed = now() - startTime; \
    auto seconds = std::chrono::duration_cast<FloatSecs>(elapsed); \
    std::cout << seconds.count() << "\t"; \
    return x; \
}

TEST(2, b*b)
TEST(3, b*b*b)
TEST(4, b*b*b*b)
TEST(5, b*b*b*b*b)

template <int exponent>
double testCppPow(double base, long loops)
{
    double x = 0.0;

    auto startTime = now();
    for (long i=0; i<loops; ++i)
    {
        x += std::pow(base, exponent);
        base += 1.0;
    }
    auto elapsed = now() - startTime;

    auto seconds = std::chrono::duration_cast<FloatSecs>(elapsed); \
    std::cout << seconds.count() << "\t"; \

    return x;
}

double testCPow(double base, double exponent, long loops)
{
    double x = 0.0;

    auto startTime = now();
    for (long i=0; i<loops; ++i)
    {
        x += ::pow(base, exponent);
        base += 1.0;
    }
    auto elapsed = now() - startTime;

    auto seconds = std::chrono::duration_cast<FloatSecs>(elapsed); \
    std::cout << seconds.count() << "\t"; \

    return x;
}

int main()
{
    using std::cout;
    long loops = 100000000l;
    double x = 0;
    std::random_device rd;
    std::default_random_engine re(rd());
    std::uniform_real_distribution<double> dist(1.1, 1.2);
    cout << "exp\tc++ pow\tc pow\tx*x*x...";

    cout << "\n2\t";
    double b = dist(re);
    x += testCppPow<2>(b, loops);
    x += testCPow(b, 2.0, loops);
    x += test2(b, loops);

    cout << "\n3\t";
    b = dist(re);
    x += testCppPow<3>(b, loops);
    x += testCPow(b, 3.0, loops);
    x += test3(b, loops);

    cout << "\n4\t";
    b = dist(re);
    x += testCppPow<4>(b, loops);
    x += testCPow(b, 4.0, loops);
    x += test4(b, loops);

    cout << "\n5\t";
    b = dist(re);
    x += testCppPow<5>(b, loops);
    x += testCPow(b, 5.0, loops);
    x += test5(b, loops);

    std::cout << "\n" << x << "\n";
}

2010年の古い回答

私は x*x*... と pow(x,i) 小さい i を使用します。

#include <cstdlib>
#include <cmath>
#include <boost/date_time/posix_time/posix_time.hpp>

inline boost::posix_time::ptime now()
{
    return boost::posix_time::microsec_clock::local_time();
}

#define TEST(num, expression) \
double test##num(double b, long loops) \
{ \
    double x = 0.0; \
\
    boost::posix_time::ptime startTime = now(); \
    for (long i=0; i<loops; ++i) \
    { \
        x += expression; \
        x += expression; \
        x += expression; \
        x += expression; \
        x += expression; \
        x += expression; \
        x += expression; \
        x += expression; \
        x += expression; \
        x += expression; \
    } \
    boost::posix_time::time_duration elapsed = now() - startTime; \
\
    std::cout << elapsed << " "; \
\
    return x; \
}

TEST(1, b)
TEST(2, b*b)
TEST(3, b*b*b)
TEST(4, b*b*b*b)
TEST(5, b*b*b*b*b)

template <int exponent>
double testpow(double base, long loops)
{
    double x = 0.0;

    boost::posix_time::ptime startTime = now();
    for (long i=0; i<loops; ++i)
    {
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
        x += std::pow(base, exponent);
    }
    boost::posix_time::time_duration elapsed = now() - startTime;

    std::cout << elapsed << " ";

    return x;
}

int main()
{
    using std::cout;
    long loops = 100000000l;
    double x = 0.0;
    cout << "1 ";
    x += testpow<1>(rand(), loops);
    x += test1(rand(), loops);

    cout << "\n2 ";
    x += testpow<2>(rand(), loops);
    x += test2(rand(), loops);

    cout << "\n3 ";
    x += testpow<3>(rand(), loops);
    x += test3(rand(), loops);

    cout << "\n4 ";
    x += testpow<4>(rand(), loops);
    x += test4(rand(), loops);

    cout << "\n5 ";
    x += testpow<5>(rand(), loops);
    x += test5(rand(), loops);
    cout << "\n" << x << "\n";
}

結果は

1 00:00:01.126008 00:00:01.128338 
2 00:00:01.125832 00:00:01.127227 
3 00:00:01.125563 00:00:01.126590 
4 00:00:01.126289 00:00:01.126086 
5 00:00:01.126570 00:00:01.125930 
2.45829e+54

コンパイラが最適化しないように、すべてのpow計算の結果を蓄積していることに注意してください。

もし私が std::pow(double, double) のバージョンと loops = 1000000l , を得ることができます。

1 00:00:00.011339 00:00:00.011262 
2 00:00:00.011259 00:00:00.011254 
3 00:00:00.975658 00:00:00.011254 
4 00:00:00.976427 00:00:00.011254 
5 00:00:00.973029 00:00:00.011254 
2.45829e+52

Ubuntu 9.10 64bit が動作する Intel Core Duo 上での話です。gcc 4.4.1 で -o2 最適化でコンパイルしました。

ということは、C言語では、そう x*x*x よりも高速になります。 pow(x, 3) がないため pow(double, int) のオーバーロードがないからです。C++では、ほぼ同じになります。(私のテストにおける方法論が正しいと仮定して)。

An Markm さんのコメントに対するものです。

たとえ using namespace std ディレクティブが発行されたとしても、もし pow が int であれば、その std::pow(double, int) からのオーバーロードは <cmath> のオーバーロードが呼び出され、代わりに ::pow(double, double) から <math.h> .

このテストコードでは、その動作を確認しています。

#include <iostream>

namespace foo
{

    double bar(double x, int i)
    {
        std::cout << "foo::bar\n";
        return x*i;
    }


}

double bar(double x, double y)
{
    std::cout << "::bar\n";
    return x*y;
}

using namespace foo;

int main()
{
    double a = bar(1.2, 3); // Prints "foo::bar"
    std::cout << a << "\n";
    return 0;
}

[解決済み] より効率的な方法は何ですか？二乗するためにpowを使うか、それとも単に自分自身と掛け合わせるか？

質問

どのように解決するのですか？

関連

[解決済み】C++でint型に無限大を設定する

[解決済み] error: 'ostream' does not name a type.

[解決済み】抽象クラス型の無効なnew-expression

[解決済み] [Solved] インクルードファイルが開けません。'stdio.h' - Visual Studio Community 2017 - C++ Error

[解決済み】デバッグアサーションに失敗しました

[解決済み] SQLiteのINSERT/per-secondのパフォーマンスを向上させる

[解決済み] C言語では「?」演算子は何をするのですか？

[解決済み] C++11では、標準化されたメモリモデルが導入されました。その意味するところは？そして、C++プログラミングにどのような影響を与えるのでしょうか？

[解決済み] C++でintをstringに変換する最も簡単な方法

[解決済み] const int、const int const、int const *の違いは何ですか？

最新

nginxです。[emerg] 0.0.0.0:80 への bind() に失敗しました (98: アドレスは既に使用中です)

htmlページでギリシャ文字を使うには

ピュアhtml+cssでの要素読み込み効果

純粋なhtml + cssで五輪を実現するサンプルコード

ナビゲーションバー・ドロップダウンメニューのHTML+CSSサンプルコード

タイピング効果を実現するピュアhtml+css

htmlの選択ボックスのプレースホルダー作成に関する質問

html css3 伸縮しない画像表示効果

トップナビゲーションバーメニュー作成用HTML+CSS

html+css 実装サイバーパンク風ボタン

おすすめ

[解決済み】構造体のベクター初期化について

[解決済み] エラーが発生する。ISO C++は型を持たない宣言を禁じています。

[解決済み】致命的なエラー LNK1169: ゲームプログラミングで1つ以上の多重定義されたシンボルが発見された

[解決済み】C++でランダムな2倍数を生成する

[解決済み】Visual C++で "Debug Assertion failed "の原因となる行を見つける。

[解決済み】オブジェクト引数のない非静的メンバ関数の呼び出しコンパイラーエラー

[解決済み】なぜ、サイズ8の初期化されていない値を使用するのでしょうか？

[解決済み】警告 - 符号付き整数式と符号なし整数式の比較

[解決済み] 配列のベクトルを扱う正しい方法

[解決済み] 数値を累乗にするC++の関数は何ですか？