<div dir="ltr">or for ldc <a href="http://docs.algorithm.dlang.io/latest/mir_math_common.html">http://docs.algorithm.dlang.io/latest/mir_math_common.html</a></div><div class="gmail_extra"><br><div class="gmail_quote">On Sat, Apr 7, 2018 at 9:10 PM, Daniel Kozak <span dir="ltr"><<a href="mailto:kozzi11@gmail.com" target="_blank">kozzi11@gmail.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><div dir="ltr">can you try it with c math functions?<div><br></div><div>instead of std.math, try to use core.stdc.math</div></div><div class="HOEnZb"><div class="h5"><div class="gmail_extra"><br><div class="gmail_quote">On Sat, Apr 7, 2018 at 8:53 PM, Arun Chandrasekaran via Digitalmars-d-learn <span dir="ltr"><<a href="mailto:digitalmars-d-learn@puremagic.com" target="_blank">digitalmars-d-learn@<wbr>puremagic.com</a>></span> wrote:<br><blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex">What am I doing wrong here that makes the D equivalent 2.5 times slower than it's C equivalent?<br>
<br>
Compilers used:<br>
<br>
LDC2: LDC - the LLVM D compiler (1.8.0)<br>
GCC: gcc (Ubuntu 5.4.0-6ubuntu1~16.04.9) 5.4.0 20160609<br>
<br>
11:36:39 ~/code/c/test2$ ldc2 sigmoid.d -O5 && ./sigmoid<br>
Max deviation is 0.001664<br>
10^7 iterations using sigmoid1: 308 ms<br>
10^7 iterations using sigmoid2: 30 ms<br>
11:36:55 ~/code/c/test2<br>
$ gcc sigmoid.c -o sigmoid-c -O3 -lm 2>/dev/null && ./sigmoid-c<br>
Max deviation is 0.001664<br>
10^7 iterations using sigmoid1: 134 ms<br>
10^7 iterations using sigmoid2: 29 ms<br>
11:37:10 ~/code/c/test2<br>
$<br>
<br>
C code, taken from <a href="https://stackoverflow.com/questions/412019/math-optimization-in-c-sharp#412176" rel="noreferrer" target="_blank">https://stackoverflow.com/ques<wbr>tions/412019/math-optimization<wbr>-in-c-sharp#412176</a>:<br>
<br>
```<br>
#include <math.h><br>
#include <stdio.h><br>
#include <time.h><br>
<br>
#define SCALE 320.0f<br>
#define RESOLUTION 2047<br>
#define MIN -RESOLUTION / SCALE<br>
#define MAX RESOLUTION / SCALE<br>
<br>
static float sigmoid_lut[RESOLUTION + 1];<br>
<br>
void init_sigmoid_lut(void) {<br>
    int i;<br>
    for (i = 0; i < RESOLUTION + 1; i++) {<br>
        sigmoid_lut[i] =  (1.0 / (1.0 + exp(-i / SCALE)));<br>
    }<br>
}<br>
<br>
static float sigmoid1(const float value) {<br>
    return (1.0f / (1.0f + expf(-value)));<br>
}<br>
<br>
static float sigmoid2(const float value) {<br>
    if (value <= MIN) return 0.0f;<br>
    if (value >= MAX) return 1.0f;<br>
    if (value >= 0) return sigmoid_lut[(int)(value * SCALE + 0.5f)];<br>
    return 1.0f-sigmoid_lut[(int)(-value * SCALE + 0.5f)];<br>
}<br>
<br>
float test_error() {<br>
    float x;<br>
    float emax = 0.0;<br>
<br>
    for (x = -10.0f; x < 10.0f; x+=0.00001f) {<br>
        float v0 = sigmoid1(x);<br>
        float v1 = sigmoid2(x);<br>
        float error = fabsf(v1 - v0);<br>
        if (error > emax) { emax = error; }<br>
    }<br>
    return emax;<br>
}<br>
<br>
int sigmoid1_perf() {<br>
    clock_t t0, t1;<br>
    int i;<br>
    float x, y = 0.0f;<br>
<br>
    t0 = clock();<br>
    for (i = 0; i < 10; i++) {<br>
        for (x = -5.0f; x <= 5.0f; x+=0.00001f) {<br>
            y = sigmoid1(x);<br>
        }<br>
    }<br>
    t1 = clock();<br>
    printf("", y); /* To avoid sigmoidX() calls being optimized away */<br>
    return (t1 - t0) / (CLOCKS_PER_SEC / 1000);<br>
}<br>
<br>
int sigmoid2_perf() {<br>
    clock_t t0, t1;<br>
    int i;<br>
    float x, y = 0.0f;<br>
    t0 = clock();<br>
    for (i = 0; i < 10; i++) {<br>
        for (x = -5.0f; x <= 5.0f; x+=0.00001f) {<br>
            y = sigmoid2(x);<br>
        }<br>
    }<br>
    t1 = clock();<br>
    printf("", y); /* To avoid sigmoidX() calls being optimized away */<br>
    return (t1 - t0) / (CLOCKS_PER_SEC / 1000);<br>
}<br>
<br>
int main(void) {<br>
    init_sigmoid_lut();<br>
    printf("Max deviation is %0.6f\n", test_error());<br>
    printf("10^7 iterations using sigmoid1: %d ms\n", sigmoid1_perf());<br>
    printf("10^7 iterations using sigmoid2: %d ms\n", sigmoid2_perf());<br>
<br>
    return 0;<br>
}<br>
```<br>
<br>
D equivalent:<br>
<br>
```<br>
module sigmoid;<br>
<br>
import std.stdio;<br>
import std.math;<br>
import std.datetime.stopwatch;<br>
<br>
enum SCALE = 320.0f;<br>
enum RESOLUTION = 2047;<br>
enum MIN = -RESOLUTION / SCALE;<br>
enum MAX = RESOLUTION / SCALE;<br>
<br>
float[RESOLUTION + 1] sigmoid_lut;<br>
<br>
void init_sigmoid_lut() {<br>
    int i;<br>
    for (i = 0; i < RESOLUTION + 1; i++) {<br>
        sigmoid_lut[i] =  (1.0 / (1.0 + exp(-i / SCALE)));<br>
    }<br>
}<br>
<br>
private float sigmoid1(const float value) {<br>
    return (1.0f / (1.0f + exp(-value)));<br>
}<br>
<br>
private float sigmoid2(const float value) {<br>
    if (value <= MIN) return 0.0f;<br>
    if (value >= MAX) return 1.0f;<br>
    if (value >= 0) return sigmoid_lut[cast(int)(value * SCALE + 0.5f)];<br>
    return 1.0f-sigmoid_lut[cast(int)(-va<wbr>lue * SCALE + 0.5f)];<br>
}<br>
<br>
private float test_error() {<br>
    float x;<br>
    float emax = 0.0;<br>
<br>
    for (x = -10.0f; x < 10.0f; x+=0.00001f) {<br>
        float v0 = sigmoid1(x);<br>
        float v1 = sigmoid2(x);<br>
        float error = fabs(v1 - v0);<br>
        if (error > emax) { emax = error; }<br>
    }<br>
    return emax;<br>
}<br>
<br>
private auto sigmoid1_perf() {<br>
    auto sw = StopWatch(AutoStart.yes);<br>
    int i;<br>
    float x, y = 0.0f;<br>
<br>
    for (i = 0; i < 10; i++) {<br>
        for (x = -5.0f; x <= 5.0f; x+=0.00001f) {<br>
            y = sigmoid1(x);<br>
        }<br>
    }<br>
    return sw.peek.total!"msecs";<br>
}<br>
<br>
private auto sigmoid2_perf() {<br>
    auto sw = StopWatch(AutoStart.yes);<br>
    int i;<br>
    float x, y = 0.0f;<br>
    for (i = 0; i < 10; i++) {<br>
        for (x = -5.0f; x <= 5.0f; x+=0.00001f) {<br>
            y = sigmoid2(x);<br>
        }<br>
    }<br>
    return sw.peek.total!"msecs";<br>
}<br>
<br>
int main() {<br>
    init_sigmoid_lut();<br>
    writefln("Max deviation is %0.6f", test_error());<br>
    writefln("10^7 iterations using sigmoid1: %s ms", sigmoid1_perf());<br>
    writefln("10^7 iterations using sigmoid2: %s ms", sigmoid2_perf());<br>
<br>
    return 0;<br>
}<br>
```<br>
</blockquote></div><br></div>
</div></div></blockquote></div><br></div>