<div dir="ltr">It doesn't look like you account for alignment.<div>This is basically not-portable (I doubt unaligned loads in this context are faster than performing scalar operations), and possibly inefficient on x86 too.</div>
<div>To make it account for potentially random alignment will be awkward, but it might be possible to do efficiently.</div></div><div class="gmail_extra"><br><br><div class="gmail_quote">On 18 August 2013 04:50, Ilya Yaroshenko <span dir="ltr"><<a href="mailto:ilyayaroshenko@gmail.com" target="_blank">ilyayaroshenko@gmail.com</a>></span> wrote:<br>
<blockquote class="gmail_quote" style="margin:0 0 0 .8ex;border-left:1px #ccc solid;padding-left:1ex"><a href="http://spiceandmath.blogspot.ru/2013/08/simd-implementation-of-dot-product_17.html" target="_blank">http://spiceandmath.blogspot.<u></u>ru/2013/08/simd-<u></u>implementation-of-dot-product_<u></u>17.html</a><span class="HOEnZb"><font color="#888888"><br>

<br>
Ilya<br>
<br>
<br>
<br>
</font></span></blockquote></div><br></div>