Even命令が大幅に過剰
みんなそうだと思うけど、even命令が大幅に過剰になっちまった。
しかも、僕のコードは1ワード1ロードシャッフル無しだから、それはもう多すぎて
http://d.hatena.ne.jp/kikx/20090120
これはループのアンロール前で内側に14回のループが残ってたんだけど、
こんなんで44倍だったからアンロールしてoddに移動できるのを順番に移動してったんですよ。
(y >> 1) ^ mag01[y & 1] y << 7 y << 15
これらは上から、
even*1 + odd*3 odd*1 odd*2
を全部やってもまだ余ってて、しかたがないから
y >> 11
の半分くらいをodd*3で置き換えて、69倍速になったのです。