"Оптимизация для PENTIUM процессора" - читать интересную книгу автораделение, что бы получить результат. Фактически же в X всегда возвращается
1, так что можно обойтись без деления. Мои тесты показывают, что на всех 32 битных Intel процессорах, сопроцессор всегда возвращает 1 в X, не зависимо от аргумента. Если вы хотите быть абсолютно уверенным, что ваш код будет работать на любых процессорах, вы можете проверить равенство X единице, что, конечно, будет быстрее чем деление. Значение Y может быть очень большим, но никогда не бесконечность, так что вы не должны тестироваться что Y содержит допустимое значение. 18.ЦЕЛЫЕ ЧИСЛА ВМЕСТО ЧИСЕЛ С ПЛАВАЮЩЕЙ ТОЧКОЙ ============================================== Целочисленные инструкции, обычно, исполняются быстрее, чем инструкции с плавающей точкой, так что выгоднее использовать целочисленные инструкции для замены простых инструкций с плавающей точкой. Наиболее очевидный пример - перемещение данных. Пример: FLD QWORD PTR [ESI] / FSTP QWORD PTR [EDI] Заменяется на: MOV EAX,[ESI] / MOV EBX,[ESI+4] / MOV [EDI],EAX / MOV [EDI+4],EBX Если первый код исполняется за 4 такта, то последний за 2. В данном случае значение числа с плавающей точкой, обычно, представлено 32 или 64 битовой нулевой последовательностью, но здесь надо быть осторожным: бит знака может быть установлен! Минус ноль считается корректным числом, и процессор действительно может с генерировать такое число, например умножая отрицательное число на ноль. Таким образом, если вы хотите сравнить число с плавающей точкой с нулем, то вы не должны тестировать бит знака. Пример: FLD DWORD PTR [EBX] / FTST / FNSTSW AX / AND AH,40H / JNZ IsZero Используя целочисленные инструкции и опуская бит знака получим: MOV EAX,[EBX] / ADD EAX,EAX / JZ IsZero Таким образом вместо 9 тактов предыдущего кода мы опять получили 2 такта. Если число с плавающей точкой двойной точности (QWORD), то вам надо протестировать биты 32-62. Если они установлены в ноль и младшая половина тоже ноль, то все нормально. Проверка отрицательности: Число с плавающей точкой отрицательное, если у него установлен бит знака и есть, по крайней мере, еще один установленный бит. Например: MOV EAX,[NumberToTest] / CMP EAX,80000000H / JA IsNegative |
|
|