it-swarm.com.ru

Спецификатор ширины printf для поддержания точности значения с плавающей точкой

Существует ли спецификатор ширины printf, который можно применить к спецификатору с плавающей запятой, который автоматически форматирует выходные данные в необходимое число значащих цифр, чтобы при сканировании строки обратно получалось исходное значение с плавающей запятой?

Например, предположим, что я печатаю float с точностью до 2 десятичных разрядов:

float foobar = 0.9375;
printf("%.2f", foobar);    // prints out 0.94

Когда я сканирую вывод 0.94, у меня нет никаких стандартов, соответствующих гарантии того, что я верну оригинальное значение 0.9375 с плавающей запятой (в этом примере, вероятно, я не буду).

Я хотел бы, чтобы способ сказал printf автоматически печатать значение с плавающей запятой на необходимое количество значащих цифр, чтобы гарантировать, что оно может быть отсканировано обратно к исходному значению, переданному printf.

Я мог бы использовать некоторые макросы в float.h для для получения максимальной ширины для передачи в printf, но уже есть спецификатор для автоматической печати до необходимого числа значащих цифр - или хотя бы до максимальная ширина?

77
Vilhelm Gray

Я рекомендую шестнадцатеричное решение @Jens Gustedt: используйте% a.

ОП хочет «печатать с максимальной точностью (или, по крайней мере, с самым значительным десятичным знаком)».

Простым примером было бы напечатать одну седьмую как в:

#include <float.h>
int Digs = DECIMAL_Dig;
double OneSeventh = 1.0/7.0;
printf("%.*e\n", Digs, OneSeventh);
// 1.428571428571428492127e-01

Но давайте копать глубже ...

Математически ответом является «0,142857 142857 142857 ...», но мы используем числа с плавающей запятой конечной точности . Давайте предположим двоичный код двойной точности IEEE 754 . Таким образом, OneSeventh = 1.0/7.0 приводит к значению ниже. Также показаны предшествующие и следующие представимые double числа с плавающей запятой.

OneSeventh before = 0.1428571428571428 214571170656199683435261249542236328125
OneSeventh        = 0.1428571428571428 49212692681248881854116916656494140625
OneSeventh after  = 0.1428571428571428 769682682968777953647077083587646484375

Печать точного десятичного представления double имеет ограниченное применение.

C имеет 2 семейства макросов в <float.h>, чтобы помочь нам.
Первый набор - это число значимых цифр для печати в строке в десятичном формате, поэтому при сканировании строки обратно Мы получаем исходную плавающую точку. Они показаны со значением минимума спецификации C и компилятором C11 sample.

FLT_DECIMAL_Dig   6,  9 (float)                           (C11)
DBL_DECIMAL_Dig  10, 17 (double)                          (C11)
LDBL_DECIMAL_Dig 10, 21 (long double)                     (C11)
DECIMAL_Dig      10, 21 (widest supported floating type)  (C99)

Второй набор - это число значимых цифр, строка может быть отсканирована с плавающей запятой и затем напечатана FP, сохраняя при этом то же представление строки. Они показаны со значением минимума спецификации C и компилятором C11 sample. Я считаю доступным пре-С99.

FLT_Dig   6, 6 (float)
DBL_Dig  10, 15 (double)
LDBL_Dig 10, 18 (long double)

Первый набор макросов, кажется, соответствует цели OP, состоящей из значимых цифр. Но этот macro не всегда доступен.

#ifdef DBL_DECIMAL_Dig
  #define OP_DBL_Digs (DBL_DECIMAL_Dig)
#else  
  #ifdef DECIMAL_Dig
    #define OP_DBL_Digs (DECIMAL_Dig)
  #else  
    #define OP_DBL_Digs (DBL_Dig + 3)
  #endif
#endif

«+ 3» был сутью моего предыдущего ответа . Он был сконцентрирован на том, если знать строку преобразования-туда-обратно-строку-преобразование (набор # 2 доступен макрос C89), как определить цифры для строки-FP? -FP (установить макросы # 1, доступные после C89)? В общем, прибавка 3 стала результатом.

Теперь сколько значимых цифр для печати известно и определяется с помощью <float.h>

Для печати N значимых десятичных цифр можно использовать различные форматы. 

С "%e" поле precision представляет собой количество цифр после начальная цифра и десятичная точка . Таким образом, - 1 находится в порядке. Примечание: этот -1 is not in the initialint Digs = DECIMAL_Dig; `

printf("%.*e\n", OP_DBL_Digs - 1, OneSeventh);
// 1.4285714285714285e-01

При использовании "%f" поле precision представляет собой количество цифр после десятичной точки . Для такого числа, как OneSeventh/1000000.0, потребуется OP_DBL_Digs + 6, чтобы увидеть все значимые цифры.

printf("%.*f\n", OP_DBL_Digs    , OneSeventh);
// 0.14285714285714285
printf("%.*f\n", OP_DBL_Digs + 6, OneSeventh/1000000.0);
// 0.00000014285714285714285

Примечание: многие из них используются для "%f". Это отображает 6 цифр после десятичной точки; 6 - это дисплей по умолчанию, а не точность числа.

69
chux

Короткий ответ - напечатать числа с плавающей запятой без потерь (чтобы их можно было прочитать. Обратно на одно и то же число, кроме NaN и Infinity):

  • Если ваш тип float: используйте printf("%.9g", number).
  • Если ваш тип double: используйте printf("%.17g", number).

НЕ используйте %f, так как это только указывает, сколько значащих цифр после десятичной дроби будет усекать небольшие числа. Для справки, магические числа 9 и 17 можно найти в float.h, который определяет FLT_DECIMAL_Dig и DBL_DECIMAL_Dig.

51
ccxvii

Если вас интересует только бит (соответственно, шестнадцатеричный шаблон), вы можете использовать формат %a. Это гарантирует вам:

Точность по умолчанию достаточна для точного представления значения, если точное представление в базе 2 существует и в противном случае достаточно велико, чтобы различать значения типа double.

Я должен добавить, что это доступно только с C99.

22
Jens Gustedt

Нет, такого спецификатора ширины printf не существует для печати с плавающей точкой с максимальной точностью. Позвольте мне объяснить, почему.

Максимальная точность float и double равна variable и зависит от фактического значенияfloat или double.

Напомним, float и double хранятся в sign.exponent.mantissa формате. Это означает, что гораздо больше битов используется для дробного компонента для малых чисел, чем для больших чисел.

enter image description here

Например, float может легко различать 0.0 и 0.1.

float r = 0;
printf( "%.6f\n", r ) ; // 0.000000
r+=0.1 ;
printf( "%.6f\n", r ) ; // 0.100000

Но float не имеет представления о разнице между 1e27 и 1e27 + 0.1.

r = 1e27;
printf( "%.6f\n", r ) ; // 999999988484154753734934528.000000
r+=0.1 ;
printf( "%.6f\n", r ) ; // still 999999988484154753734934528.000000

Это связано с тем, что вся точность (которая ограничена количеством битов мантиссы) используется для большей части числа слева от десятичной дроби.

Модификатор %.f просто говорит, сколько десятичных значений вы хотите вывести из числа с плавающей запятой до форматирование. Тот факт, что доступная точность зависит от размера числа до вы, как программист, обрабатываете. printf не может/не справляется с этим для вас.

10
bobobobo

Просто используйте макросы из <float.h> и спецификатор преобразования переменной ширины (".*"):

float f = 3.14159265358979323846;
printf("%.*f\n", FLT_Dig, f);
9
user529758

Я провел небольшой эксперимент, чтобы убедиться, что печать с DBL_DECIMAL_Dig действительно точно сохраняет двоичное представление числа. Оказалось, что для компиляторов и библиотек C, которые я пробовал, DBL_DECIMAL_Dig - это действительно требуемое количество цифр, и печать даже с одной цифрой меньше создает значительную проблему.

#include <float.h>
#include <math.h>
#include <stdio.h>
#include <stdlib.h>
#include <string.h>

union {
    short s[4];
    double d;
} u;

void
test(int digits)
{
    int i, j;
    char buff[40];
    double d2;
    int n, num_equal, bin_equal;

    srand(17);
    n = num_equal = bin_equal = 0;
    for (i = 0; i < 1000000; i++) {
        for (j = 0; j < 4; j++)
            u.s[j] = Rand();
        if (isnan(u.d))
            continue;
        n++;
        sprintf(buff, "%.*g", digits, u.d);
        sscanf(buff, "%lg", &d2);
        if (u.d == d2)
            num_equal++;
        if (memcmp(&u.d, &d2, sizeof(double)) == 0)
            bin_equal++;
    }
    printf("Tested %d values with %d digits: %d found numericaly equal, %d found binary equal\n", n, digits, num_equal, bin_equal);
}

int
main()
{
    test(DBL_DECIMAL_Dig);
    test(DBL_DECIMAL_Dig - 1);
    return 0;
}

Я запускаю это с компилятором C Microsoft 19.00.24215.1 и gcc версии 6.3.0 20170516 (Debian 6.3.0-18 + deb9u1). Использование на одну цифру меньше десятичной дроби вдвое уменьшает число чисел, которые сравниваются. (Я также проверил, что Rand() в том виде, в котором он используется, действительно дает около миллиона различных чисел.) Вот подробные результаты.

Microsoft C

 Протестировано 999523 значения с 17 цифрами: 999523 найдено, что числовое значение равно, 999523 найдено двоичное число равно 
 Протестировано 999523 значения с 16 цифрами: 549780 найдено числовое значение равно, 549780 найдено двоичное значение равно 

НКУ

 Протестировано 999492 значения с 17 цифрами: 999492 найдено численно равным, 999492 найдено двоичным числом 
 Протестировано 999492 значения с 16 цифрами: 546615 найдено численно равным, 546615 найдено двоичным кодом 
0
Diomidis Spinellis

В одном из моих комментариев к ответу я посетовал, что давно хотел каким-то образом напечатать все значащие цифры в значении с плавающей запятой в десятичной форме, во многом так же, как в вопросе. Ну наконец я сел и написал это. Это не совсем идеально, и это демонстрационный код, который печатает дополнительную информацию, но он в основном работает для моих тестов. Пожалуйста, дайте мне знать, если вы (то есть кто-нибудь) хотели бы получить копию всей программы-оболочки, которая запускает ее для тестирования.

static unsigned int
ilog10(uintmax_t v);

/*
 * Note:  As presented this demo code prints a whole line including information
 * about how the form was arrived with, as well as in certain cases a couple of
 * interesting details about the number, such as the number of decimal places,
 * and possibley the magnitude of the value and the number of significant
 * digits.
 */
void
print_decimal(double d)
{
        size_t sigdig;
        int dplaces;
        double flintmax;

        /*
         * If we really want to see a plain decimal presentation with all of
         * the possible significant digits of precision for a floating point
         * number, then we must calculate the correct number of decimal places
         * to show with "%.*f" as follows.
         *
         * This is in lieu of always using either full on scientific notation
         * with "%e" (where the presentation is always in decimal format so we
         * can directly print the maximum number of significant digits
         * supported by the representation, taking into acount the one digit
         * represented by by the leading digit)
         *
         *        printf("%1.*e", DBL_DECIMAL_Dig - 1, d)
         *
         * or using the built-in human-friendly formatting with "%g" (where a
         * '*' parameter is used as the number of significant digits to print
         * and so we can just print exactly the maximum number supported by the
         * representation)
         *
         *         printf("%.*g", DBL_DECIMAL_Dig, d)
         *
         *
         * N.B.:  If we want the printed result to again survive a round-trip
         * conversion to binary and back, and to be rounded to a human-friendly
         * number, then we can only print DBL_Dig significant digits (instead
         * of the larger DBL_DECIMAL_Dig digits).
         *
         * Note:  "flintmax" here refers to the largest consecutive integer
         * that can be safely stored in a floating point variable without
         * losing precision.
         */
#ifdef PRINT_ROUND_TRIP_SAFE
# ifdef DBL_Dig
        sigdig = DBL_Dig;
# else
        sigdig = ilog10(uipow(FLT_RADIX, DBL_MANT_Dig - 1));
# endif
#else
# ifdef DBL_DECIMAL_Dig
        sigdig = DBL_DECIMAL_Dig;
# else
        sigdig = (size_t) lrint(ceil(DBL_MANT_Dig * log10((double) FLT_RADIX))) + 1;
# endif
#endif
        flintmax = pow((double) FLT_RADIX, (double) DBL_MANT_Dig); /* xxx use uipow() */
        if (d == 0.0) {
                printf("z = %.*s\n", (int) sigdig + 1, "0.000000000000000000000"); /* 21 */
        } else if (fabs(d) >= 0.1 &&
                   fabs(d) <= flintmax) {
                dplaces = (int) (sigdig - (size_t) lrint(ceil(log10(ceil(fabs(d))))));
                if (dplaces < 0) {
                        /* XXX this is likely never less than -1 */
                        /*
                         * XXX the last digit is not significant!!! XXX
                         *
                         * This should also be printed with sprintf() and edited...
                         */
                        printf("R = %.0f [%d too many significant digits!!!, zero decimal places]\n", d, abs(dplaces));
                } else if (dplaces == 0) {
                        /*
                         * The decimal fraction here is not significant and
                         * should always be zero  (XXX I've never seen this)
                         */
                        printf("R = %.0f [zero decimal places]\n", d);
                } else {
                        if (fabs(d) == 1.0) {
                                /*
                                 * This is a special case where the calculation
                                 * is off by one because log10(1.0) is 0, but
                                 * we still have the leading '1' whole digit to
                                 * count as a significant digit.
                                 */
#if 0
                                printf("ceil(1.0) = %f, log10(ceil(1.0)) = %f, ceil(log10(ceil(1.0))) = %f\n",
                                       ceil(fabs(d)), log10(ceil(fabs(d))), ceil(log10(ceil(fabs(d)))));
#endif
                                dplaces--;
                        }
                        /* this is really the "useful" range of %f */
                        printf("r = %.*f [%d decimal places]\n", dplaces, d, dplaces);
                }
        } else {
                if (fabs(d) < 1.0) {
                        int lz;

                        lz = abs((int) lrint(floor(log10(fabs(d)))));
                        /* i.e. add # of leading zeros to the precision */
                        dplaces = (int) sigdig - 1 + lz;
                        printf("f = %.*f [%d decimal places]\n", dplaces, d, dplaces);
                } else {                /* d > flintmax */
                        size_t n;
                        size_t i;
                        char *df;

                        /*
                         * hmmmm...  the easy way to suppress the "invalid",
                         * i.e. non-significant digits is to do a string
                         * replacement of all dgits after the first
                         * DBL_DECIMAL_Dig to convert them to zeros, and to
                         * round the least significant digit.
                         */
                        df = malloc((size_t) 1);
                        n = (size_t) snprintf(df, (size_t) 1, "%.1f", d);
                        n++;                /* for the NUL */
                        df = realloc(df, n);
                        (void) snprintf(df, n, "%.1f", d);
                        if ((n - 2) > sigdig) {
                                /*
                                 * XXX rounding the integer part here is "hard"
                                 * -- we would have to convert the digits up to
                                 * this point back into a binary format and
                                 * round that value appropriately in order to
                                 * do it correctly.
                                 */
                                if (df[sigdig] >= '5' && df[sigdig] <= '9') {
                                        if (df[sigdig - 1] == '9') {
                                                /*
                                                 * xxx fixing this is left as
                                                 * an exercise to the reader!
                                                 */
                                                printf("F = *** failed to round integer part at the least significant digit!!! ***\n");
                                                free(df);
                                                return;
                                        } else {
                                                df[sigdig - 1]++;
                                        }
                                }
                                for (i = sigdig; df[i] != '.'; i++) {
                                        df[i] = '0';
                                }
                        } else {
                                i = n - 1; /* less the NUL */
                                if (isnan(d) || isinf(d)) {
                                        sigdig = 0; /* "nan" or "inf" */
                                }
                        }
                        printf("F = %.*s. [0 decimal places, %lu digits, %lu digits significant]\n",
                               (int) i, df, (unsigned long int) i, (unsigned long int) sigdig);
                        free(df);
                }
        }

        return;
}


static unsigned int
msb(uintmax_t v)
{
        unsigned int mb = 0;

        while (v >>= 1) { /* unroll for more speed...  (see ilog2()) */
                mb++;
        }

        return mb;
}

static unsigned int
ilog10(uintmax_t v)
{
        unsigned int r;
        static unsigned long long int const PowersOf10[] =
                { 1LLU, 10LLU, 100LLU, 1000LLU, 10000LLU, 100000LLU, 1000000LLU,
                  10000000LLU, 100000000LLU, 1000000000LLU, 10000000000LLU,
                  100000000000LLU, 1000000000000LLU, 10000000000000LLU,
                  100000000000000LLU, 1000000000000000LLU, 10000000000000000LLU,
                  100000000000000000LLU, 1000000000000000000LLU,
                  10000000000000000000LLU };

        if (!v) {
                return ~0U;
        }
        /*
         * By the relationship "log10(v) = log2(v) / log2(10)", we need to
         * multiply "log2(v)" by "1 / log2(10)", which is approximately
         * 1233/4096, or (1233, followed by a right shift of 12).
         *
         * Finally, since the result is only an approximation that may be off
         * by one, the exact value is found by subtracting "v < PowersOf10[r]"
         * from the result.
         */
        r = ((msb(v) * 1233) >> 12) + 1;

        return r - (v < PowersOf10[r]);
}
0
Greg A. Woods