it-swarm.com.ru

Как иметь логарифмические ячейки в гистограмме Python

Насколько я знаю, опция Log = True в функции гистограммы относится только к оси Y.

P.hist(d,bins=50,log=True,alpha=0.5,color='b',histtype='step')

Мне нужно, чтобы мусорные ведра были одинаково разнесены в log10. Есть ли что-то, что может сделать это?

65
Brian

используйте logspace () для создания геометрической последовательности и передайте ее параметру bin. И установите шкалу xaxis, чтобы записать масштаб.

import pylab as pl
import numpy as np

data = np.random.normal(size=10000)
pl.hist(data, bins=np.logspace(np.log10(0.1),np.log10(1.0), 50))
pl.gca().set_xscale("log")
pl.show()

enter image description here

103
HYRY

Самый прямой способ - просто вычислить log10 пределов, вычислить линейно расположенные интервалы, а затем преобразовать обратно, увеличив степень до 10, как показано ниже:

import pylab as pl
import numpy as np

data = np.random.normal(size=10000)

MIN, MAX = .01, 10.0

pl.figure()
pl.hist(data, bins = 10 ** np.linspace(np.log10(MIN), np.log10(MAX), 50))
pl.gca().set_xscale("log")
pl.show()

 log10 spaced bins

15
Nimar

Следующий код показывает, как вы можете использовать bins='auto' с масштабом журнала.

import numpy as np
import matplotlib.pyplot as plt

data = 10**np.random.normal(size=500)

_, bins = np.histogram(np.log10(data + 1), bins='auto')
plt.hist(data, bins=10**bins);
plt.gca().set_xscale("log")
5
N. McA.

В дополнение к тому, что было заявлено, выполнение этого на панелях данных pandas также работает:

some_column_hist = dataframe['some_column'].plot(bins=np.logspace(-2, np.log10(max_value), 100), kind='hist', loglog=True, xlim=(0,max_value))

Я хотел бы предупредить, что может быть проблема с нормализацией бункеров. Каждая ячейка больше предыдущей и поэтому должна быть разделена на размер для нормализации частот перед построением графика, и кажется, что ни мое решение, ни решение HYRY не объясняют это.

Источник: https://arxiv.org/pdf/cond-mat/0412004.pdf

0
Alaa Moussawi