November 30, 2023

Ищем закономерности при заказе на дом бутилированной воды с GPT4

Я люблю собирать всевозможные данные и статистику, искать в них закономерности, инсайты и паттерны.

В данной заметке, накопилась статистика заказа бутилированной воды за год и я решил провести сравнительный анализ и экстраполировать вероятные заказы на будущие даты.

Собрал с истории звонков даты заказов воды, получил следующие данные:

30.11.23
04.11.23
25.09.23
27.08.23
31.07.23
08.07.23
15.06.23
01.06.23
26.05.23
15.05.23
02.05.23
16.04.23
02.04.23
12.03.23
03.02.23
19.01.23
03.01.23

формат: day.month.year

Попросил GPT4: На основе заданных дат с форматом day.month.year, что означает даты, когда я заказал 19 литров бутилированной воды на дом, сначала одну бутылку, а затем две, пожалуйста, проанализируй с помощью Python, pandas и matplotlib для получения некоторых идей, закономерностей, полезной информации и экстраполяции на будущие даты

based on a given dates with format like day.month.year which means dates when I ordered 19 liters of bottled water at home, first by one bottle and later by 2 please analyse using Python, pandas and matplotlib for some insights, patterns, mindful information and extrapolate to future dates:

Логика мышления ЛЛМки:

Чтобы проанализировать предоставленные данные и получить представление о потреблении вами бутилированной воды, нам нужно:

Преобразуем даты в pandas DataFrame.
Проанализируем данные, чтобы выявить закономерности, например частоту заказов.

Визуализируем данные с помощью matplotlib, чтобы лучше понять тенденции потребления.
Экстраполируем данные, чтобы предсказать будущие даты заказа.

Начнем с загрузки данных в pandas DataFrame и проведения первоначального анализа.

Начальный DataFrame был создан, в нем отображаются даты заказов и количество дней между каждым заказом. Первая запись не имеет значения "Дни между заказами", так как это начальная точка.

Далее давайте проанализируем данные на предмет наличия закономерностей, таких как средняя частота заказов, а затем визуализируем эту информацию с помощью графика. Мы также изучим, есть ли какие-либо тенденции или сезонные закономерности в потреблении воды. После этого мы сможем экстраполировать эти данные, чтобы предсказать будущие даты заказов.

Анализ позволяет сделать следующие выводы:

В среднем вы заказываете бутылки с водой каждые 20,7 дня.
Частота заказов заметно варьируется: стандартное отклонение составляет 9,39 дня.
Самый короткий интервал между заказами составляет 6 дней, а самый длинный - 40 дней.
Из графика видно, что частота ваших заказов довольно сильно варьируется во времени. Есть периоды с относительно частыми заказами (более короткие интервалы) и периоды с менее частыми заказами (более длинные интервалы).

Чтобы предсказать будущие даты заказов, мы можем использовать средний интервал в 20,7 дня в качестве базовой линии. Мы можем спроецировать это среднее значение на будущее, начиная с даты вашего последнего заказа (30.11.23), чтобы оценить, когда вам нужно будет разместить следующие заказы. Давайте рассчитаем несколько прогнозируемых будущих дат заказов.

Исходя из среднего интервала между вашими заказами, составляющего примерно 20,7 дня, следующие четыре прогнозируемые даты заказа бутылок для воды следующие:

21 декабря 2023 года
11 января 2024 г.
1 февраля 2024 г.
22 февраля 2024 года
Эти даты представляют собой общий ориентир, основанный на прошлых заказах, но фактические будущие заказы могут отличаться в зависимости от ваших конкретных потребностей и любых изменений в привычках потребления.

Не дурно, согласитесь?

Далее я попросил GPT4 учесть дополнительные факторы:

Я только что заказал еще две бутылки воды, пожалуйста, проанализируйте и учтите, что время года может влиять на потребление воды, а в семье 2 взрослых и 2 ребенка, которые потребляют воду.

please reanalyse and keep in mind that seasons can affect water consumption, and there are 2 adults and two children in a family who use water.

Чтобы учесть ваш последний заказ и учесть сезонное влияние на потребление воды, мы:

Добавим дату нового заказа в набор данных.
Проанализируем данные с учетом новой информации.
Учтем возможные сезонные колебания в потреблении воды (например, летом оно выше, зимой ниже).
Учитывайте тот факт, что в домохозяйстве есть двое взрослых и двое детей, что может повлиять на структуру потребления.
Давайте начнем с обновления набора данных с помощью вашего последнего заказа и повторного анализа.

С исправленным набором данных анализ позволяет сделать следующие выводы:

Средний интервал между заказами бутылок с водой теперь составляет примерно 19,5 дня.
Частота заказов заметно варьируется: стандартное отклонение составляет около 10,4 дня.
Минимальный интервал составляет 0 дней (вероятно, из-за добавления последнего заказа), а максимальный - 40 дней.
Сезонный анализ:

Осенью средний интервал между заказами составляет 23,75 дня.
Весной средний интервал составляет примерно 18,67 дня.
Летом этот показатель немного ниже - 18,6 дня.
Зима показывает самый короткий интервал со средним значением 15,5 дня.
Эти результаты свидетельствуют о том, что потребление воды несколько выше зимой и ниже осенью. На это могут влиять сезонные факторы, такие как температура и активность в помещении, которые могут повлиять на потребности в воде вашей семьи (состоящей из двух взрослых и двух детей). Весной и летом расход воды относительно одинаков.

Понимание этих сезонных колебаний может помочь более эффективно планировать будущие заказы, учитывая меняющиеся потребности в потреблении воды в течение года.

На этом пока всё. Хочу в будущем добавить больше данных для наблюдений и повторить эксперимент. Позже вычислим экстраполяцию повышения цены и другие факторы.