resample() групує рядки за інформацією про час або дату, . groupby() групує рядки на основі значень в одному або кількох стовпцях.
Вибірка залежить від припущень, щоб зрозуміти, якими якостями можуть володіти великі групи. У повторній вибірці існують обмежені припущення. Часто існує менше вимог до розміру та різні методи тестування зразків. Це допоможе вам зосередитися на даних у кількох спробах повторної вибірки, щоб перевірити точність і мінімізувати зміщення.
Як згадувалося раніше, resample() — це метод фреймів даних pandas, який можна використовувати для підсумовувати дані за датою або часом. . Метод sum() додає всі значення для кожного періоду повторної дискретизації (наприклад, для кожного дня), щоб отримати підсумкове вихідне значення для цього періоду.
Повторна вибірка змінює частоту ваших даних часового ряду, тоді як ковзні операції обчислюють статистику в ковзному вікні фіксованого розміру в межах початкової частоти.
resample відрізняється від функції вибірки S/R resample завжди розглядає x як вектор елементів для вибору, тоді як sample розглядає вектор довжини один як окремий випадок і вибірки з 1:x . В іншому випадку функції мають однакову поведінку.
Повторна вибірка – це метод, який включає багаторазове відбирання зразків із навчального набору даних. Потім ці зразки використовуються для переоснащення конкретної моделі, щоб отримати більше інформації про встановлену модель. Мета така щоб зібрати більше інформації про зразок і підвищити точність і оцінити невизначеність.