Какие ключевые шаги включает в себя выполнение grid search в Scikit-Learn?
Этот вопрос проверяет знание шагов выполнения grid search для подбора гиперпараметров в Scikit-Learn.
Короткий ответ
Для выполнения grid search необходимо определить сетку параметров, создать объект GridSearchCV, передать модель и параметры, а затем выполнить подгонку. По завершении можно получить наилучшие параметры через атрибут best_params_.
Длинный ответ
Grid search — это метод подбора гиперпараметров, который проверяет все возможные комбинации значений из заданной сетки. Процесс выполнения grid search в Scikit-Learn включает несколько шагов:
1. Определение сетки параметров:
Создаётся словарь, где ключи — это имена параметров модели, а значения — списки возможных значений для каждого параметра.
2. Создание объекта GridSearchCV:
Для выполнения grid search создаётся объект GridSearchCV, в который передаются модель, сетка параметров и кросс-валидация.
3. Подгонка модели:
Затем выполняется подгонка модели с помощью метода fit, который перебирает все комбинации параметров.
4. Получение лучших параметров:
После завершения подбора параметров, лучшие параметры можно получить с помощью атрибута best_params_.
Пример:
from sklearn.model_selection import GridSearchCV
from sklearn.ensemble import RandomForestClassifier
param_grid = {'n_estimators': [10, 50, 100], 'max_depth': [5, 10, 15]}
model = RandomForestClassifier()
grid_search = GridSearchCV(model, param_grid, cv=5)
grid_search.fit(X_train, y_train)
print("Лучшие параметры:", grid_search.best_params_)