ПРОМЕЖУТОЧНАЯ АТТЕСТАЦИЯ
Модуль №2

--Вариант 1--

1.	Как называется процесс поиска закономерностей в данных без явного программирования?
а) Кластеризация
б) Машинное обучение
в) Регуляризация
г) Блокчейн
Ответ: б

2.	Какой этап обязательно нужен для получения качественных данных перед обучением модели?
а) Прогнозирование
б) Предобработка
в) Валидация
г) Объединение
Ответ: б

3.	Какой метод помогает находить группы похожих объектов без заранее заданных меток?
а) Регрессия
б) Кластеризация
в) Валидация
г) Прогнозирование
Ответ: б

4.	Что такое регулярное выражение (regex)?
а) Метод уменьшения размерности
б) Шаблон для поиска текста
в) Алгоритм классификации
г) Система хранения данных
Ответ: б

5.	Какая задача относится к обучению без учителя?
а) Оценка MAE
б) Кластеризация
в) Логистическая регрессия
г) Валидация
Ответ: б

6.	Какой алгоритм часто используется для поиска аномалий в блокчейн-транзакциях?
а) KMeans
б) IsolationForest
в) LinearRegression
г) Lasso
Ответ: б

7.	Для чего применяется регуляризация в моделях ML?
а) Для увеличения сложности
б) Для ограничения веса коэффициентов
в) Для добавления признаков
г) Для стандартизации
Ответ: б

8.	Какой метод уменьшения размерности помогает визуализировать данные?
а) R²
б) MAE
в) PCA
г) Hold-out
Ответ: в

9.	Какой символ в regex соответствует любой цифре?
а) \w
б) \s
в) \d
г) .
Ответ: в

10.	Какой этап идёт после очистки и преобразования данных?
а) Генерация новых признаков
б) Валидация
в) Моделирование
г) Кросс-валидация
Ответ: а

11.	Что означает “переобучение” в машинном обучении?
а) Модель плохо работает на обучении
б) Модель запоминает шум и теряет обобщение
в) Нет признаков
г) Модель быстро обучается
Ответ: б

12.	Какой подход борьбы с переобучением заключается в проверке на разных частях данных?
а) Регрессия
б) Кросс-валидация
в) Внедрение
г) Нормализация
Ответ: б

13.	Как одним словом называется процесс, когда модель слишком хорошо запоминает обучающие данные?
Ответ: переобучение

14.	Как называется метод, позволяющий разделять данные на группы по схожести?
Ответ: кластеризация

15.	Как одним словом называют этап удаления или замены лишних символов в данных?
Ответ: очистка


--Вариант 2--

1.	Какой этап помогает сделать данные пригодными для машинного обучения?
а) Прогнозирование
б) Предобработка
в) Валидация
г) Генерация
Ответ: б

2.	Что такое "feature" в машинном обучении?
а) Алгоритм
б) Признак
в) Модель
г) Ошибка
Ответ: б

3.	Для чего нужна стандартизация данных?
а) Для оценки точности
б) Для приведения к единому масштабу
в) Для отбора признаков
г) Для построения модели
Ответ: б

4.	Какой метод относится к обучению без учителя?
а) Логистическая регрессия
б) K-средних
в) Кросс-валидация
г) Hold-out
Ответ: б

5.	Какой термин обозначает данные с ошибками, пробелами и дубликатами?
а) Признаки
б) Грязные данные
в) Регулярные
г) Кластеры
Ответ: б

6.	Какая библиотека в Python используется для работы с регулярными выражениями?
а) pandas
б) numpy
в) re
г) sklearn
Ответ: в

7.	Какой этап обычно следует после очистки данных?
а) Обучение модели
б) Кластеризация
в) Преобразование данных
г) Валидация
Ответ: в

8.	Какой алгоритм объединяет объекты по минимальному расстоянию?
а) K-средних
б) Ridge
в) PCA
г) Lasso
Ответ: а

9.	Какой параметр в регулярных выражениях означает начало строки?
а) $
б) \b
в) ^
г) .
Ответ: в

10.	Что позволяет выявлять закономерности и аномалии без меток?
а) Регрессия
б) Кластеризация
в) Тестирование
г) Подбор признаков
Ответ: б

11.	Как называется уменьшение числа признаков без потери информации?
а) Кластеризация
б) Понижение размерности
в) Валидация
г) Hold-out
Ответ: б

12.	Какой шаг нужен для борьбы с переобучением?
а) Увеличение признаков
б) Кросс-валидация
в) Удаление данных
г) Ошибка
Ответ: б

13.	Как называется сокращение для метода главных компонент?
Ответ: PCA

14.	Каким английским словом называют шаблон для поиска текста?
Ответ: regex

15.	Как называется процесс группировки объектов по схожести без учителя?
Ответ: кластеризация


--Вариант 3--

1.	Какой этап подготовки данных удаляет повторяющиеся записи?
а) Генерация
б) Очистка
в) Валидация
г) Кластеризация
Ответ: б

2.	Что означает понижение размерности данных?
а) Увеличение столбцов
б) Уменьшение признаков
в) Увеличение строк
г) Удаление дубликатов
Ответ: б

3.	Какая задача НЕ относится к регулярным выражениям?
а) Поиск email
б) Стандартизация
в) Замена символов
г) Поиск дат
Ответ: б

4.	Что делает функция re.sub()?
а) Разделяет на кластеры
б) Заменяет по шаблону
в) Нормализует данные
г) Делит на train/test
Ответ: б

5.	Какой символ соответствует одному или более повторениям в regex?
а) ?
б) *
в) +
г) .
Ответ: в

6.	Какой этап позволяет автоматически создать новый информативный признак из текста?
а) Кластеризация
б) Генерация признаков
в) Тестирование
г) Прогнозирование
Ответ: б

7.	Какой алгоритм делит данные на группы, минимизируя сумму квадратов расстояний?
а) Ridge
б) K-средних
в) Lasso
г) LinearRegression
Ответ: б

8.	Для чего используется PCA?
а) Кластеризация
б) Понижение размерности
в) Предсказание класса
г) Поиск email
Ответ: б

9.	Какой этап следует за созданием новых признаков?
а) Внедрение
б) Моделирование
в) Валидация
г) Кластеризация
Ответ: б

10.	Какой подход помогает выявить скрытые группы без меток?
а) Кластеризация
б) Регрессия
в) Преобразование
г) Предобработка
Ответ: а

11.	Какой термин в ML означает избыточную подгонку под обучающие данные?
а) Обобщение
б) Переобучение
в) Кластеризация
г) Гиперпараметр
Ответ: б

12.	Какой символ regex используется для указания конца строки?
а) ^
б) .
в) $
г) +
Ответ: в

13.	Как одним словом называется процесс проверки модели на новых, не использованных при обучении данных?
Ответ: валидация

14.	Как называется сокращение для метода главных компонент?
Ответ: PCA

15.	Как одним словом по-русски называется “feature”?
Ответ: признак


--Вариант 4--

1.	Что такое аномалия в данных?
а) Обычное значение
б) Значение, выбивающееся из общей структуры
в) Новый признак
г) Нормализованное значение
Ответ: б

2.	Какой этап обычно идёт перед обучением модели?
а) Кластеризация
б) Предобработка
в) Валидация
г) Тестирование
Ответ: б

3.	Что из перечисленного НЕ является квантификатором в regex?
а) *
б) +
в) ?
г) \d
Ответ: г

4.	Какой метод разбивает данные на обучающую и тестовую выборки?
а) Hold-out
б) Кросс-валидация
в) KMeans
г) Ridge
Ответ: а

5.	Какой шаг позволяет привести временные метки к привычному формату?
а) Нормализация
б) Преобразование
в) Очистка
г) Кластеризация
Ответ: б

6.	Какой метод помогает выявлять “подозрительную активность” в блокчейн-данных?
а) KMeans
б) IsolationForest
в) Lasso
г) Ridge
Ответ: б

7.	Что такое регуляризация в ML?
а) Добавление новых признаков
б) Ограничение весов
в) Удаление пропусков
г) Прогнозирование
Ответ: б

8.	Какой метод ML используется для снижения размерности перед кластеризацией?
а) Hold-out
б) PCA
в) KMeans
г) Ridge
Ответ: б

9.	Какой символ regex используется для указания границы слова?
а) $
б) \b
в) .
г) *
Ответ: б

10.	Какой этап следует за валидацией модели?
а) Тестирование
б) Обучение
в) Внедрение
г) Очистка
Ответ: в

11.	Какой термин обозначает структуру данных, объединяющую схожие объекты?
а) Кластер
б) Валидация
в) Признак
г) Модель
Ответ: а

12.	Что позволяет автоматизировать процесс мониторинга в кибербезопасности?
а) Кросс-валидация
б) Машинное обучение
в) Регуляризация
г) Очистка
Ответ: б

13.	Как называется процесс объединения нескольких признаков в один новый признак для повышения информативности данных?
Ответ: агрегация

14.	Как одним словом называют “грязные данные”?
Ответ: шум

15.	Как называется шаблон поиска текста по правилам?
Ответ: regex


--Вариант 5--

1.	Какой этап помогает убрать пустые и ошибочные записи из данных?
а) Генерация
б) Очистка
в) Кластеризация
г) PCA
Ответ: б

2.	Какой алгоритм ML работает без меток классов?
а) Логистическая регрессия
б) KMeans
в) Ridge
г) RandomForest
Ответ: б

3.	Какой символ в regex обозначает любой один символ, кроме перевода строки?
а) .
б) \d
в) \s
г) ^
Ответ: а

4.	Для чего используется кросс-валидация?
а) Для тестирования модели на разных частях данных
б) Для очистки данных
в) Для генерации признаков
г) Для уменьшения размерности
Ответ: а

5.	Какой шаг помогает выделить новые признаки на основе паттернов?
а) Очистка
б) Генерация
в) Валидация
г) Нормализация
Ответ: б

6.	Какой алгоритм позволяет определить активность адреса в блокчейне?
а) LinearRegression
б) IsolationForest
в) Группировка
г) Счёт операций
Ответ: г

7.	Что такое “бинарный признак”?
а) Признак, принимающий два значения
б) Признак, всегда положительный
в) Новый алгоритм
г) Ошибка
Ответ: а

8.	Какой символ в regex обозначает “ровно n повторений”?
а) {n}
б) ?
в) *
г) +
Ответ: а

9.	Какой этап предшествует внедрению модели?
а) Сбор данных
б) Валидация
в) Кластеризация
г) Прогнозирование
Ответ: б

10.	Что такое “шум” в данных?
а) Информативный признак
б) Ошибочные значения
в) Время
г) Результат кластеризации
Ответ: б

11.	Какой подход позволяет выявлять группы без учителя?
а) Кластеризация
б) Регрессия
в) Генерация
г) Тестирование
Ответ: а

12.	Для чего используют нормализацию в ML?
а) Для масштабирования признаков
б) Для генерации
в) Для отбора
г) Для очистки
Ответ: а

13.	Как одним словом называют искусственное увеличение обучающей выборки с помощью модификации исходных данных?
Ответ: аугментация

14.	Как называется минимизация признаков для ускорения анализа?
Ответ: понижение

15.	Как по-английски “признак”?
Ответ: feature


--Вариант 6--

1.	Что делает функция re.findall()?
а) Находит все совпадения
б) Стандартизует данные
в) Группирует
г) Удаляет пробелы
Ответ: а

2.	Какой этап помогает избавиться от дубликатов в данных?
а) Очистка
б) Генерация
в) Кластеризация
г) Валидация
Ответ: а

3.	Какой метод обычно используют для визуализации многомерных данных?
а) Ridge
б) KMeans
в) PCA
г) IsolationForest
Ответ: в

4.	Какой шаг помогает сделать данные пригодными для обучения?
а) Очистка
б) Кросс-валидация
в) Hold-out
г) Регрессия
Ответ: а

5.	Какой алгоритм ML подходит для объединения по схожести?
а) KMeans
б) RandomForest
в) Ridge
г) Lasso
Ответ: а

6.	Какой символ regex обозначает пробельный символ?
а) \d
б) \s
в) .
г) \w
Ответ: б

7.	Какой этап нужен для оценки модели на новых данных?
а) Валидация
б) Генерация
в) Кластеризация
г) Нормализация
Ответ: а

8.	Для чего нужна стандартизация в ML?
а) Для уменьшения ошибок
б) Для приведения к нулевому среднему
в) Для разделения данных
г) Для очистки
Ответ: б

9.	Какой подход помогает уменьшить переобучение?
а) Кросс-валидация
б) Увеличение данных
в) Очистка
г) Предобработка
Ответ: а

10.	Какой этап ML позволяет искать новые закономерности?
а) Кластеризация
б) Тестирование
в) Генерация
г) Внедрение
Ответ: а

11.	Какой символ regex означает “один или ноль повторений”?
а) *
б) +
в) ?
г) .
Ответ: в

12.	Какой этап ML следует после обучения модели?
а) Внедрение
б) Очистка
в) Кластеризация
г) Генерация
Ответ: а

13.	Какой термин в машинном обучении означает преднамеренное добавление шума в данные для повышения устойчивости модели?
Ответ: регуляризация

14.	Как называется выявление необычных точек среди данных?
Ответ: аномалия

15.	Как одним словом по-английски “кластеризация”?
Ответ: clustering


--Вариант 7--

1.	Какой этап позволяет избавиться от лишних символов в тексте?
а) Очистка
б) Генерация
в) Валидация
г) Кластеризация
Ответ: а

2.	Какой алгоритм используется для уменьшения размерности данных?
а) IsolationForest
б) PCA
в) Ridge
г) Lasso
Ответ: б

3.	Какой символ в regex обозначает букву, цифру или подчёркивание?
а) \d
б) \s
в) \w
г) .
Ответ: в

4.	Какой метод борьбы с переобучением связан с уменьшением числа признаков?
а) Отбор признаков
б) Генерация
в) Регрессия
г) Кластеризация
Ответ: а

5.	Для чего нужна предобработка данных в ML?
а) Для ускорения анализа
б) Для увеличения объёма
в) Для генерации новых метрик
г) Для случайной выборки
Ответ: а

6.	Какой алгоритм ML определяет центры групп?
а) Ridge
б) KMeans
в) Lasso
г) PCA
Ответ: б

7.	Какой подход позволяет найти скрытые группы среди пользователей?
а) Кластеризация
б) Регрессия
в) Валидация
г) Очистка
Ответ: а

8.	Какой символ regex ищет любой символ, кроме перевода строки?
а) .
б) \d
в) \s
г) \w
Ответ: а

9.	Какой этап позволяет сделать выводы более надёжными?
а) Кросс-валидация
б) Предобработка
в) Генерация
г) Тестирование
Ответ: б

10.	Какой термин обозначает повторяемые, ошибочные или нерелевантные значения?
а) Аномалия
б) Шум
в) Признак
г) Кластер
Ответ: б

11.	Для чего используют генерацию признаков на основе паттернов?
а) Для создания новых столбцов
б) Для объединения
в) Для удаления
г) Для нормализации
Ответ: а

12.	Какой подход ML нужен для анализа больших неразмеченных данных?
а) Кластеризация
б) Регрессия
в) Валидация
г) Преобразование
Ответ: а

13.	Как называется подход, при котором вектор признаков уменьшают до двух или трёх компонент для визуализации?
Ответ: проекция

14.	Как по-русски называется “dimensionality reduction”?
Ответ: понижение

15.	Одним словом: этап создания новых информативных столбцов?
Ответ: генерация


--Вариант 8--

1.	Какой этап позволяет перевести суммы транзакций к единому масштабу?
а) Нормализация
б) Очистка
в) Валидация
г) Генерация
Ответ: а

2.	Какой символ в regex ищет “не цифру”?
а) \D
б) \d
в) \S
г) \s
Ответ: а

3.	Какой шаг предшествует выделению признаков?
а) Сбор данных
б) Кластеризация
в) Внедрение
г) Валидация
Ответ: а

4.	Для чего применяют регуляризацию?
а) Для ограничения сложности модели
б) Для генерации признаков
в) Для нормализации
г) Для отбора кластера
Ответ: а

5.	Какой алгоритм можно использовать для визуализации результатов после понижения размерности?
а) Ridge
б) PCA
в) IsolationForest
г) Lasso
Ответ: б

6.	Какой этап помогает выявить всплески активности в данных?
а) Генерация
б) Кластеризация
в) Обнаружение аномалий
г) Валидация
Ответ: в

7.	Какой шаг требуется после преобразования формата времени?
а) Генерация признаков
б) Кластеризация
в) Очистка
г) Нормализация
Ответ: а

8.	Какой термин означает новую характеристику, созданную на основе данных?
а) Аномалия
б) Признак
в) Модель
г) Группа
Ответ: б

9.	Какой подход в ML помогает строить компактные и устойчивые модели?
а) Регуляризация
б) Кластеризация
в) Нормализация
г) Генерация
Ответ: а

10.	Какой этап идёт после отбора признаков?
а) Обучение
б) Тестирование
в) Кластеризация
г) Внедрение
Ответ: а

11.	Какой метод помогает отобрать только важные признаки для модели?
а) Регуляризация
б) Кластеризация
в) Преобразование
г) Валидация
Ответ: а

12.	Что такое "timestamp" в данных блокчейна?
а) Время
б) Признак
в) Аномалия
г) Модель
Ответ: а

13.	Как одним словом называется показатель, измеряющий среднее абсолютное процентное отклонение предсказаний?
Ответ: MAPE

14.	Как называется способ “отбора наиболее важных признаков”?
Ответ: отбор

15.	Как по-английски "очистка"?
Ответ: cleaning


--Вариант 9--

1.	Какой алгоритм ML выделяет центры групп по схожести?
а) Ridge
б) KMeans
в) Lasso
г) PCA
Ответ: б

2.	Для чего нужна генерация новых признаков?
а) Для увеличения информативности
б) Для удаления ошибок
в) Для нормализации
г) Для отбора
Ответ: а

3.	Какой символ regex обозначает любой непробельный символ?
а) \D
б) \S
в) \W
г) \s
Ответ: б

4.	Какой этап помогает определить, есть ли дубликаты?
а) Очистка
б) Кластеризация
в) Генерация
г) Валидация
Ответ: а

5.	Какой подход ML используется для объединения схожих объектов?
а) Кластеризация
б) Внедрение
в) Регрессия
г) Прогнозирование
Ответ: а

6.	Какой шаг помогает сделать данные пригодными для анализа?
а) Предобработка
б) Внедрение
в) Кластеризация
г) Тестирование
Ответ: а

7.	Для чего используют нормализацию в данных блокчейна?
а) Для приведения суммы к единому масштабу
б) Для отбора кластера
в) Для визуализации
г) Для генерации признаков
Ответ: а

8.	Какой этап требуется для корректного сравнения разных моделей?
а) Валидация
б) Генерация
в) Тестирование
г) Очистка
Ответ: а

9.	Что позволяет делать модуль re в Python?
а) Работать с регулярными выражениями
б) Группировать данные
в) Прогнозировать
г) Нормализовать
Ответ: а

10.	Какой подход ML нужен для анализа неразмеченных данных?
а) Кластеризация
б) Генерация
в) Очистка
г) Внедрение
Ответ: а

11.	Какой символ regex соответствует “не букве, не цифре, не подчёркиванию”?
а) \W
б) \D
в) \S
г) .
Ответ: а

12.	Какой этап ML позволяет избежать избыточной подгонки?
а) Регуляризация
б) Внедрение
в) Тестирование
г) Очистка
Ответ: а

13.	Каким словом называют выбросы, которые появляются из-за ошибок измерения или сбора данных?
Ответ: артефакты

14.	Как по-русски "validation"?
Ответ: валидация

15.	Какой этап ML идёт перед “моделированием”?
Ответ: генерация


--Вариант 10--

1.	Для чего нужна очистка данных?
а) Для удаления ошибок
б) Для отбора признаков
в) Для генерации
г) Для внедрения
Ответ: а

2.	Какой этап ML позволяет выявить всплески активности?
а) Обнаружение аномалий
б) Кластеризация
в) Генерация
г) Тестирование
Ответ: а

3.	Какой символ regex ищет только цифры?
а) \w
б) \d
в) \s
г) .
Ответ: б

4.	Какой подход ML объединяет объекты по схожести?
а) Кластеризация
б) Генерация
в) Очистка
г) Валидация
Ответ: а

5.	Какой шаг необходим после отбора признаков?
а) Моделирование
б) Валидация
в) Генерация
г) Кластеризация
Ответ: а

6.	Какой этап ML помогает выявить шум?
а) Очистка
б) Кластеризация
в) Генерация
г) Тестирование
Ответ: а

7.	Для чего используют PCA?
а) Для понижения размерности
б) Для отбора признаков
в) Для генерации
г) Для очистки
Ответ: а

8.	Какой алгоритм часто используют для группировки товаров по признакам?
а) KMeans
б) IsolationForest
в) Ridge
г) Lasso
Ответ: а

9.	Какой этап позволяет выявить "подозрительную активность"?
а) Генерация
б) Кластеризация
в) Обнаружение аномалий
г) Очистка
Ответ: в

10.	Какой символ regex означает “один или более повторений”?
а) +
б) *
в) ?
г) .
Ответ: а

11.	Какой термин ML обозначает характеристику, влияющую на решение модели?
а) Признак
б) Кластер
в) Группа
г) Модель
Ответ: а

12.	Для чего нужна нормализация?
а) Для приведения к единому масштабу
б) Для отбора кластера
в) Для генерации
г) Для тестирования
Ответ: а

13.	Как называется метод машинного обучения, который объединяет несколько слабых моделей для получения более сильного решения?
Ответ: ансамбль

14.	Как по-английски “кластер”?
Ответ: cluster

15.	Одним словом: этап удаления повторяющихся строк?
Ответ: очистка