1. Компания хочет улучшить свои бизнес-процессы, используя анализ данных. Какую основную задачу анализа данных необходимо поставить решить в первую очередь?
2. Вы работаете аналитиком и получили задание проанализировать данные о продажах за последний год. Какова будет ваша основная цель в этом анализе?
3. Ваша команда занимается анализом данных для оценки эффективности рекламной кампании. Какой этап анализа данных будет наиболее важным для решения этой задачи?
4. Получен набор данных о возрасте клиентов компании. Какую меру центральной тенденции лучше всего использовать, если данные содержат выбросы?
5. Вам необходимо представить данные о доходах сотрудников компании. Какой график будет наиболее эффективным для визуализации распределения доходов?
6. Вы анализируете результаты тестирования студентов и заметили, что средний балл значительно выше медианы. Что это может означать?
7. Вы исследуете взаимосвязь между количеством часов, проведенных студентами за учебой, и их оценками. Какой метод анализа будет для этого наиболее подходящим?
8. Вам необходимо провести исследование о том, как влияет температура воздуха на продажи мороженого. Какой график лучше всего подойдет для визуализации этой зависимости?
9. Проведен корреляционный анализ и получен коэффициент корреляции 0.85 между двумя переменными. Как может быть интерпретирован этот результат?
10. Вы хотите предсказать стоимость дома на основе его площади и количества комнат. Какой тип регрессионного анализа может быть для этого использован?
11. Вы провели парный регрессионный анализ и получили уравнение: Y = 2X + 5. Что означает коэффициент 2 в этом уравнении?
12. Модель множественной регрессии показывает низкий коэффициент детерминации (R²). Что это может означать?
13. При работе с экспоненциальной моделью необходимо применить линейные методы анализа. Какое преобразование вы можете использовать в этом случае?
14. Модель показывает нелинейную зависимость между переменными. О чем это говорит?
15. Для анализа данных используется полиномиальная регрессия с нелинейной зависимостью. Какой подход можно использовать в этом случае?
16. Вы анализируете данные о продажах компании за несколько лет и хотите выявить сезонные колебания. Какой метод анализа будет наиболее подходящим в этом случае?
17. Необходимо предсказать будущие значения временного ряда на основе его прошлых значений. Какой метод вы будете использовать в этом случае?
18. Вы заметили, что ваши данные о продажах комплектующих для компьютера имеют тренд, но также подвержены сезонным колебаниям. Какой метод будет наиболее эффективным для анализа таких данных?
19. Анализ данных – это …
20. Основная цель анализа данных – это …
21. В ряду основных задач процесса анализа данных – … (укажите 3 варианта ответа)
22. Задача классификации сводится к …
23. Соотнесите инструменты анализа данных с их назначением:
24. Соотнесите основные задачи анализа данных с характеристиками:
25. … анализ – это метод анализа, который используется для выявления взаимосвязей между переменными и прогнозирования будущих результатов
26. … шкала имеет строгий порядок, но не имеет равномерного интервала (например, размер одежды: S, M, L)
27. Тип шкалы, которая имеет нулевую точку, но не является абсолютной (например, температура по Цельсию), – это … шкала
28. … шкала используется для обозначения категорий без естественного порядка (например, цвета глаз, виды транспорта)
29. Расположите в правильном порядке этапы анализа данных:
30. Установите соответствие между типом диаграммы и ее назначением:
31. Для анализа одномерных рядов чаще всего используются такие инструменты, как … (укажите 2 варианта ответа)
32. Соотнести аспект временного ряда с его характеристикой:
33. Соотнести метод (модель) анализа с его характеристикой:
34. Неверно, что к процессу анализа данных относится …
35. Дисперсия случайной величины показывает …
36. … закон распределения – это распределение одной случайной величины, найденное при условии, что другая случайная величина приняла определенное значение
37. … случайные величины – это случайные величины, принимающие конечное или счетное число значений
38. Основными характеристиками для случайной величины являются …
39. Одномерная случайная величина – это …
40. Соотнесите инструмент анализа с его основной функцией для одномерных рядов:
41. Методы прогнозирования подразделяются на два изначальных класса – …
42. Задача, которая решается с помощью регрессионного анализа, – это …
43. Расположите методы в порядке возрастания сложности анализа связи:
44. Установите соответствие между методом и его целью.
45. Для измерения тесноты связи между двумя или более переменными используется …
46. … анализ – это метод, позволяющий построить уравнение для прогнозирования значения одной переменной на основе другой
47. … анализ (ANOVA) – это метод, который используется для анализа различий между группами и влияния различных факторов на исследуемую переменную?
48. Неверно, что … относится к традиционным статистическим методам анализа данных
49. Расположите методы выявления взаимосвязей в порядке от наиболее простого к наиболее сложному с точки зрения статистического анализа:
50. Расположите методы решения задач кластеризации и классификации в хронологическом порядке появления этих методов (начиная с самого раннего):
51. Задача регрессии сводится к …
52. Если у каждого из n объектов измеряется большое количество показателей и требуется без нарушения существенной структуры данных перейти к пространству показателей меньшей размерности – такая процедура сжатия возможна …
53. Установите соответствие между понятием и его определением:
54. Для прогнозирования урожайности на основе нескольких факторов, таких как количество осадков, температура и тип почвы, следует использовать … регрессионный анализ
55. Если коэффициент детерминации R^2 равен 0,95, это означает, что …
56. Согласно правильной интерпретации уравнения парной линейной регрессии у = 10 + 2х, при увеличении переменной …
57. Основное отличие парного и множественного регрессионного анализа состоит в том, что парный анализ …
58. Упорядочьте шаги выполнения регрессионного анализа:
59. Методы прогнозирования на два основных класса (количественные и качественные) классифицируются по источнику …
60. Участок … – это отрезок времени (исторических данных), на основе которого строится прогноз на будущее
61. Установите соответствие алгоритмов и их описаний:
62. Установите соответствие между алгоритмами и их временной сложностью:
63. Если зависимая переменная прогнозируется на основе одной независимой переменной, то для анализа … линейную регрессию
64. В множественной регрессии мы можем предсказать значение зависимой переменной, используя несколько … переменных
65. Линейная аппроксимация нелинейной системы в окрестности рабочей точки называется …
66. Для анализа после линеаризации нелинейной регрессионной модели используются …
67. Цель линеаризации нелинейной модели – …
68. Чтобы линеаризовать модель y = aebx, нужно …
69. Установите соответствие между типом нелинейной модели и методом ее линеаризации:
70. Для оценки параметров в линейной регрессии используется такой метод, как …
71. Если нелинейная модель не может быть легко линеаризована, то в этом случае …
72. Для определения аномальных значений уровней временного ряда используется … (укажите 2 варианта ответа)
73. Установите правильный порядок процедуры минимизации при заданном условии (см. ниже):
74. Метод, который используется для анализа стационарных временных рядов, – это …
75. К моделям анализа временных рядов относятся …
76. Ключевой задачей при анализе одномерных временных рядов является …
77. Стационарный временной ряд – это ряд, …
78. Установите соответствие понятия и его значения:
79. К традиционным статистическим методам изучения взаимосвязей относят … (укажите 3 варианта ответа)
80. Сопоставьте понятия с их определениями:
81. Метод … используется для сглаживания временных рядов
82. Нейронные сети, которые могут использоваться для прогнозирования временных рядов, — …
83. К основным статистическим методам анализа временных рядов относится …
84. … – это степень соответствия информации информационным потребностям пользователя, заданным его поисковым запросом
85. График или таблица коэффициентов автокорреляции разных временных лагов – это …
86. Расположит методы прогнозирования временных рядов в порядке возрастания их сложности:
87. Задержка или промежуток времени между связными явлениями – это временной …
88. Информационный вес измеренных данных при экспоненциальном сглаживании находится в промежутке от …
89. Метрика … выражает среднее абсолютное отклонение между фактическими и прогнозируемыми значениями
90. Метрика … выражает среднее относительное отклонение между фактическим и прогнозируемым значениями
91. В предварительном анализе данных для того, чтобы определить, являются ли данные случайными, имеют линию тренда или являются стационарными, используется метод …
92. Непараметрический тест проверки гипотезы, который применяется для анализа данных, измеренных в номинальной шкале, – это тест …
93. Установите соответствие понятия и его определения:
94. Если методом наименьших квадратов вычислить угловой коэффициент регрессии для наборов признаков (см. таблицу ниже), получим: …
95. Процесс поиска параметров модели, при которых сумма квадратов отклонений между предсказанеными значениями и реальными экспериментальными данными становится минимальной, – это …
96. В случае, когда зависимая переменная ассиметрична, описывает экспоненциальный рост, либо когда происходит нарушение допущений гомоскедастичности и нормальности, лучше всего применима … модель
97. Обработка информации и выбор вида уравнения регрессии может осуществляться методом …
98. Преобразование нелинейной зависимости к линейному виду называется методом …
99. Неверно, что к критериям, которые позволяют оценить работоспособность модели, относится критерий …
100. Свободный коэффициент для набора в уравнении регрессии (см. таблицу ниже) равен …
101. Неверно, что метод … является методом линеаризации
102. Линеаризация – это …
103. … – это стохастическая однородная зависимость, позволяющая установить соответствие между однородными случайными величинами
104. В отличии от регрессионного анализа корреляционный анализ позволяет …
105. Основное отличие функциональной зависимости от регрессии – в том, что она …
106. Методы точечной и интервальной оценок применимы …
107. Параметр, характеризующий степень линейной взаимосвязи между двумя выборками, – это …
108. Если коэффициент множественной детерминации равен 0,89, то критерий Фишера равен …
109. Если сумма остатков регрессии равна 0,73, а сумма квадратов отклонений точек данных от среднего значения равна -12,5, то коэффициент детерминации равен …
110. Для получения лучших результатов методом наименьших квадратов (МНК) требуется выполнение определенных предпосылок – условий …
111. Коэффициент детерминации находится в диапазоне от …
112. Вычислив распределение χ2, если известно, что при 200-кратном подбрасывании монеты решка выпала 102 раза, получим: …
113. Для оценки степени и направления взаимосвязи между двумя переменными основанными на рангах используется … анализ
114. Общая сумма рангов набора из 11 объектов равна …
115. Если коэффициент ранговой корреляции Кендалла у двух порядковых признаков равен -0,33, то можно сделать вывод, что связь между этими двумя признаками …
116. Вычислив коэффициент корреляции Спирмена для признаков, указанных в таблице ниже, и округлив ответ до сотых, получим: …
117. Коэффициент ранговой корреляции Кендалла может изменяться в диапазоне от …
118. Установите соответствие между тестами проверки гипотез и их описаниями:
119. Установите соответствие задач и их описаний:
120. Метод главных компонент – это метод … анализа
121. Этап анализа данных, на котором производится поиск зависимостей между наборами, поиск аномалий, визуализация и построение моделей, – это … анализ данных
126. Установите соответствие вида анализа и его характеристики:
127. При определении товарной стратегии или задачи сегментации рынка используют … анализ
128. Установите соответствие: понятия и его определения:
129. Метод статистического анализа, направленный на получение надежных результатов, устойчивых к выбросам и отклонениям, называется методом …
130. Оценка параметра генеральной совокупности одним числом называется … оценкой
131. Установите соответствие шкалы и ее характеристики:
132. Установите соответствие этапа анализа данных и его описания:
133. Неверно, что к визуализации данных относится …
134. Если по приведенному в таблице ниже набору значений вычислить коэффициент Пирсона и результат округлить до десятых, получим: …
135. Если по приведенному в таблице ниже набору значений вычислить коэффициент Пирсона, то можно сделать такой вывод о характере связи между признаками, что эта связь …
136. … – это библиотека Python, которая имеет встроенный функционал, позволяющий применить метод оптимизации, линейной алгебры и статистики
137. Для создания графиков и визуализации данных на языке R используется пакет …
138. Данные, значения которых может быть посчитано при помощи натуральных чисел, – это … данные
139. Расположите события в порядке увеличения значений их математических ожиданий, вычислив математическое ожидание каждого события: