Home » Ответы Синергия МТИ » Введение в анализ больших данных ответы Синергия МТИ тесты

Введение в анализ больших данных ответы Синергия МТИ тесты

Скачать тест: Введение в анализ больших данных.dor_БАК ответы Синергия МТИ тесты.pdf

1. В вашей компании необходимо организовать сбор, хранение и обработку больших данных.
На что в первую очередь должно обратить внимание руководство при организации хранения и обработки данных?
2. Разным группам пользователей с различным уровнем доступа требуется доступ к одной и той же информации.
Что следует предпринять руководству?
3. Ваша компания использует различные технологии для сбора и хранения данных.
Приведите пример данных, когда эффективнее использовать технологию Hadoop.
4. Вам необходимо организовать потоковую обработку событий в режиме реального времени.
Какую технологию необходимо использовать?
5. Вам нужно рассчитать необходимые параметры для создания обшивки самолета.
Какая из областей машинного обучения вам в этом поможет?
6. Вам необходимо предсказать значения непрерывной числовой величины для входных данных.
Какой метод вам в этом поможет?
7. Вашей компании необходимо закупить новый вид сырья. Вам необходимо узнать, насколько может упасть стоимость этого сырья в ближайшем будущем и когда это может произойти.
Какой метод Data Mining вы будете использовать?
8. Вашей компании необходимо определить структуру клиентов по их вкладу в доходы компании.
Какой метод Data Mining вы будете использовать?
9. Вам необходимо импортировать в программную среду RStudio текстовый файл с разделителем.
Какую функцию вы будете использовать?
10. Выполнены следующие строки кода в программной среде RStudio:
vec <- c(3,5,2,1,8,4,9,10,3,15,1,11)
vec[2]
11. Velocity в контексте характеристик Big Data означает …
12. Неверно, что Variety в контексте характеристик Big Data означает … (укажите 3 варианта ответа)
13. Данные являются структурированными в … (укажите 2 варианта ответа)
14. Первые большие наборы данных начали использовать …
15. Минимальная единица измерения информации – это …
16. Процесс преобразования данных в код, который можно распознать только с помощью определенного ключа или пароля, – это …
17. … – это процесс преобразования данных в выводы, на основе которых будут приниматься решения и строиться действия с помощью людей, процессов и технологий
18. Целое четырехзначное число, отражающее количество зеттабайт в йоттабайте, – …
19. Установите соответствие между понятием и его содержанием:
20. Установите соответствие целей инфраструктуры Hadoop и их характеристик:
21. Причина создания баз данных NoSQL – …
22. Неверно, что MapReduce …
23. В реляционной модели представленные данные для пользователя передаются в виде …
24. SQL – это …
25. … – это группа файлов стандартной структуры, служащих для хранения данных и организованных таким образом, чтобы обеспечить легкий доступ к ним, эффективное управление и обновление
26. Метод, используемый для предотвращения дублирования данных в реляционных базах данных, – …
27. Название на английском языке системы или репозитория данных, хранящихся в необработанном формате, – …
28. Сокращенное английское название семейства нереляционных баз данных – …
29. Установите соответствие этапов MapReduce и их содержания:
30. Установите правильный порядок действий при проектировании баз данных (БД):
31. Установите соответствие баз данных и их характеристик:
32. Краудсорсинг – это …
33. Консолидация – это …
34. Интеграция – это …
35. Машинное обучение – это …
36. Фамилия британского ученого, который разработал эмпирический тест, призванный определить способность компьютера мыслить как человек, – …
37. Простейший вид нейронной сети, который представляет собой алгоритм для выполнения двоичной классификации, – это …
38. Вычислительная единица в искусственных нейронных сетях, которая получает информацию, производит над ней простые вычисления и передает ее дальше, – это …
39. Вектор частных производных функции потерь по весам нейронной сети, который указывает на направление наибольшего роста этой функции, – это …
40. Установите соответствие видов искусственных нейронных сетей и их характеристик:
41. Определите правильную последовательность этапов распределенных вычислений MapReduce:
42. Установите соответствие функций, применяемых для расчета ошибок выходного сигнала нейронной сети, и формул для их вычисления:
43. Укажите правильную последовательность шагов алгоритма машинного обучения (ML):
44. Web Mining применяет технологию Data Mining для анализа … (укажите 4 варианта ответа)
45. … является шириной коробки в диаграмме «ящик с усами»
46. Data Mining – это процесс обнаружения в сырых данных … (укажите 3 варианта ответа)
47. Деревья классификации относятся к стратегии …
48. Метод Data Mining, который относит объекты к одному из заранее известных классов, – это …
49. Группа элементов, обладающих каким-то общим свойством и находящихся на небольшом расстоянии другу от друга, – это …
50. В числовом ряду 3, 5, 8, 12, 2, 9, 6, 10, 11, 14 медиана (с точностью до 0,1) равна …
51. Если все значения признака увеличить в 16 раз, дисперсия увеличится в … раз
52. Расположите в правильной последовательности этапы дивизимного метода кластерного анализа:
53. Установите соответствие между описательными статистиками и их определением:
54. Расположите в правильной последовательности этапы кластерного анализа методом k-средних:
55. Установите соответствие между метриками расстояния между объектами и формулами расчета:
56. Чтобы получить помощь в программной среде R, можно … (укажите 3 варианта ответа)
57. В языке программирования R используются такие типы данных, как … (укажите 5 вариантов ответа)
58. Циклический алгоритм используется при вычислении … (укажите 2 варианта ответа)
59. Разветвляющийся алгоритм – это …
60. Нажатие клавиши «…» предложит возможные варианты продолжения текста кода, включая выбор параметров и переменных в аргументах набираемых команд
61. Нажатием сочетания клавиш «…» и «–» можно написать оператор присваивания «
62. В языке программирования R тип данных «строка» – это …
63. Язык программирования R является потомком языка …
64. Укажите правильную последовательность этапов анализа данных в языке программирования R:
65. Установите соответствие между пакетами языка программирования R и их назначением:
66. Установите соответствие между аргументами функции leaflet() и их содержанием:
67. Функция … реализует алгоритм классификации в языке программирования R
68. Функция … реализует алгоритм кластеризации в языке программирования R
69. Библиотека … является базовой для Data Science на языке программирования Python
70. В языке программирования R ошибочными являются такие варианты присвоения, как … (укажите 2 варианта ответа)
71. Язык программирования, который объединяет объектно-ориентированный и функциональный подходы и используется в Apache Spark, – это язык …
72. Способность языка программирования распознавать типы переменных – это …
73. Язык программирования … имеет лицензию от компании MathWorks и широко используется для вычислений как в научных, так и в промышленных целях
74. Укажите правильную последовательность этапов анализа данных в языке программирования R:
75. Вам необходимо выполнить интерактивную визуализацию данных.
Какой из языков программирования содержит больше библиотек и фреймворков для интерактивной визуализации и лучше подойдет для выполнения этой задачи?
76. Если расстоянием между кластерами называется минимальное из расстояний между парами объектов, один из которых входит в первый кластер, а другой – во второй, то это расстояние …
77. Процедура снижения признакового пространства …
78. Возможность снижения размерности признакового пространства обусловлена … (укажите 3 варианта ответа)
79. Элементы матрицы факторных нагрузок меняются в пределах …
80. Если в результате расчетов получены значения двух первых главных компонент λ1=1,928 и λ2=0,072, тогда относительный вклад первой главной компоненты в суммарную дисперсию (с точностью до 0,1) равен … %
81. Если был проведен компонентный анализ по шести переменным и суммы квадратов факторных нагрузок для трех главных компонент равны 3,5, 1,3 и 0,3 соответственно, тогда относительный вклад первых двух компонент в общую дисперсию составляет … %
82. Если выборочные данные о потреблении и накоплении пяти домохозяйств представлены матрицей «объект — свойство» (см. ниже), то, считая, что различия в потреблении в 4 раза важнее различий в накоплении, а сумма весовых коэффициентов равна 1, взвешенное евклидово расстояние между домохозяйствами № 1 и № 2 с точностью до 0,01 будет равно …
83. Расстояние Манхэттен между векторами (-6, 3, -2) и (-1, 3, -3) равно …
84. Вашей компании необходимо проанализировать продуктовые наборы для их своевременной закупки и совместного размещения в торговом зале.
Какой метод Data Mining вы будете использовать?
85. Неверно, что существует такой вид искусственных нейронных сетей, как …
86. Такой вид машинного обучения, как …, основывается на взаимодействии обучаемой системы со средой
87. В изучении нейронных сетей и машинного обучения часто упоминают закон Мура, согласно которому …
88. Градиентом в искусственных нейронных сетях называют …
89. Минимальное количество слоев, которые должна иметь нейронная сеть, для того чтобы к ней возможно было применить алгоритм обратного распространения, – …
90. Процесс привлечения к решению задач в инновационной сфере широкого круга лиц по типу субподрядной работы на добровольных началах с применением информационно-коммуникационных технологий — это …
91. Область исследования, включающая создание компьютерных алгоритмов для преобразования данных в обоснованные действия, – это … обучение
92. Установите соответствие функций, применяемых для расчета ошибок выходного сигнала нейронной сети, и формул для их вычисления:
93. Вам необходимо принять решение о выдаче кредита клиенту.
Какой метод машинного обучения вам в этом поможет?
94. Реляционные базы данных организованы в виде …
95. Hadoop – это проект …
96. В числе систем управления базами данных (СУБД), которые полностью полагаются на оперативную память при хранении информации, – … (укажите 2 варианта ответа)
97. Английское название фреймворка для вычисления наборов распределенных задач с использованием большого количества компьютеров, образующих кластер, – …
98. Сокращенное английское название языка структурированных запросов – …
99. Метод исследования, характеризующийся выделением и изучением отдельных частей объектов исследования, – … (слово происходит от греч. «разложение»)
100. Установите правильный порядок действий при проектировании баз данных:
101. Рассматривается несколько технологий систем управления базами данных (СУБД). Это технологии Hadoop, Cassandra, HDInsight и Redis.
Какая из данных технологий не использует принцип MapReduce?
102. Variety в контексте характеристик Big Data означает …
103. Неверно, что Big Data – это …
104. Отказоустойчивость Big Data имеет место, когда …
105. В числе примеров структурированных данных – … (укажите 2 варианта ответа)
106. Название технологии, которая имитирует человеческое поведение, – искусственный …
107. Компьютер, выделенный из группы персональных компьютеров (или рабочих станций) для выполнения какой-либо сервисной задачи без непосредственного участия человека, – это …
108. Совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки, – это …
109. Целое четырехзначное число, отражающее количество петабайт в зеттабайте, – …
110. Установите правильную последовательность этапов процесса MapReduсe подсчета цветов в текстовых файлах:
111. Аналитическим отделом компании был получен спам по e-mail с приложенным файлом:
Что следует предпринять?

Тесты Синергия ответы МТИ. Практика отчет. ВКР. Контрольные