Home » Shop » Ответы новые - Синергия тесты » Тесты ответы Синергия МТИ » Введение в анализ больших данных ответы Синергия>Все тесты Итоговая аттестация

Введение в анализ больших данных ответы Синергия>Все тесты Итоговая аттестация

280

Введение в анализ больших данных ответы Синергия>Все тесты 100 баллов. Темы 1-5

Описание

Введение в анализ больших данных ответы Синергия>Все тесты 100 баллов Экзамен Темы 1-5
Тема 1. Понятие «большие данные» (Big Data) и их применение в анализе бизнес-процессов
Тема 2. Подходы к формированию больших данных (Big Data) и технологии их обработки
Тема 3. Методы и алгоритмы анализа больших данных (Big Data)
Тема 4. Алгоритмы Data Mining в анализе больших данных (Big Data)
Тема 5. Программные комплексы анализа больших данных (Big Data)
Заключение
Итоговая аттестация
Итоговый тест
Компетентностный тест
Вопрос
… – это процесс преобразования данных в выводы, на основе которых будут приниматься решения и строиться действия с помощью людей, процессов и технологий
… является шириной коробки в диаграмме «ящик с усами»
Hadoop – это проект …
SQL – это …
Velocity в контексте характеристик Big Data означает …
Web Mining применяет технологию Data Mining для анализа … (укажите 4 варианта ответа)
Алгоритм — это:
Аналитическим отделом компании был получен спам по e-mail с приложенным файлом:
Что следует предпринять?
Английское название фреймворка для вычисления наборов распределенных задач с использованием большого количества компьютеров, образующих кластер, – …
Библиотека … является базовой для Data Science на языке программирования Python
В вашей компании необходимо организовать сбор, хранение и обработку больших данных. На что в первую очередь должно обратить внимание руководство при организации хранения и обработки данных?
В каких из приведенных ниже случаев речь идет структурированных данных:
В реляционной модели представленные данные для пользователя передаются в виде …
В числе примеров структурированных данных – … (укажите 2 варианта ответа)
В числовом ряду 3, 5, 8, 12, 2, 9, 6, 10, 11, 14 медиана (с точностью до 0,1) равна …
В языке программирования R ошибочными являются такие варианты присвоения, как … (укажите 2 варианта ответа)
Вам необходимо импортировать в программную среду RStudio текстовый файл с разделителем. Какую функцию вы будете использовать?
Вам необходимо организовать потоковую обработку событий в режиме реального времени. Какую технологию необходимо использовать?
Вам необходимо предсказать значения непрерывной числовой величины для входных данных. Какой метод вам в этом поможет?
Вам необходимо принять решение о выдаче кредита клиенту.
Какой метод машинного обучения вам в этом поможет?
Вам нужно рассчитать необходимые параметры для создания обшивки самолета. Какая из областей машинного обучения вам в этом поможет?
Ваша компания использует различные технологии для сбора и хранения данных. Приведите пример данных, когда эффективнее использовать технологию Hadoop.
Вашей компании необходимо закупить новый вид сырья. Вам необходимо узнать, насколько может упасть стоимость этого сырья в ближайшем будущем и когда это может произойти. Какой метод Data Mining вы будете использовать?
Вашей компании необходимо определить структуру клиентов по их вкладу в доходы компании. Какой метод Data Mining вы будете использовать?
Выполнены следующие строки кода в программной среде RStudio:
vec <- c(3,5,2,1,8,4,9,10,3,15,1,11)
vec[2]
Вычислительная единица в искусственных нейронных сетях, которая получает информацию, производит над ней простые вычисления и передает ее дальше, – это …
Горизонтальная масштабируемость при обработке Big Data – это:
Данные являются структурированными в … (укажите 2 варианта ответа)
Деревья классификации относятся к стратегии …
Если расстоянием между кластерами называется минимальное из расстояний между парами объектов, один из которых входит в первый кластер, а другой – во второй, то это расстояние …
Заказчик бизнес-процесса – это должностное лицо:
Интеграция – это …
К основным характеристикам Big Data относятся:
Как в R обозначаются пропущенные значения?
Как можно получить помощь в R:
Как назвается в R тип данных «строки»?
Как назвается в R тип данных «целые числа»?
Как назвается в R тип данных «числа с плавающей точкой»?
Какая функция dplyr служит для вертикального объединения таблиц?
Какие типы данных используются в R:
Какие циклы доступны в базовом синтаксисе языка R?
Каким образом можно объявить переменную «а» на языке R:
Компьютер, выделенный из группы персональных компьютеров (или рабочих станций) для выполнения какой-либо сервисной задачи без непосредственного участия человека, – это …
Краудсорсинг – это …
Локальность данных Big Data – это:
Медианой для выборки 1,__,3,7,10,15,16,18 является:
Метод Data Mining, который относит объекты к одному из заранее известных классов, – это …
Метод исследования, характеризующийся выделением и изучением отдельных частей объектов исследования, – … (слово происходит от греч. «разложение»)
Минимальная единица измерения информации – это …
На каком из этапов жизненного цикла данных по методологии CRISP-DM происходит проверка гипотез?
Нажатием сочетания клавиш «…» и «–» можно написать оператор присваивания “<-“
Название на английском языке системы или репозитория данных, хранящихся в необработанном формате, – …
Назовите сложности иерархических методов кластеризации:
Неверно, что Классификация относится к:
Неверно, что существует такой вид искусственных нейронных сетей, как …
Объём накопленных человечеством цифровых данных на 2022 год измеряется:
Отказоустойчивость Big Data – это, когда:
Процедура снижения признакового пространства …
Процесс преобразования данных в код, который можно распознать только с помощью определенного ключа или пароля, – это …
Процесс привлечения к решению задач в инновационной сфере широкого круга лиц по типу субподрядной работы на добровольных началах с применением информационно-коммуникационных технологий – это …
Процессы маркетинга относят к группе:
Процессы подбора персонала относят к группе:
Разветвляющийся алгоритм – это …
Разным группам пользователей с различным уровнем доступа требуется доступ к одной и той же информации. Что следует предпринять руководству?
Расположите в правильной последовательности этапы дивизимного метода кластерного анализа:
Расположите в правильной последовательности этапы кластерного анализа методом k-средних:
Расположите в правильной последовательности этапы кластерного анализа методом k-средних:
1) выбирается k произвольных исходных центров кластеров – обычно выбираются k объектов
2) все объекты разбиваются на k групп, наиболее близких к одному из центров
3) вычисляются новые центры кластеров
4) проводится новое разбиение всех объектов на основании близости к новым центрам
Реляционные базы данных организованы в виде …
Решение задачи прогнозирования …
Сколько в 1 зеттабайте тарабайт?
Совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки, – это …
Сокращенное английское название семейства нереляционных баз данных – …
Сокращенное английское название языка структурированных запросов – …
Такой вид машинного обучения, как …, основывается на взаимодействии обучаемой системы со средой
Технология Web mining применяет технологию Data Mining для анализа:
Укажите правильную последовательность шагов алгоритма машинного обучения (ML):
1) сбор данных
2) исследование и подготовка данных
3) обучение модели
4) оценка модели
5) улучшение модели
Укажите правильную последовательность шагов алгоритма машинного обучения (ML):
1) сбор данных
2) исследование и подготовка данных
3) обучение модели
4) оценка модели
5) улучшение модели
Укажите правильную последовательность этапов анализа данных в языке программирования R:
1) сбор данных
2) импорт данных из источника в программную среду R
3) разведочный анализ
4) очистка и трансформация данных
5) моделирование
6) презентация результатов
Установите правильную последовательность этапов процесса MapReduсe подсчета цветов в текстовых файлах:
1) чтение входных файлов
2) каждая строка передается заданию
3) ключ отображается на значение
4) ключи сортируются, чтобы упростить обобщение данных
5) фаза свертки суммирует количество вхождений каждого цвета и выводит для каждого ключа один файл с общим количеством вхождений этого цвета
6) ключи собираются в выходной файл
Установите соответствие баз данных и их характеристик:
MongoDB – хранилище документов
Reddis – хранилище «ключ – значение»
Neo4J – графовая база данных
Cassandra – столбцовая база данных
Установите соответствие между алгоритмами объединения двух кластеров и их характеристиками:
Установите соответствие между аргументами функции leaflet() и их содержанием:
Установите соответствие между метриками расстояния между объектами и формулами расчета:
Установите соответствие между наиболее распространенными подходами обработки данных и их характеристиками:
Установите соответствие между описательными статистиками и их определением:
Установите соответствие между пакетами языка программирования R и их назначением:
Установите соответствие между понятием и его содержанием:
Установите соответствие между способами обучения нейронной сети и их характеристиками:
Установите соответствие функций, применяемых для расчета ошибок выходного сигнала нейронной сети, и формул для их вычисления:
Установите соответствие функций, применяемых для расчета ошибок выходного сигнала нейронной сети, и формул для их вычисления:
Установите соответствие целей инфраструктуры Hadoop и их характеристик:
Установите соответствие этапов MapReduce и их содержания:
Фамилия британского ученого, который разработал эмпирический тест, призванный определить способность компьютера мыслить как человек, – …
Циклический алгоритм используется при вычислении … (укажите 2 варианта ответа)
Что такое Business Intelligence (Bl):
Чтобы получить помощь в программной среде R, можно … (укажите 3 варианта ответа)
Элементы матрицы факторных нагрузок меняются в пределах …
Язык программирования … имеет лицензию от компании MathWorks и широко используется для вычислений как в научных, так и в промышленных целях
Язык программирования R является потомком языка …
Язык программирования, который объединяет объектно-ориентированный и функциональный подходы и используется в Apache Spark, – это язык …