… – это процесс преобразования данных в выводы, на основе которых будут приниматься решения и строиться действия с помощью людей, процессов и технологий |
… является шириной коробки в диаграмме «ящик с усами» |
Hadoop – это проект … |
SQL – это … |
Velocity в контексте характеристик Big Data означает … |
Web Mining применяет технологию Data Mining для анализа … (укажите 4 варианта ответа) |
Алгоритм — это: |
Аналитическим отделом компании был получен спам по e-mail с приложенным файлом: Что следует предпринять? |
Английское название фреймворка для вычисления наборов распределенных задач с использованием большого количества компьютеров, образующих кластер, – … |
Библиотека … является базовой для Data Science на языке программирования Python |
В вашей компании необходимо организовать сбор, хранение и обработку больших данных. На что в первую очередь должно обратить внимание руководство при организации хранения и обработки данных? |
В каких из приведенных ниже случаев речь идет структурированных данных: |
В реляционной модели представленные данные для пользователя передаются в виде … |
В числе примеров структурированных данных – … (укажите 2 варианта ответа) |
В числовом ряду 3, 5, 8, 12, 2, 9, 6, 10, 11, 14 медиана (с точностью до 0,1) равна … |
В языке программирования R ошибочными являются такие варианты присвоения, как … (укажите 2 варианта ответа) |
Вам необходимо импортировать в программную среду RStudio текстовый файл с разделителем. Какую функцию вы будете использовать? |
Вам необходимо организовать потоковую обработку событий в режиме реального времени. Какую технологию необходимо использовать? |
Вам необходимо предсказать значения непрерывной числовой величины для входных данных. Какой метод вам в этом поможет? |
Вам необходимо принять решение о выдаче кредита клиенту.Какой метод машинного обучения вам в этом поможет? |
Вам нужно рассчитать необходимые параметры для создания обшивки самолета. Какая из областей машинного обучения вам в этом поможет? |
Ваша компания использует различные технологии для сбора и хранения данных. Приведите пример данных, когда эффективнее использовать технологию Hadoop. |
Вашей компании необходимо закупить новый вид сырья. Вам необходимо узнать, насколько может упасть стоимость этого сырья в ближайшем будущем и когда это может произойти. Какой метод Data Mining вы будете использовать? |
Вашей компании необходимо определить структуру клиентов по их вкладу в доходы компании. Какой метод Data Mining вы будете использовать? |
Выполнены следующие строки кода в программной среде RStudio:vec <- c(3,5,2,1,8,4,9,10,3,15,1,11)vec[2] |
Вычислительная единица в искусственных нейронных сетях, которая получает информацию, производит над ней простые вычисления и передает ее дальше, – это … |
Горизонтальная масштабируемость при обработке Big Data – это: |
Данные являются структурированными в … (укажите 2 варианта ответа) |
Деревья классификации относятся к стратегии … |
Если расстоянием между кластерами называется минимальное из расстояний между парами объектов, один из которых входит в первый кластер, а другой – во второй, то это расстояние … |
Заказчик бизнес-процесса – это должностное лицо: |
Интеграция – это … |
К основным характеристикам Big Data относятся: |
Как в R обозначаются пропущенные значения? |
Как можно получить помощь в R: |
Как назвается в R тип данных «строки»? |
Как назвается в R тип данных «целые числа»? |
Как назвается в R тип данных «числа с плавающей точкой»? |
Какая функция dplyr служит для вертикального объединения таблиц? |
Какие типы данных используются в R: |
Какие циклы доступны в базовом синтаксисе языка R? |
Каким образом можно объявить переменную «а» на языке R: |
Компьютер, выделенный из группы персональных компьютеров (или рабочих станций) для выполнения какой-либо сервисной задачи без непосредственного участия человека, – это … |
Краудсорсинг – это … |
Локальность данных Big Data – это: |
Медианой для выборки 1,__,3,7,10,15,16,18 является: |
Метод Data Mining, который относит объекты к одному из заранее известных классов, – это … |
Метод исследования, характеризующийся выделением и изучением отдельных частей объектов исследования, – … (слово происходит от греч. «разложение») |
Минимальная единица измерения информации – это … |
На каком из этапов жизненного цикла данных по методологии CRISP-DM происходит проверка гипотез? |
Нажатием сочетания клавиш «…» и «–» можно написать оператор присваивания “<-“ |
Название на английском языке системы или репозитория данных, хранящихся в необработанном формате, – … |
Назовите сложности иерархических методов кластеризации: |
Неверно, что Классификация относится к: |
Неверно, что существует такой вид искусственных нейронных сетей, как … |
Объём накопленных человечеством цифровых данных на 2022 год измеряется: |
Отказоустойчивость Big Data – это, когда: |
Процедура снижения признакового пространства … |
Процесс преобразования данных в код, который можно распознать только с помощью определенного ключа или пароля, – это … |
Процесс привлечения к решению задач в инновационной сфере широкого круга лиц по типу субподрядной работы на добровольных началах с применением информационно-коммуникационных технологий – это … |
Процессы маркетинга относят к группе: |
Процессы подбора персонала относят к группе: |
Разветвляющийся алгоритм – это … |
Разным группам пользователей с различным уровнем доступа требуется доступ к одной и той же информации. Что следует предпринять руководству? |
Расположите в правильной последовательности этапы дивизимного метода кластерного анализа: |
Расположите в правильной последовательности этапы кластерного анализа методом k-средних: |
Расположите в правильной последовательности этапы кластерного анализа методом k-средних:1) выбирается k произвольных исходных центров кластеров – обычно выбираются k объектов2) все объекты разбиваются на k групп, наиболее близких к одному из центров3) вычисляются новые центры кластеров4) проводится новое разбиение всех объектов на основании близости к новым центрам |
Реляционные базы данных организованы в виде … |
Решение задачи прогнозирования … |
Сколько в 1 зеттабайте тарабайт? |
Совокупность сведений, зафиксированных на определенном носителе в форме, пригодной для постоянного хранения, передачи и обработки, – это … |
Сокращенное английское название семейства нереляционных баз данных – … |
Сокращенное английское название языка структурированных запросов – … |
Такой вид машинного обучения, как …, основывается на взаимодействии обучаемой системы со средой |
Технология Web mining применяет технологию Data Mining для анализа: |
Укажите правильную последовательность шагов алгоритма машинного обучения (ML):1) сбор данных2) исследование и подготовка данных3) обучение модели4) оценка модели5) улучшение модели |
Укажите правильную последовательность шагов алгоритма машинного обучения (ML):1) сбор данных2) исследование и подготовка данных3) обучение модели4) оценка модели5) улучшение модели |
Укажите правильную последовательность этапов анализа данных в языке программирования R:1) сбор данных2) импорт данных из источника в программную среду R3) разведочный анализ4) очистка и трансформация данных5) моделирование6) презентация результатов |
Установите правильную последовательность этапов процесса MapReduсe подсчета цветов в текстовых файлах:1) чтение входных файлов2) каждая строка передается заданию3) ключ отображается на значение4) ключи сортируются, чтобы упростить обобщение данных5) фаза свертки суммирует количество вхождений каждого цвета и выводит для каждого ключа один файл с общим количеством вхождений этого цвета6) ключи собираются в выходной файл |
Установите соответствие баз данных и их характеристик:MongoDB – хранилище документовReddis – хранилище «ключ – значение»Neo4J – графовая база данныхCassandra – столбцовая база данных |
Установите соответствие между алгоритмами объединения двух кластеров и их характеристиками: |
Установите соответствие между аргументами функции leaflet() и их содержанием: |
Установите соответствие между метриками расстояния между объектами и формулами расчета: |
Установите соответствие между наиболее распространенными подходами обработки данных и их характеристиками: |
Установите соответствие между описательными статистиками и их определением: |
Установите соответствие между пакетами языка программирования R и их назначением: |
Установите соответствие между понятием и его содержанием: |
Установите соответствие между способами обучения нейронной сети и их характеристиками: |
Установите соответствие функций, применяемых для расчета ошибок выходного сигнала нейронной сети, и формул для их вычисления: |
Установите соответствие функций, применяемых для расчета ошибок выходного сигнала нейронной сети, и формул для их вычисления: |
Установите соответствие целей инфраструктуры Hadoop и их характеристик: |
Установите соответствие этапов MapReduce и их содержания: |
Фамилия британского ученого, который разработал эмпирический тест, призванный определить способность компьютера мыслить как человек, – … |
Циклический алгоритм используется при вычислении … (укажите 2 варианта ответа) |
Что такое Business Intelligence (Bl): |
Чтобы получить помощь в программной среде R, можно … (укажите 3 варианта ответа) |
Элементы матрицы факторных нагрузок меняются в пределах … |
Язык программирования … имеет лицензию от компании MathWorks и широко используется для вычислений как в научных, так и в промышленных целях |
Язык программирования R является потомком языка … |
Язык программирования, который объединяет объектно-ориентированный и функциональный подходы и используется в Apache Spark, – это язык … |