Home » Ответы Синергия тесты МТИ МосАП практика » Продвинутые технологии работы с большими данными тест ответы МТИ СинергияПродвинутые технологии работы с большими данными тест ответы МТИ СинергияСкачать тест: Продвинутые технологии работы с большими данными.фит_МАГ тест ответы МТИ Синергия.pdf1. Что в инженерном смысле чаще всего подразумевают под «большими данными»?2. Какой слой хранения нужен, чтобы сохранять исходные факты максимально близко к источнику?3. Что точнее всего описывает витрину данных?4. Подход «схема при чтении» означает, что…5. Какое хранилище чаще всего является фундаментом «озера данных»?6. Почему колоночное хранение эффективно для аналитики?7. Самый универсальный способ партиционирования для аналитики чаще всего…8. Зачем нужен каталог данных и метаданные?9. Что в больших данных чаще означает «истина»?10. Чем отличаются событие и состояние?11. Почему важно хранить историю изменений справочников?12. Какая типичная ошибка в платформе данных ведёт к расхождениям метрик?13. Что означает идемпотентность в конвейерах данных?14. Как часто обеспечивают идемпотентность пакетных витрин?15. Конвейер данных в больших данных чаще всего — это…16. Инкрементальная обработка означает, что…17. Зачем используют окно пересчёта?18. Атомарная публикация означает, что…19. Какой класс проверок отвечает на вопрос «данные пришли и покрывают период»?20. Что чаще относится к «мягким» проверкам качества?21. Почему соединения (джоины) часто дороги в распределённых вычислениях?22. Что такое data skew (дэйта скью)?23. Какой принцип оптимизации базовый?24. Почему важно различать время события и время поступления в потоках?25. Какой режим гарантии означает «событие может быть обработано повторно, но не должно теряться»?26. Что помогает бороться с повторами в потоках?27. Зачем нужен карантин «плохих» событий?28. DataOps (ДэйтаОпс) — это…29. Что является регрессионным тестом витрины?30. Что такое «гарантия доставки» в потоках в практическом смысле?31. Что такое признак в машинном обучении?32. Проблема «обучение–применение» возникает, когда…33. Что такое утечка целевой переменной?34. Почему важно временное разбиение train/test во временных задачах?35. MLOps (ЭмЭлОпс) — это…36. Зачем нужен реестр моделей37. Что является «быстрым» мониторингом, когда метки приходят поздно?38. Дрейф данных — это…39. Дрейф концепта — это…40. Пример «безопасного режима» при деградации модели:41. Почему принцип минимизации данных важен?42. Псевдонимизация отличается от обезличивания тем, что…43. Самый безопасный способ выпуска новой модели обычно…44. Зачем сравнивать модель с базовой линией?45. Почему улучшение метрики модели не гарантирует улучшение бизнеса?46. Витрина признаков для обучения в корректной постановке — это…47. Что вернее про качество признаков?48. Объяснимость модели важна, потому что…49. Что относится к экономике модели?50. Что помогает снизить риск смещения модели по сегментам?