48-ші ғылыми-әдiстемелiк конференциясының материалдары



Pdf көрінісі
бет60/295
Дата07.02.2022
өлшемі5,84 Mb.
#92969
1   ...   56   57   58   59   60   61   62   63   ...   295
Байланысты:
3-книга

Список литературы: 
1.
Обидина Л.Б. Юридическое образование в Баварии // Государство и право. – 1997, № 7. – С. 66-70.
2.
Бойцова В.В., Бойцова Л.В. Юридическое образование в Нидерландах // Государство и право. – 1997, № 4. – С. 
103-107.
3.
Бойцова В.В., Бойцова Л.В. Европейский образовательный процесс и Россия // Общественные науки и 
современность. – 2000, № 6. 
Байшоланова К.С., Сапакова С.З. 
РОЛЬ ДИСЦИПЛИНЫ «БОЛЬШИЕ ДАННЫЕ И ВИЗУАЛЬНАЯ АНАЛИТИКА»
ПРИ ФОРМИРОВАНИИ ПРАКТИКО-ОРИЕНТИРОВАННЫХ КОМПЕТЕНЦИЙ 
БУДУЩИХ ИНЖЕНЕРОВ 
 
Аннотация.
В работе рассматриваются основные компетенции в результате изучения 
дисциплины «Большие данные и визуальная аналитика», а также актуальность направления Big Data 
в сфере информационных технологий.
 
Ключевые слова: Big Data, визуализация, социальные сети, парадигма Map Reduce, Hadoop, Weka, 
RapidMiner, Excel PowerPivot, методы интеллектуального и статистического анализа данных. 
Современный динамично развивающийся мир ставит все новые и новые требования не только перед 
обществом, но и перед системой образования, в частности подготовки специалистов для IT сферы. 
Важнейший критерий оценки профессионального образования его востребованность на рынке труда, 
поэтому в данное время основной упор современного Казахстанского образования направлен на 
формировании практико-ориентированных компетенций выпускников. С точки зрения работодателя, 
выпускник должен обладать достаточными теоретическими и практическими навыками, чтобы 
обеспечить высокую производительность труда. Поэтому мы решили выделить основные компетенции 
будущих инженеров на примере изучения дисциплины «Большие данные и визуальная аналитика». 
Данный курс читается на 1 курсе докторантуры по специальности «Информационные системы». 
Целью преподавания этой дисциплины является теоретическая и практическая подготовка 
докторантов к работе с Big Data.
Большие данные (Big Data) – это не просто хранение и извлечение данных, оно нечто большее, 
которое включает в себя такие технологий, как Hadoop, MapReduce, Apache, Pig, Hive, Flume, Sqoop, 
Zookeeper и т. д. Опытные аналитики больших данных всегда востребованы на рынке 
информационных технологии. В современном обществе данные собираются и хранятся со скоростью 
быстрее, чем когда-либо, поэтому актуальность подготовки квалифицированных специалистов в этом 
направлении очевидна. Мы знакомы с выражением: «одна картина стоит тысячи слов». Это особенно 
важно при попытке объяснить понимание, полученное при анализе больших наборов данных. 
Визуализация данных играет важную роль в представлении, как малых, так и масштабных данных. 
Одним из ключевых навыков, которое получать слушатели курса является способность 
визуализировать данные и результаты в понятной для обычных пользователей форме. Изучение того, 


69
как использовать программные инструменты для визуализации данных, позволяют слушателям 
извлекать информацию, лучше понимать данные и принимать более эффективные решения.
Для визуализации данных разработаны множество программ, в этом курсе мы ознакомим и научим 
студентов работе с платформами SAS, Microsoft Azure, Hadoop.
Визуализация данных – это представление данных в некоторой систематической форме, включая 
атрибуты и переменные для единицы информации. Методы обнаружения данных на основе 
визуализации позволяют бизнес-представителям найти связки от источников данных для создания 
пользовательских аналитических представлений. 
Расширенная
аналитика может быть интегрирована 
в методы поддержки создания интерактивной и анимированной графики, что позволяет легко 
воспринимать большие отчеты и статистические таблицы [1]. 
Big Data представляют собой массивы данных с большим объемом, высокой скоростью и 
многообразием, для которых требуются новые формы и технологии обработки, которые оптимизируют 
процесс поиска информации и принятия решений. Как мы уже говорили, проблемы больших данных 
лежат в сборе, хранении, анализе, доступности, поиске и визуализации данных [2].
Особенности визуализации данных:
• не все данные нуждаются в методах визуализации для раскрытия его структуры и сущности; 
• визуализация больших данных не может заменить критическое мышление; 
• визуализация данных не всегда показывает точную картину того, что важно для пользователя.
Визуализацию можно манипулировать различными эффектами. Подходы к визуализации 
используются для создания таблиц, диаграмм, изображений и других интуитивно понятных способов 
отображения данных. Визуализация больших данных не так проста, как традиционные небольшие 
наборы данных. При крупномасштабной визуализации данных многие исследователи используют 
извлечение признаков и геометрическое моделирование, чтобы значительно уменьшить размер данных 
до фактического рендеринга данных. Выбор правильного представления данных также очень важен 
при визуализации больших данных [2]. 
Изучение дисциплины «Большие данные и визуальная аналитика» является актуальным 
направлением на рынке информационных технологии. Как известно, с появлением социальных сетей, 
у каждого пользователя в сети стало накапливаться очень много личной информации, что и привело к 
появлению направления Big Data. Обычно данная сфера имеет несколько основных характеристик, при 
наличии которых мы можем отнести рассматриваемые данные к числу больших: 
- объем; 
- скорость; 
- многообразие;
- достоверность данных; 
- ценность собранной информации. 
В следующей диаграмме приведен прогноз числа пользователей социальных сетей до 2021 года, мы 
видим число использующих социальные сети только растет.
Как показывает рисунок 1, будущий специалист по информационным технологиям должен владеть 
современными технологиями и методами обработки данных большого объема, например, для 
проведения маркетинговых исследований и для правильного определения предпочтении клиентов в 
системах массового обслуживания.


70
Рисунок 1 – Прогноз числа пользователей социальных сетей [3] 
Курс «Большие данные и визуальная аналитика» формирует у будущих инженеров технической 
специальности профессиональной компетенции в области разработки и использования систем 
обработки, а также анализа Big Data. Изучение данной дисциплины готовит выпускника к решению 
следующих практически важных задач:

Ставить задачи анализа данных.

Предварительную обработку данных.

Применять современные технологии визуализации данных.

Разработка, реализация и применение методов интеллектуального анализа данных к 
большим массивам данных.

Представление результатов работы. 
Исходя из вышеуказанных задач, мы предлагаем компетенции обучающегося, формируемые в 
результате освоения дисциплины (перечень планируемых результатов обучения):

понимать важность феномена больших данных для развития общества и науки. Знать 
причины возникновения тренда больших данных, также проблемы и возможности, связанные с 
появлением больших данных. Понимать важность применения научных методов и технологии для 
извлечения основной информации из больших массивов данных; 

понимать возможности и перспективы технологий анализа и визуальной аналитики Big Data 
при подготовке научных работ. Уметь применять научные методы, методы интеллектуального анализа 
данных, аппарат теории принятия решений к большим данным; 

уметь формулировать алгоритмы в MapReduce. Владеть методами интеллектуального и 
статистического анализа данных, в т.ч. методами оценки качества моделей, алгоритмов, методами 
экспериментальной проверки гипотез, методами обоснования гипотез; 

уметь: интегрировать данные из разных источников, интерпретировать их в контексте 
поставленной задачи, делать выводы, основанные на анализе полученных данных. Владеть: методами 
получения данных из различных доступных источников; 

знать: существующие в современном мире источники и типы информации. Уметь: 
визуализировать имеющиеся данные, отбрасывать несущественную информацию, структурировать 
информацию в рамках поставленной задачи; 

владеть: современными средствами визуализации, методами предварительной подготовки 
данных; 

знать: тенденции больших данных, формулировать бизнес-задачи в терминах анализа данных; 

знать: основные элементы процесса анализа больших данных, основные подходы к обработке 
больших массивов данных. 
Инструменты и технологии необходимые для работы большими данными, чтобы у обучающихся 
были выше указанные компетенции после завершения курса, находиться в онлайн доступе и вполне 
можно пройти бесплатную регистрацию. Например, студенты самостоятельно устанавливают Hadoop 


71
(открытая лицензия). Доступ к программно-аппаратному комплексу SAP HANA (или Oracle Exalytics), 
например, через облако Amazon. Также для обучения каждому студенту необходимы: персональный 
компьютер, с установленным следующим ПО: Weka, RapidMiner, Excel PowerPivot. 
Вузовская подготовка студентов должна обеспечивать приобретение ими не только знаний, но и 
умений использовать полученные знания на практике. Только целенаправленная совместная работа 
студента с преподавателем на получение знаний поможет достигать вышеуказанных компетенции 
после завершения курса.


Достарыңызбен бөлісу:
1   ...   56   57   58   59   60   61   62   63   ...   295




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет