Ученые расскажут о применении больших данных — студенческий портал

Молодые ученые Вышки расскажут о машинном обучении и больших данных

Ученые расскажут о применении больших данных - Студенческий портал В рамках проекта «Университет, открытый городу: лекции молодых ученых Вышки в Культурном центре ЗИЛ» НИУ ВШЭ организует цикл лекций по Data Culture. Первая из них состоится 29 ноября.

Вшэ запустила две новые специализации в области компьютерных наук на coursera

Ученые расскажут о применении больших данных - Студенческий портал Специализации Introduction to Discrete Mathematics for Computer Science и Advanced Machine Learning — англоязычные. Обе создавались при участии компании Яндекс, а специализация Introduction to Discrete Mathematics for Computer Science — также при участии Университета Калифорнии в Сан-Диего.

alt

Узнай стоимость своей работы

Бесплатная оценка заказа!

Оценим за полчаса!

Сотрудник лаборатории теоретической информатики принял участие в конференции «Aperiodicity and Hierarchical Structures in Tilings»

Гийем Гамар, научный сотрудник  международной лаборатории теоретической информатики, принял участие в научной конференции в г. Лион, Франция.

Умер Михаил Абрамович Ройтберг

16 августа 2017 года на 65 году жизни скоропостижно скончался профессор факультета компьютерных наук ВШЭ Михаил Абрамович Ройтберг.

Подведены итоги кампании 2017 года по академическим надбавкам

По итогам кампании академические надбавки 1 и 3 уровней получили сотрудники Департамента больших данных и информационного поиска.

Состоялся интенсив для преподавателей НИУ ВШЭ в рамках проекта Data Culture

Ученые расскажут о применении больших данных - Студенческий портал 14 и 15 июня в Московском офисе Яндекса состоялся интенсив для преподавателей и сотрудников НИУ ВШЭ, заинтересованных в тематике Data Science. Этот двухдневный цикл занятий проходил в рамках проекта Data Culture и был нацелен на подготовку преподавателей университета к участию в данном проекте.

«Алгоритм машинного обучения умеет находить закономерности в данных, которые не видит человек»

Ученые расскажут о применении больших данных - Студенческий портал В декабре 2016 года в Вышке были открыты пять новых международных лабораторий, в том числе Международная лаборатория глубинного обучения и байесовских методов. Предмет  ее исследований — комбинированные нейробайесовские модели, объединяющие достоинства двух наиболее успешных в настоящее время парадигм машинного обучения — нейросетевой и байесовской.

Состоялась встреча Дмитрия Ветрова и вице-президента компании SAMSUNG Ши-Хва Ли

Ученые расскажут о применении больших данных - Студенческий портал 25 апреля прошла встреча руководителя международной лаборатории глубинного обучения и байесовских методов Дмитрия Ветрова и вице-президента корпорации SAMSUNG Ши-Хва Ли. Участники встречи обсудили промежуточные результаты исследования, которое выполняет лаборатория по заказу компании, возможности стажировок и перспективы дальнейшего сотрудничества.

alt

Узнай стоимость своей работы

Бесплатная оценка заказа!
Читайте также:  Лучшие школы районов нагорный и нагатино-садовники - студенческий портал

Оценим за полчаса!

Команда под руководством сотрудников департамента прошла в финал международного конкурса студенческих проектов Imagine Cup 2017

Imagine Cup – ежегодный международный конкурс студенческих проектов, проводимый при поддержке Microsoft с 2003 г.. Конкурс проходит в два этапа: региональный тур и международный финал. Цель конкурса заключается в выявлении перспективных инновационных  проектов и приложений.

Две научные группы департамента получили финансирование от РНФ

Российский научный фонд объявил победителей конкурса на поддержку научных групп, занимающихся фундаментальными и поисковыми научными исследованиями.

Источник: https://cs.hse.ru/big-data/news/page2.html

Стратегическое использование и применение технологий big data в высшем образовании: потенциал big data для развития высшего образования в россии

По данным Федеральной службы государственной статистики в данный момент в Российских высших учебных заведениях (далее — ВУЗ) обучаются примерно 4, 3 млн., а преподавательский состав ВУЗов включает около 300 тыс. человек [1].

 Большие данные в высшем образовании растут, но большая их часть разбросана по рабочим столам, отделам и представлена ​​в различных форматах, что затрудняет их извлечение, они охватывают системы баз данных, которые хранят большие объёмы данных о студентах, преподавателях и т.п.

Во время взаимодействия студентов с различным технологиями, они оставляют следы данных, которые могут раскрыть их чувства, социальные связи, намерения и цели.

Благодаря этим данным можно решить множество проблем высшего образования в России.

Дополнительная ценность больших данных заключается в способности идентифицировать полезные данные и превращать их в полезные информации, выявляя закономерности и отклонения от закономерностей.

Имея большие объемы информации о студентах, в том числе о зачислениях, академических и дисциплинарных записях, ВУЗы располагают наборами данных, необходимыми для получения выгоды от целевой аналитики.

Большие данные и аналитика в высшем образовании могут быть преобразующими, изменяя существующие процессы администрирования, преподавания, обучения, внося вклад в результаты политики университетов и помогая решать современные проблемы, стоящие перед высшим образованием России [2].

Большие данные могут предоставить ВУЗам — инструменты прогнозирования, необходимые для улучшения результатов обучения отдельных студентов, а также способы обеспечения высокого качества академических программ.

Разрабатывая программы, которые собирают данные на каждом этапе процесса обучения студентов, университеты могут удовлетворять потребности студентов с помощью индивидуальных модулей, заданий и отзывов, которые будут способствовать лучшему и более богатому обучению [3].

Одним из способов использования инструментов больших данных в высшем образовании является анализ производительности и уровня навыков отдельных учащихся и создание персонализированного учебного плана, соответствующего их конкретным направлениям. При эффективном использовании большие данные могут помочь учебным заведениям улучшить учебный процесс и повысить успеваемость учащихся, снизить показатели отсева и увеличить количество выпускников (рисунок 1).

Ученые расскажут о применении больших данных - Студенческий портал

Рисунок 1. Ключевые возможности больших данных в высшем образовании

Основной вклад больших данных будет зависеть от применения трех моделей данных (описательной, прогнозной и предписывающей), а также полезности каждого из них для более эффективного принятия решений (рисунок 2).

Ученые расскажут о применении больших данных - Студенческий портал

Рисунок 2. Три большие аналитические модели данных в высшем образовании

Описательная аналитика

Описательная аналитика направлена ​​на описание и анализ исторических данных о абитуриентах [4], студентах, преподавании, исследованиях, политике и других административных процессах. Цель состоит в том, чтобы сообщать о текущих тенденциях, таких как зачисление и выпуск студентов, а также о получениях ученой степени.

С помощью описательной аналитики учебные заведения также могут исследовать данные в рамках систем управления обучением, изучая частоту входов в систему, просмотров страниц, контролируя завершенные курсы студентов, кто прошел какие курсы, какой контент посещают и т.д.

Прогнозная аналитика

Прогнозная аналитика может предоставить ВУЗам более эффективные решения благодаря аналитическим данным. Прогнозная аналитика направлена ​​на оценку вероятности будущих событий путем изучения тенденций и выявления ассоциаций по связанным вопросам, и выявления любых рисков или возможностей в будущем [5]. Прогнозная аналитика может выявить скрытые взаимосвязи данных.

С её помощью можно уделить больше внимания обучающимся, которые проявляют рискованное поведение в начале этого семестра, что может привести к тому, что они бросят учёбу или потерпят неудачу во время сессии. Это может помочь администрации университета оценить прогнозируемую степень завершения курса для конкретного направления.

Предписывающая аналитика

Предписывающая аналитика помогает высшим учебным заведениям оценивать свою текущую ситуацию и делать осознанный выбор альтернативного хода событий на основе достоверных и последовательных предсказаний.

Она объединяет аналитические результаты как описательных, так и прогнозных моделей, чтобы взглянуть на оценку и определить новые способы работы для достижения желаемых результатов.

Предписывающая аналитика позволяет лицам, принимающим решения, заглянуть в будущее и увидеть возможности (проблемы) решения разных задач, а также представляет наилучший план действий, чтобы своевременно воспользоваться этими предвидениями.

Таким образом, Big Data Analytics предоставляет высшим учебным заведениям возможность использовать существующие и собирать недостающие данные, чтобы помочь принимать более правильные решения с различными результатами.

В частности, Big Data помогает учреждениям достигать следующих показателей:

  • Лучшее понимание требований для эффективной подготовки данных для аналитики.
  • Последовательные способы эффективного использования анализа данных для повышения точности, углубления знаний и принятия решений в режиме реального времени.
  • Лучшее принятие решений на основе данных.
  • Основа для проверки гипотез, веб-экспериментов, моделирования сценариев, моделирования чувствительности и интеллектуального анализа данных.
  • Лучшие инструменты для сбора, обработки, анализа и интерпретации данных.
  • Расширенная аналитика данных и прогнозное моделирование.
  • Лучшее использование исторических данных для принятия обоснованных решений.
  • Лучшая способность использования данных для прогнозирования возможных результатов.

Заключение

Успешное внедрение больших данных в высшем учебном заведении будет зависеть от совместной успешной работы между различными департаментами в данном учебном заведении. Ценность Больших данных будет основываться на способности совместно создавать структуры управления и предоставлять более прогрессивные и лучшие стратегии.

  • Существует также проблема внедрения Big Data в ВУЗы, а именно: огромная стоимость, связанная со сбором, хранением и разработкой алгоритмов для добычи данных, процесс, который, как правило, занимает много времени и является сложным.  
  • Поскольку количество данных, доступных для использования, постоянно увеличивается, выгода будет заключаться в хорошем управлении обучением, надежном хранении и управлении данными, гибком и прозрачном извлечении данных, а также точной отчетности.
  • Список литературы:
  1. «Статистические материалы в сфере высшего образования» // Официальный сайт «Федеральной службы государственной статистики». URL: https://www.gks.ru/ (дата обращения: 24.08.2019).

Источник: https://sibac.info/journal/student/74/152931

Большие данные в системе образования — международный студенческий научный вестник (электронный научный журнал)

1 Гвозденко Ю.В. 1 Ищенко А.А. 1 Пилипенко А.В. 1
Несмотря на то, что термин большие данные — BigData введен недавно, он стремительно внедряется в современной образовательной системе. В статье рассмотрено внедрение больших данных в школьную практику как новой формы современных оценочных технологий.

Дан анализ современного состояния использования больших данных и результатов анализа внешней и внутренней информационной среды для оценки качества образования. На основе технологий больших данных можно улучшить и упростить принципы оценки качества образовательной среды.

Для обработки и хранения информации о качестве образовательной среды с использованием больших данных требуется большой объем дисковой памяти. При правильном подходе с помощью цифровых технологий больших данных может упроститься процесс отслеживания отметок обучающихся и выявления проблемных зон обучения.

Оперативно реагировать на любые изменения процесса обучения возможно, получая и анализируя данные на автоматизированном уровне, что позволяет достигнуть гибкости, масштабируемости, доступности, безопасности, конфиденциальности и простоты использования учебной информации.

Возможности BigData пока еще не используются в достаточной степени для совершенствования качества образовательной деятельности. Однако стремительное развитие цифровых технологий может сделать BigData эффективным инструментом в оценке качества образования.

информационное пространство
1. Big Data от А до Я.

Часть 1: Принципы работы с большими данными, парадигма MapReduce// Хабрахабр. URL: https://habrahabr.ru/company/dca/blog/267361/ (дата обращения: 9.05.2019).
2. Белая книга «Электронное обучение в России» / Под ред. Н.В. Тихомировой, М.: Минобрнауки, 2014. 137 с.
3. Liebowitz J. Thoughts on recent trends and future research perspectives in big data and analytics in higher education // Big data and learning analytics in higher education: Current theory and practice. – January, 2016. – Р. 7– 17.
4. Технологии Big Data вскоре изменят высшее образование. [Электронный ресурс].‒Режим доступа: https://mel.fm/novosti/7249138-bigdata (дата обращения: 25.05.19).
5. Шаталова, В. В. Технологии BigData – как фактор конкурентоспособности преподавателя ВУЗа в условиях современного ИТ-образования / В. В. Шаталова // BIG DATA and Advanced Analytics = BIG DATA и анализ высокого уровня: сборник материалов V Международной научно-практической конференции, Минск, 13–14 марта 2019 г. В 2 ч. Ч. 2 / Белорусский государственный университет информатики и радиоэлектроники; редкол. : В. А. Богуш [и др.]. – Минск, 2019. – С. 11 – 19.
6. Ефремова Н.Ф., Месхи Б.Ч. Системность и преемственность в формировании фонда оценочных средств технического вуза / Совет ректоров. 2011. № 5. С. 33-40.
7. Утёмов В. В., Горев П. М. Развитие образовательных систем на основе технологии Big Data // Научно-методический электронный журнал. «Концепт». – 2018. – № 6 (июнь). – С. 449–461. – URL: http://e-koncept.ru/2018/181039.htm.

Введение: В современном мире на первый план выходит способность оперировать большими данными, с каждым годом стремительно увеличивается объем информации и возможности цифровых технологий. Этому способствуют научный прогресс, виртуализация и автоматизация многих процессов, идет оцифровка данных, а поэтому возникает необходимость их обработки и учета, что влечет за собой взрывной рост вычислительных мощностей и скоростей передачи информации.

Читайте также:  Многие знания: стоит ли идти на курсы довузовской подготовки? - студенческий портал

Цель исследования: обоснование использования больших данных для объективной оценки качества образования.

Для достижения цели и проверки гипотезы поставлены следующие задачи исследования: проанализировать теоретические и практические аспекты получения и использования больших данных в образовании; рассмотреть комплекс психолого-педагогических условий управления качеством обучения на основе анализа больших данных (образовательной статистики); предложить технологию использования больших данных для анализа качества обучения в образовательной организации.

Материал и методы исследования: теоретические – анализ литературных источников и педагогического опыта в аспекте изучаемой проблемы.

Результаты исследования и их обсуждение: Идея «больших данных» (BigData) появилась уже достаточно давно, но активно развивается последние 2-3 года, основными факторами ее развития являются политические, экономические и социальные тенденции развития общества.

BigData позволяют не только анализировать образ потребителя и объем плановых затрат, спрос на те или иные туристические направления, но и моделировать будущее в финансах, бизнесе, образовании и др.

Они позволяют узнать состояния исследуемых объектов, например, что любят есть на обед те, кому нравится классическая музыка, или какую машину купит семья с двумя детьми и собакой [1].

Нахождение новых решений и методов актуально и для системы образования, особенно для повышения эффективности управления образовательными системами и обеспечения качества обучения. Для этого, с одной стороны, требуется использовать огромный объем накопленной информации, которую необходимо анализировать и систематизировать.

С другой – Big Data дает возможность по-новому выстроить каждому обучающемуся свою индивидуальную образовательную траекторию, а также оценить качество обучения в образовательной организации и выбрать для себя приемлемый способ обучения.

В связи с этим, рассмотрение возможностей использования больших данных для оценки и повышения качества образования является актуальным.

Используя в образовании большие данные, нужно подавать материал так, чтобы было интересно учиться, выявлять закономерности и использовать их.

Условно говоря, они могут показать, что школьники, живущие в Казани, готовы решать сложные задачи в солнечную погоду с утра, а дети из Нарьян-Мара такие же задачи лучше решат их в плохую погоду после обеда.

Если есть данные о местоположении обучающихся, погоде в регионе и проценте положительных решений, то несложно решить поставленную задачу. Такие неочевидные закономерности, носящие случайный, но объективный характер, могут составить основу новой научно-инженерной дисциплины, которую можно назвать «вычислительная педагогика» [2].

Существенная роль педагога сохранится еще долгое время, если не навсегда, и никакая информационная система не заменит Пифагора. Но для задач массового и корпоративного образования компьютерные системы могут быть очень эффективными, дополнительными средствами обучения. Как минимум они помогут экономить время на поиск информации.

Интеллектуальные системы, работающие на уровне лучшего педагога, в будущем будут доступны в любой образовательной организации. Тогда удастся преодолеть понятие образовательного неравенства, сократить барьеры обучения для людей с ограниченными возможностями. И хотя из двоечника нельзя сделать вундеркинда, но подтянуть его до среднего уровня станет возможно.

И все это благодаря персонифицированному подходу и умному компьютеру, который знает все о том, как усваивает материал обучающийся [3]. Они же позволят давать информацию о лучших методиках обучения и контроля знаний, умений и компетенций, приобретаемых в различных образовательных организациях или самостоятельно.

Методы объективного анализа данных, составляющие основу алгоритмов наших действий, позволяют вычислить закономерности, возникающие в процессе обучения. А это в свою очередь поможет оптимизировать процесс обучения и сделать его более увлекательным и для троечника, и для отличника.

Зависимостей, на самом деле, при использовании больших данных очень много, просто они еще не все открыты и используемы. Многое интересное еще впереди.

Александр Ларьяновский, бывший директор по международному развитию компании «Яндекс», а ныне директор по развитию крупнейшей в России онлайн-школы изучения английского языка Skyeng.ru, в которой обучающиеся активно используют технологии обработки больших данных в своей деятельности и добиваются с их помощью успехов.

Это привлекает больше желающих получить образование, увеличивает процент прохождения курсов, повышает скорость и эффективность усвоения знаний.

В ходе выступления на панельной дискусси о Big Data в образовании на EdCrunch–2015 представители этой компании вкратце рассказали о том, как большие данные изменили их подход к преподаванию иностранного языка.

Big Data помогают обработать опыт тысяч преподавателей и студентов, на основе анализа получить эффективную методику. Если традиционно преподавательская методика создаётся на основе персонального опыта одного или нескольких учителей, то на основе больших данных методика становится продуктом массового опыта [4].

Помимо повышения качества и эффективности создаваемых методик, большие данные помогают персонализировать контент под потребности каждого обучающегося. Кстати, а в чём роль педагога? Он умеет объяснять и получать обратную связь.

Компьютер не может отследить реакцию ученика, не обладает той магией, когда педагог по глазам обучающегося видит, прояснилось в их головах полученная информация или нет, понимают они ее или нет. Кроме того, педагог создаёт эмоциональный фон и мотивацию обучения.

Компьютер просто пишет «Молодец», а педагог заглядывает в глаза, верит, говорит, что сможешь, а потом радуется: «Ведь можешь же, когда захочешь!».

Большие данные, как и любая технология в образовании, не избавляют педагога от эмпатии и взаимодействия с обучающимся, способность человека сопереживать и мотивировать всегда важна, а компьютерам такая функция недоступна. Их преимущество в том, что они помогают сделать из преподавателя суперпреподавателя.

А как это происходит? К примеру, система может проанализировать сотни тысяч текстов в интернете и подобрать тот, который содержит нужное количество новых слов. Это то, на что не способен человек, но способна сделать машина.

С помощью больших данных можно делать, условно говоря, три важные вещи: создавать методики, адаптированные под большое количество студентов; персонализировать контент; подбирать режим обучения.

Отметим, что Big Data вскоре изменят технологии высшего образования, позволив сделать обучение студентов более индивидуальным: не только подбирать каждому свою программу курсов, но и давать отдельное домашнее задание, а также обеспечивать проверку усвоения содержания.

Другой станет и методика работы в группах: в Гарварде уже сейчас на одном из курсов в пары объединяют студентов с разными ответами на одно и то же задание, чтобы они могли прийти к единому решению, отстаивая свою точку зрения в процессе поиска правильного ответа.

Студенты будут получать более подробные рекомендации по различным темам и иметь расширенное информационное пространство. Предсказывать, насколько успешно пройден курс ещё до начала обучения программы умеют уже сейчас.

Студенты будут иметь возможность подобрать свою программу курсов, выполнить отдельное домашнее задание, получить более подробные рекомендации.

С помощью больших данных в университетских группах станет меньше отстающих, так как технологии позволят заранее выявлять студентов, которые могут оказаться в группе риска, а преподаватели смогут лучше помогать отстающим студентам, так как программа укажет, в каких именно областях знаний есть проблемы.

Система также будет помогать подросткам в выборе вуза: предполагается, что роботы будут сами подбирать наилучшие места обучения для будущих студентов, им даже не придётся подавать заявление. Система будет выбирать наилучшие места для будущих студентов, а к окончанию вуза у каждого студента будет цифровое портфолио, которое поможет молодым специалистам ориентироваться на рынке труда, проще ориентироваться при выборе карьеры, а работодателям в подборе специалистов [5, 6].

В сфере образования для анализа больших данных выделяются пять основных типов: персональные данные; данные о взаимодействии студентов с электронными системами обучения и друг с другом (электронными учебниками, онлайн-курсами, показатели отказов, скорости просмотра страниц, возвраты к страницам, количество связей, расстояние связей, количество просмотров страниц одним пользователем и т.д.); данные об эффективности учебных материалов (какой тип ученика с какой частью контента взаимодействует, результаты взаимодействия, образовательные результаты и т.д.); административные (общесистемные) данные (посещаемость, пропуски по болезни, количество проведенных уроков и т.д.); прогнозные (предполагаемые) данные (какова вероятность участия ученика в той или иной деятельности, какова вероятность выполнения задания и т.д.) (рис.).

Ученые расскажут о применении больших данных - Студенческий портал

Рис. Схема внешних и внутренних потоков данных ДГТУ.

Очевидно, что сегодня практически все образовательные организации работают в основном с малыми данными. Это связано с тем, что в образовательных организациях отсутствует специальная электронная среда, которая содержит много онлайн-контента и как следствие – большое число пользователей контентом и взаимодействий между собой относительно него.

Заключение: В заключение отметим, что возможности обобщать и использовать данные в электронной среде велики. Причинами этого является ряд факторов

Во-первых, анализ данных позволяет работать с индивидуальными программами обучающихся, персонализировать обучение.

Данные показывают, какой тип учащегося с какой частью контента взаимодействует, как происходит это взаимодействие, где он проявил интерес, а где ему было скучно, с кем и как он взаимодействовал в процессе обучения, как прохождение того или иного курса повлияло на образовательные результаты, на каком этапе обучения ему нужна помощь. Обучение становится адаптивным и личностно-ориентированным.

Во-вторых, образовательная аналитика на основе больших данных меняет представление о формате образовательных программ. Тексты, используемые в образовательном процессе, могут быть не только оцифрованы, но и переведены в числовые данные.

Пользователи продвигаются по материалу с большей свободой, затем осуществляется анализ, как пользователи взаимодействовали с материалом: что оказалось эффективным, что неэффективным. Результатом такой аналитики является изменение контента.

Поэтому образовательная программа превращается из формата утверждаемого текста в формат некоторой совокупности онлайн-контента, которая динамически изменяется через анализ данных, появляющихся в результате взаимодействия с онлайн-контентом обучающихся.

Появляются так называемые «умная программа», «умный учебный план». Можно предположить, что программы учебных курсов также претерпят изменения: они могут стать метапредметными.

В-третьих, изменение подходов к мониторингу и оценке, как самого образовательного процесса, так и образовательных результатов. Мониторинг становится постоянным.

Заинтересованность студентов в постоянном мониторинге связана с тем, что анализ данных позволяет сделать его учебный план индивидуальным, заинтересованность преподавателей связана с возможностью получения информации о продуктивных группах, обратной связи от учащихся к создаваемому контенту (интересно/не интересно, сложно/легко и т.д.), для преподавателей – эффективное распределение ресурсов. Оценка образовательных результатов может быть самостоятельной и/или коллективной, агрегированной на основе всех данных студента, полученных из всех взаимодействий. Оценка осуществляется для того, чтобы грамотно расширить образовательную программу обучающегося. Динамика образовательных результатов фиксируется постоянно, на основе этих данных формируются паттерны (повторяющиеся шаблоны), по которым можно судить о развитии учащегося.

В-четвертых, составной частью образовательной аналитики станут новые методы: а) прогноз, когда комбинация известных данных позволит прогнозировать искомое неизвестное; б) метод выявления структуры и кластеризация; в) сетевой анализ [7].

BigData открывает новые горизонты в современном образовании, с развитием этих технологии образование выходит на более высокий уровень, когда применение BigData позволяет выделять студентов, которые оказываются в ситуации отчисления или заслуживают особых заслуг.

Это позволяет отслеживать подобные ситуации и помогать им как в успешном продвижении по индивидуальной образовательной траектории, так и для исключения ситуации потери места в университете.

Анализ данных о качестве обучения может ориентировать участников выбрать образование и карьеру, наиболее соответствующие личным качествам и их заинтересованности в дальнейшей перспективе.

Библиографическая ссылка

Гвозденко Ю.В., Ищенко А.А., Пилипенко А.В. БОЛЬШИЕ ДАННЫЕ В СИСТЕМЕ ОБРАЗОВАНИЯ // Международный студенческий научный вестник. – 2019. – № 5-1.;
URL: http://eduherald.ru/ru/article/view?id=19731 (дата обращения: 03.04.2020).

Источник: https://eduherald.ru/ru/article/view?id=19731

Ученые-политологи МПГУ опубликовали исследования в сфере анализа больших данных

Ученые расскажут о применении больших данных - Студенческий портал

Ученые кафедры социально-политических исследований и технологий опубликовали материалы пятилетних исследований в сфере анализа больших данных в журнале из наукометрической базы Scopus.

На днях вышел свежий номер журнала «Мониторинг общественного мнения: Экономические и социальные перемены», включенного в Scopus, со статьей Елены Викторовны Бродовской, доктора политических наук, зав.

кафедрой социально-политических исследований и технологий Института истории и политики МПГУ, Анны Юрьевны Домбровской, доктора социологических наук, доцента этой же кафедры, Дмитрия Николаевича Карзубова, аспиранта кафедры, и Алексея Викторовича Синякова, заведующего социологической лабораторией МГУ им. И.В. Ломоносова, посвященной методам автоматизированного анализа Интернет-контента.

Выходные данные:

Бродовская Е.В., Домбровская А.Ю., Карзубов Д.Н., Синяков А.В. Развитие методологии и методики интеллектуального поиска цифровых маркеров политических процессов в социальных медиа // Мониторинг общественного мнения: Экономические и социальные перемены. 2017. № 5. С. 79—104. DOI: 10.14515/monitoring.2017.5.06

Статья доступна по ссылке

Это весьма ожидаемое событие в сферах политических и социологических исследований, поскольку впервые обобщен опыт применения методов Data Mining и Social Computing в анализе политических процессов.

Пятилетний опыт исследовательского коллектива под руководством Е.В.

 Бродовской позволил детально описать все основные возможности интеллектуального поиска цифровых маркеров политических процессов с помощью специальных инструментов (онлайн сервисов для мониторинга социальных медиа).

Главный фокус публикации – приёмы автоматизированного извлечения данных из неструктурированных, хаотичных и существенных по объему информационных потоков в глобаль­ной сети для анализа и прогнозиро­вания политических протестов и их динамики.

Важное прикладное значение методы социаль­ного компьютинга имеют для оценки рисков и возмож­ностей противостояния технологиям мобилизации протестных установок в современной России и в странах постсоветского пространства.

Особое внимание авторами уделено сравнительному анализу особенностей формирования в социальных медиа массового политического протеста в современной России и его сравне­ние с кейсами Украины и Молдовы. В результате такого компаративного исследования устанавливаются цифровые маркеры протестной активности, по которым можно прогнозировать повышение протестной активности населения.

Эвристическая ценность данной научной публикации состоит также и в том, что в ней представлены результаты  методологического экс­перимента, состоящего в сочетании различных методик сбора и анализа информации: опросных и контент-аналитических, онлайно­вых и оффлайновых, количествен­ных и качественных, традиционных и методов Big Data.

Данные этого эксперимента позволили авторам сделать ряд методических выводов и реко­мендаций относительно применения интеллектуального поиска маркеров политических процессов по цифровым следам и разработки методологии диагностики, сценирования и прогно­зирования региональных, общегосу­дарственных социально-политических процессов по цифровым маркерам.

Существенным стимулом развития научного коллектива под руководством Е.В. Бродовской стало членство в Мировом Интернет-проекте – международном объединении более 30 национальных научных коллективов, исследующих Интернет-коммуникацию по единой методологии.

Важным подспорьем перспективных направлений работы российской команды служит и грантовая поддержка ее работы. Вслед за уже успешно завершенным проектом «Методология интеллектуального поиска маркеров в Интернет-контенте»: грант РФФИ (код гранта 01201451097 на 2014 – 2016 гг.

) коллектив получил грантовую поддержку того же фонда в проведении исследования на тему «Межнациональное и межрелигиозное согласие в студенческой среде Крыма и Севастополя: мониторинг и анализ уровня развития»: грант Фонда РФФИ на 2017 – 2019 годы.

Читайте также:  Получить 90 млн рублей на исследование - студенческий портал

 Этот проект объединил в себе задачи, которые коллектив решал в рамках исследований, касающихся интеграционных процессов, связанных с воссоединением Крыма и России («Образ России в представлениях студенческой молодежи Крыма»: заказ Администрации Президента РФ по Государственному контракту от 20 августа 2015 года № УД-1059д; «Интеграция школьников Крыма в социокультурное пространство России»: грант Института социально-экономических и политических исследований (№ Г-232-3/15 от 20 января 2016 г.); «Образ России в представлениях преподавателей социальных и гуманитарных наук вузов Крыма»: грант Института социально-экономических и политических исследований (№ Г-224-3/15 от 20 января 2016 г.) и поиска цифровых маркеров степени ресоциализированности крымчан.

В рамках выполнения данных проектов коллектив осуществил ряд научно-исследовательских экспедиций в Крым и Севастополь для проведения комплексных прикладных исследований. Глубокое понимание интеграционных и ресоциализационных процессов стало возможным благодаря разработанному коллективом авторскому программному обеспечению:

  • браузерный классификатор – приложение к Интернет-сервису мониторинга социальных сетей IQBuzz. Приложение на основании выгрузки данных сервиса IQBuzz и в соответствии с требованиями пользователя производит кластеризацию документов по заданным параметрам. Результатом работы приложения является сегментирование массива данных на кластеры и отображение последних в виде списка с указанием количества документов в каждом, браузерный классификатор автоматизирует часть работы по обработке, параметризации и классификации импортированного из социальных медиа Интернет-контента;
  • программа, позволяющая осуществлять построение и анализ социальных графов. Ее назначение состоит в определении интегрированности участников и выявления плотности социальных связей между онлайн-сообществами.

Перед научным коллективом кафедры социально-политических исследований и технологий стоит целый ряд актуальных задач, связанных с поиском цифровых маркеров межнациональных отношений в Крыму и Севастополе. По результатам данного исследования запланирована новая публикация в журнале «Мониторинг общественного мнения: Экономические и социальные перемены».

Институт истории и политики

Источник: http://mpgu.su/novosti/uchenyie-politologi-mpgu-opublikovali-issledovaniya-v-sfere-analiza-bolshih-dannyih/

5 способов применить Big Data в образовании

Ученые расскажут о применении больших данных - Студенческий портал

В сфере образования выделяются пять основных типов данных:

  • персональные данные;
  • данные о взаимодействии студентов с электронными системами обучения (электронными учебниками, онлайн-курсами);
  • данные об эффективности учебных материалов;
  • административные (общесистемные) данные;
  • прогнозные данные.

Мы попробовали найти примеры того, как данные разного типа используются в учебных заведениях, и узнали, чем это помогает образованию.

Большие данные и экономия

По статистике, в США ежегодно отчисляются 400 000 студентов. Многие студенты берут на обучение кредиты, и отчисление для них – это не только большой риск невыплаты долга, но и ухудшение всей кредитной истории.

Отток студентов также негативно влияет и на сами учебные заведения: чем больше отток, тем меньше прибыль и государственная финансовая поддержка.

Помимо экономического фактора, процент переход первокурсников на следующий курс влияет на позиции колледжа в национальных рейтингах.

Для решения проблемы Университет Содружества Виргинии совместно с исследовательской компанией Education Advisory Board провели исследование, позволившее выявить студентов в группе риска и помочь им. Студенты, которые стали пропускать занятия или получать плохие оценки, покидали учебное заведение чаще всего.

Для университета была создана платформа, которая агрегирует все оценки студентов и находит проблемы. С ними сотрудники могут работать индивидуально – например, предложить студенту репетитора или другую помощь.

В течение одного семестра количество студентов, закончивших курс, увеличилось на 16%, а количество студентов, перешедших на следующий курс обучения – на 8 процентов.

Государственный университет Болл в Индиане использует большие данные, чтобы анализировать участие студентов в разнообразных мероприятиях кампуса. Этот параметр считается ключевым с точки зрения успехов в учебе.

Университет отслеживает частоту посещения кампуса и различных мероприятий с помощью идентификационных карт: если вовлеченность студента снижается, то сотрудники университета выявляют причину и могут предложить помощь.

Персонализация обучения

Одна из популярных стратегий персонализации обучения – предложить дополнительный онлайн-курс отстающему студенту. По мере того как учащийся будет отвечать на вопросы, платформа сможет предсказать его готовность к новым темам.

Например, Аризонский технологический университет нуждался в разработке нового курса по математике, так как студентам приходилось готовиться к экзамену целый год.

После использования дополнительных курсов на базе платформы Knewton около половины студентов смогли сдать экзамен как минимум на месяц раньше.

Еще одна сфера применения больших данных – прогнозное моделирование. Американские колледжи и университеты сами направляют письма-обращения будущим студентам, приглашая поступить в то или иное учебное заведение.

Каждый вуз стремится пригласить наиболее перспективных студентов, которые наверняка поступят.

Чтобы облегчить работу приемной комиссии, аналитики из компании ForecastPlus собрали и проанализировали несколько типов данных студентов: этническая принадлежность, успеваемость по ряду предметов, выпускные работы, оценки.

Прогнозное моделирование ForecastPlus доказало свою эффективность более чем в ста кампусах США. Так, Университет Крейтон в штате Небраска смог исключить 35000 не самых перспективных студентов и не направлять им письма, что позволило сэкономить более 30 тысяч долларов.

Повышение качества преподавания

Всё больше учебных заведений начинают использовать технологии, производя огромный поток данных. В начальной школе Рузвельта недалеко от Сан-Франциско учителя используют программу DIBELS с заданиями по чтению, помогающую выявить отстающих учеников и предложить им помощь.

Это позволяет учителю быстро подготовить и адаптировать свои уроки к потребностям школьников. Оценка качества преподавания с помощью тестов не может быть по-настоящему эффективной: в итоге учителя просто натаскивают учеников на задания определенного типа.

Анализируя данные об учебном процессе, администрация школы может лучше оценить учителей и, при необходимости, внести изменения.

Выбор будущей профессии

В шести технологических вузах Южной Каролины работает программа по получению новой профессии SC ACCELERATE, ориентированная на людей старше 25 лет и ветеранов. Анализ данных позволяет участникам выбрать образование и карьеру, наиболее соответствующие их опыту и личным качествам.

Программа CareerChoice GPS проводит прогностический анализ и помогает определиться с выбором карьеры: сервис изучает черты характера учащегося, его успехи в обучении, опыт предыдущей работы. Абитуриенты подают заявления в самые подходящие вузы – и последние от этого выигрывают.

Для работодателей это также выгодно: они получают специалистов, уже подготовленных к работе.

Виртуальный кампус

В России только начинается использование больших данных в образовании. К сожалению, реализованных инициатив пока совсем немного. Мы решили остановиться на интересном научном проекте, придуманном группой студентов ГУУ.

Авторы предлагают разработать идентификационную карту студента, которая объединит ряд функций: проездной и студенческий билет, зачетная книжка и пропуск на территорию. С помощью карты можно будет собирать данные о времени и месте нахождения студента в кампусе.

Создав личный кабинет, студенты будут отлеживать успеваемость, общаться с преподавателями, узнавать расписание занятий и изучать университетский каталог. Все эти сервисы позволят собирать и обрабатывать данные, чтобы генерировать дальнейшие рекомендации по улучшению опыта обучения.

Михаил Левиев

Источник: http://www.edutainme.ru/post/big-data-edu/

Большие данные

Сегодня во всем мире наблюдается всплеск интереса к технологиям класса BIG DATA.

Это связано с постоянным ростом объемов данных, которыми приходится оперировать и которые приходится контролировать крупным компаниям.

Накопленная информация для многих организаций является важным активом, однако обрабатывать ее и извлекать из нее пользу с каждым днем становится все сложнее и дороже.

Под терминами «Big Data» или «Большие данные» скрывается огромный набор информации. Причем объем ее столь велик, что обработка больших объемов данных стандартными программными и аппаратными средствами представляется крайне сложной.

Не менее остро стоит и проблема хранения гигантских объемов данных. Наиболее яркий пример больших данных – это информация, поступающая с различных физических экспериментальных установок, – например, с Большого адронного коллайдера.

На базе Томского политехнического университета функционирует Лаборатория обработки и анализа больших данных (Big Data Analytics and Technologies Laboratory).

Ученые поставили перед собой задачу за два года разработать систему хранения больших объемов информации, которую опробуют в экспериментах ЦЕРНа (Европейского центра ядерных исследований) – система позволит за секунды получать ту информацию, на которую раньше уходили часы и сутки.

Курирует работу новой современной лаборатории Алексей Климентов – ведущий мировой специалист в области современных методов сбора, хранения, обработки и анализа данных для экспериментов и установок мегасайнс класса, глава исследовательской группы по физическому программному обеспечению Национальной лаборатории Брукхэвен (США).

В ЦЕРНе, в крупном эксперименте «АТЛАС», он координирует вопросы обработки полученных данных и разработки, связанные с суперкомпьютерами. Во время визита в ТПУ представители ЦЕРНа провели собеседования со студентами вуза, и лучшие студенты смогли отправиться на стажировку в центр.

По словам специалиста кафедры прикладной математики Института кибернетики ТПУ, стажера в IT-департаменте проекта «АТЛАС» Валерия Парубца, в рамках работы в эксперименте ATLAS задачами политехника стали анализ и хранение данных большого объема (Big Data).

Он отмечает, что Big Data является на сегодняшний день ключевым направлением развития информационных технологий. Это серия подходов, инструментов и методов обработки структурированных и неструктурированных данных огромных объемов. И эти объемы с каждым годом увеличиваются в разы.

Классические методы обработки, которые работали пять-десять лет назад, с таким потоком информации справляться уже не в состоянии, и сегодня специалисты в области IT ищут новые методы. Для решения этой глобальной задачи ЦЕРН является наилучшим местом.

На сегодня там с разными задачами находятся около десятка политехников.

Существенная часть столкновений частиц науке известна, и физикам важно запечатлеть необычные столкновения, подтверждающие ту или иную гипотезу. Это примерно 1 % от общего объема данных, получаемых с коллайдера.Однако даже этот процент очень велик.

Проводятся все новые эксперименты, в систему поступают все новые данные. Чтобы обработать всю собранную на сегодняшний день информацию, по примерным подсчетам ученым потребуется 100 лет, а то и больше, непрерывных вычислений на нынешних мощностях.

Поэтому очень важно придумать, как оптимизировать все необходимые подсчеты. Именно это и является задачей стажеров Томского политеха в рамках участия в эксперименте ATLAS – работа над анализом и хранением данных большого объема (Big Data).

Пока же собранная с Большого адронного коллайдера информация «дожидается» обработки, эти массивы данных требуют сохранения. Ученым ЦЕРНа удалось решить задачу, разработав систему Grid (LHC Computing Grid). Это глобальная вычислительная сеть ЦЕРНа, место расположения которой – весь мир.

В состав Grid входит 170 вычислительных центров из 36 стран. Они непрерывно получают, сохраняют и обрабатывают информацию из ЦЕРНа.«Моя задача состоит как раз в том, чтобы доработать систему распределения данных. Проработать алгоритмы: куда и что следует отправлять.

Большинство работников ЦЕРНа в итоге ничего и не заметит. Однако это избавит людей, которые занимаются хранением информации, от постоянных консультаций с экспертами о порядке приема этих данных, – рассказывает о своей работе Валерий Парубец.

– С точки зрения «айтишника», это очень интересная задача, приходится оперировать колоссальными объемами информации, которая растекается по всему миру».

В дальнейшем полученный опыт работы политехник использует в своей научной работе по возвращении в Томский политехнический университет, где участники проекта «АТЛАС» продолжают удаленную работу с центром. Они будут работать в Лаборатории обработки и анализа больших объемов данных при центре RASA в Томск.

Во время работы школы все желающие смогли посетить выступления ученых, лекции и семинары. Ученые рассказали о применении нейронных сетей в индустриальной кибербезопасности, о методах поиска астероидов на околоземных орбитах, машинном обучении и работе с данными на Большом адронном коллайдере.

В будущем технологии Big Data позволят работать с еще большим объемом информации, и ученые надеются, что это позволит улучшить качество жизни людей, изменить транспортные условия, повысить точность прогнозов погоды и так далее.

Источник: https://tpu.ru/research/fields/big_data

Молодые ученые Вышки расскажут о машинном обучении и больших данных

В рамках проекта «Университет, открытый городу: лекции молодых ученых Вышки в Культурном центре ЗИЛ» НИУ ВШЭ организует цикл лекций по Data Culture. Первая из них состоится 29 ноября.

Навыки работы с компьютерными технологиями и большими данными постепенно становятся необходимы не только для IT-специалистов и статистиков, но для любого образованного человека.

«Если раньше мы могли говорить, что существуют отдельно специалисты по Computer Science и по информационным технологиям, и отдельно — гуманитарии, то сейчас происходит тесное переплетение их профессиональной деятельности, — говорил в одном из своих интервью проректор ВШЭ Сергей Рощин . — Тексты, с которыми работают специалисты в гуманитарных областях, — это тоже большие данные, которые точно так же можно обрабатывать с помощью современных аналитических и информационных методов, и это принципиально меняет суть профессии».

Осознавая это, Вышка уже начала включать курсы по работе с данными в учебные планы на самых разных образовательных программах, а в 2018 году они появятся на всех программах.

Теперь проект Data Culture выходит на более широкую аудиторию.

29 ноября в Культурном центре ЗИЛ стартует цикл открытых лекций «Data culture: машинное обучение и цифровая трансформация», которые будут читать молодые ученые университета.

В рамках цикла запланированы три лекции.

Первую из них, на тему «Машинное обучение, автоматизация и новые профессии» , прочитает заместитель руководителя Департамента больших данных и информационного поиска факультета компьютерных наук ВШЭ Евгений Соколов .

Он расскажет о том, какие задачи машинное обучение позволяет автоматизировать, как это влияет на требования к специалистам, какие профессии могут исчезнуть, а какие уже сейчас начинают появляться.

Вторую лекцию, «Машинное обучение как услуга для бизнеса» , проведет 6 декабря преподаватель факультета компьютерных наук ВШЭ, руководитель проектного офиса Yandex Data Factory Александр Белугин. Он объяснит, как и для чего можно использовать искусственный интеллект в самых разных сферах бизнеса и на разных предприятиях — от оказания услуг до заводского производства.

Автор третьей лекции, старший преподаватель факультета компьютерных наук ВШЭ Андрей Зимовнов , расскажет о современных способах применения глубинных нейронных сетей, например, для анализа текста, звука, изображений и видео. Эта лекция запланирована на 20 декабря.

Слушатели, посетившие все лекции цикла, смогут получить соответствующий сертификат.

Лекции состоятся в Культурном центре ЗИЛ по адресу: г. Москва, ул. Восточная, д. 4, корп. 1 (ст. м. «Автозаводская»). Приглашаются все желающие, но не забудьте пройти электронную регистрацию.

Проект «Университет, открытый городу: лекции молодых ученых Вышки в Культурном центре ЗИЛ» дает возможность познакомиться с открытиями и разработками успешных молодых исследователей университета. Расписание ближайших лекций можно узнать на сайте проекта  . Данный материал опубликован на сайте BezFormata 11 января 2019 года,ниже указана дата, когда материал был опубликован на сайте первоисточника!

Источник: https://Moskva.BezFormata.com/listnews/molodie-uchenie-vishki-rasskazhut/62473192/

Ссылка на основную публикацию